Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Weitere Filtermöglichkeiten? #157

Open
CHesseling opened this issue Oct 29, 2024 · 4 comments
Open

Weitere Filtermöglichkeiten? #157

CHesseling opened this issue Oct 29, 2024 · 4 comments

Comments

@CHesseling
Copy link

CHesseling commented Oct 29, 2024

Vielen Dank für Eure Arbeit!

Es gibt teilweise Tabellen mit sehr großen Datenmengen (zB 51000-0014), bei denen es nett wäre, nach Monat zu filtern (also startyear usw aufzubohren) oder eine weitere Variable (wie Warennummer) als Filter hinzuzuziehen. Wenn ich https://destatis.api.bund.dev/ richtig lese gibt es bei get data/table Felder für classifyingvariable1. Ich weiß, dass ist bei jeder Statistik anders, aber gäbe es eventuell Möglichkeiten, das anzudenken?
Viele Grüße!

@pmayd
Copy link
Collaborator

pmayd commented Oct 29, 2024

Hallo Claus!

Schön, von dir zu lesen :)

Kannst du vielleicht ein konkretes Beispiel geben, was du dir vorstellst, das hilft uns am besten. Möchtest du diese Filterung bereits bei der Abfrage, also wenn du t.get_data() aufrufst? Das dürfte dann schwierig werden, weil wir ja nur das übergeben können, was Genesis in der API unterstützt. Wir könnten aber nachgelagert sehr wohl weitere Filter anbieten oder zB den Zeitstempel, also die Spalte für die Zeitangabe aufteilen in Monat und Jahr, so dass du dann selbst leicht danach filtern kannst. Das hieße dann zwar, dass alle Daten für das start und end Jahr heruntergeladen werden müssen, aber wir können danach eben zusätzliche Spalten und Informationen anbieten bzw einige Dinge erleichtern. Daher die Frage, ob du uns eine konkrete Anfrage bzw Filterung zeigen kannst, und wann genau du das machen möchtest

@CHesseling
Copy link
Author

Am besten wäre das Filtern schon vor dem Abruf, damit man nicht die Probleme mit zu großen Datenmengen bekommt - das ist bei den Import-/Export-Daten schnell der Fall.
Ich habe mal ein kleines Script für die destatis genesis API geschrieben. Da kann man mit

classifyingvariable2="MONAT",
classifyingkey2="MONAT01"

arbeiten und es sieht so aus, als würde das klappen. Damit könnte ich zB auch das Warenverzeichnis filtern, bevor ich die große Tabelle abrufe. Ist die Erklärung etwas verständlich? :)

@pmayd
Copy link
Collaborator

pmayd commented Oct 30, 2024

Achso, wenn diese Variablen schon existieren, natürlich, wir unterstützen ja bereits classifyingvariable, oder nicht? Mir war nicht bewusst, dass Monat Teil der Spalten ist, dann ist das ganz schnell implementiert. Ich schau mir deine Beispieltabelle genauer an!

@pmayd
Copy link
Collaborator

pmayd commented Dec 4, 2024

Wir haben eben die neue Version v0.4.0 veröffentlicht, die mit Genesis v5 Datenbank kompatibel ist, jetzt sind erstmal wieder die Tabellen von Genesis mit pystatis herunterladbar. Als nächstes schauen wir uns deinen Request an und veröffentlichen ein Minor-Update mit dem Parameter ;)

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants