-
Notifications
You must be signed in to change notification settings - Fork 0
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
MVG-Rad Dumps: Datensätz besser verarbeitbar machen #13
Comments
Skript zum Diff Download vom neuen (März 2017) API Endpoint:
|
Es stellt sich heraus das die Dateien unter https://transit.robbi5.com/mvg-networkstate-mvgrad/ (full dump, alle 5 Minuten) und https://transit.robbi5.com/mvg-networkstate-mvgrad-diff/ (diff dumps zur vorherigen Datei, alle 5 Minuten – erstellt mit dem Skript aus dem vorherigen Kommentar) jeweils ca. 350kb gross. Die Analyse durch Dennis ergab des es sich dabei hautsächlich um Rauschen bei den Koordinaten ohne Zustandsänderung und dadurch auch sich ändernden Timestamps. |
Nachtrag:
Hab mir das grade vorhin nochmal an einem Beispiel angeschaut – es ändert sich da teilweise auch nur der updated timestamp und nicht mal die Koordinaten: grep -oh -E '{"id":"96808.+?}' *.json | jq -scr '.[] | [.updated, .latitude, .longitude]'
[1497206668000, 48.14973068237305, 11.578146934509277]
[1497209968000, 48.14973068237305, 11.578146934509277]
[1497210268000, 48.14973068237305, 11.578146934509277]
[1497210569000, 48.14973068237305, 11.578146934509277]
[1497212367000, 48.14973068237305, 11.578146934509277]
[1497213567000, 48.14973068237305, 11.578146934509277]
[1497214467000, 48.14973068237305, 11.578146934509277]
[1497215070000, 48.14973068237305, 11.578146934509277]
[1497215667000, 48.14973068237305, 11.578146934509277]
[1497215970000, 48.14973068237305, 11.578146934509277]
[1497206668000, 48.14973068237305, 11.578146934509277]
[1497209968000, 48.14973068237305, 11.578146934509277]
[1497210268000, 48.14973068237305, 11.578146934509277]
[1497210569000, 48.14973068237305, 11.578146934509277]
[1497212367000, 48.14973068237305, 11.578146934509277]
[1497213567000, 48.14973068237305, 11.578146934509277]
[1497214467000, 48.14973068237305, 11.578146934509277]
[1497215070000, 48.14973068237305, 11.578146934509277]
[1497215667000, 48.14973068237305, 11.578146934509277]
[1497215970000, 48.14973068237305, 11.578146934509277] |
ich hab das laden mal in ein python gepackt: https://gist.github.com/deknos/e4563da7ef22004539ed10736fa6233a ich glaub, man kommt nicht drum rum, die räder selbst zu verzeichnen und dann nur eintragsänderungen zu verzeichnen, die kein rauschen sind. |
Projekte wie https://github.com/codeformunich/bikewatch beim TUM Hackaton (November 2016) oder verschiedene Projekte beim Open Data Day (Februar 2017) haben gezeigt, dass die Rad Daten 'aktuell' etwas schwer verarbeitbar sind als es eigentlich sein müsste, vgl. https://transit.robbi5.com/nextbike-mvgrad/
Allerdings wurde dieser Endpoint inzwischen eingestellt, Dumps des neuen Endpoints liegen unter https://transit.robbi5.com/mvg-networkstate-mvgrad/ – Zitat von dort:
Die Daten dieses neuen Endpoints sind schon wesentlich sinnvoller als bisher. Es werden nicht mehr nur die Stationen sondern wirklich die einzelnen Fahrräder abgebildet.
bei
addedBikes
gibt es die folgenden Typen:TODOs
The text was updated successfully, but these errors were encountered: