Hallo community,
ich bin zwar noch bei den Basics würde mich evtl. aber gern an folgender Aufgabe versuchen:
Eine Excel-Liste enthält u.a. Spalten für Straßen und Städte, welche aber Tippfehler enthalten können. Ich würde diese Tippfehler gerne finden, indem die Liste auf google maps o.ä. geprüft wird.
Fragen dazu:
1. Wie schätzt ihr die Kenntnisse ein, die es für diese Aufgabe benötigt? Ist das machbar, wenn ich noch Anfänger bin? (Zur Einschätzung: bei adventofcode habe ich mal die ersten 5 oder 6 Tage geschafft).
2. In welche Stichwörter müsste ich mich für die Aufgabe einlesen?
Vielen Dank und viele Grüße
Stefan
Adressen auf Existenz prüfen
Grundsätzlich: Versuche das Problem in kleinere Teile aufzutrennen und diese einzeln zu lösen.
Kannst du schon eine Liste per Programm auslesen und einzeln abarbeiten?
Müssen die Daten in Excel bleiben oder kannst du die vorab umziehen, wo man sie leichter erreichen kann?
Kannst du schon eine Adresse bei Google Maps osä. prüfen lassen? Manuell? Per Programm?
usw. Sollte mit ein bisschen Recherche machbar sein.
Später kannst du die Lösungen dann zusammen stöpseln.
Ist das ganze eine einmalige Aufgabe, oder soll das bald regelmäßig funktionieren?
Bei Fragen zu einzelnen Themen kannst du hier gerne deine Ansätze vorstellen und nachfragen.
Kannst du schon eine Liste per Programm auslesen und einzeln abarbeiten?
Müssen die Daten in Excel bleiben oder kannst du die vorab umziehen, wo man sie leichter erreichen kann?
Kannst du schon eine Adresse bei Google Maps osä. prüfen lassen? Manuell? Per Programm?
usw. Sollte mit ein bisschen Recherche machbar sein.
Später kannst du die Lösungen dann zusammen stöpseln.
Ist das ganze eine einmalige Aufgabe, oder soll das bald regelmäßig funktionieren?
Bei Fragen zu einzelnen Themen kannst du hier gerne deine Ansätze vorstellen und nachfragen.
MorgenGrauen: 1 Welt, 8 Rassen, 13 Gilden, >250 Abenteuer, >5000 Waffen & Rüstungen,
>7000 NPC, >16000 Räume, >200 freiwillige Programmierer, nur Text, viel Spaß, seit 1992.
>7000 NPC, >16000 Räume, >200 freiwillige Programmierer, nur Text, viel Spaß, seit 1992.
- __blackjack__
- User
- Beiträge: 14069
- Registriert: Samstag 2. Juni 2018, 10:21
- Wohnort: 127.0.0.1
- Kontaktdaten:
@steveO_O: Kenntnisse einschätzen ist immer so eine Sache. Ich würde bei dieser Aufgabe sagen, dass die auch in gewisser Weise offen ist, weil da ja erst einmal Recherche rein fliessen muss ob es überhaupt geeignete Daten/APIs öffentlich zugänglich gibt. Und die Aufgabe selber ist auch etwas unterspezifiziert, denn im Betreff steht etwas ganz anderes als im Beitrag. Adressen auf Existenz prüfen könnte sich als unmöglich heraus stellen. Je nach dem was man als „Adresse“ und als „Existenz“ definiert.
Lesestoff zu Adressen: Falsehoods programmers believe about addresses.
Allerdings möchte ich Dich da auch nicht komplett entmutigen. Selbst wenn es am Ende nicht ganz so klappt wie gedacht, ist das sicher ein Projekt bei dem man was lernen kann. Recherche nach Datenquellen und APIs, benutzen selbiger, und ein Gefühl dafür bekommen wie viel und wie weit da automatisierbar ist, und wo die Grenzen liegen.
Lesestoff zu Adressen: Falsehoods programmers believe about addresses.
Allerdings möchte ich Dich da auch nicht komplett entmutigen. Selbst wenn es am Ende nicht ganz so klappt wie gedacht, ist das sicher ein Projekt bei dem man was lernen kann. Recherche nach Datenquellen und APIs, benutzen selbiger, und ein Gefühl dafür bekommen wie viel und wie weit da automatisierbar ist, und wo die Grenzen liegen.
“Vir, intelligence has nothing to do with politics!” — Londo Mollari
Hi ihr beiden,
vielen Dank für die Rückmeldungen! Damit habt ihr mir schon mal die Illusion genommen, dass das ganze mit ein wenig Recherche ohne großen Aufwand programmiert werden kann
. Muss dann mal abwägen, ob sich der Aufwand lohnt bzw. ich es zeitlich schaffe. Lust hätte ich schon drauf.
@Kebap: guter Hinweis es zu stückeln! Die Aufgabe ist wiederkehrend.
@Blackjack: Adresse = Straße + Hausnummer + PLZ + Stadt; Adresse existiert, falls google nicht folgendes rückmeldet: Du siehst Ergebnisse für "xyxxx Straße 44055". Stattdessen nach "yxxxx Straße 44055" suchen". Dein Link scheint sich doch sehr auf amerikanische Adresse zu konzentrieren. Ich hatte aber tatsächlich vergessen zu erwähnen, dass es ausschließlich um deutsche Adressen geht.
vielen Dank für die Rückmeldungen! Damit habt ihr mir schon mal die Illusion genommen, dass das ganze mit ein wenig Recherche ohne großen Aufwand programmiert werden kann

@Kebap: guter Hinweis es zu stückeln! Die Aufgabe ist wiederkehrend.
@Blackjack: Adresse = Straße + Hausnummer + PLZ + Stadt; Adresse existiert, falls google nicht folgendes rückmeldet: Du siehst Ergebnisse für "xyxxx Straße 44055". Stattdessen nach "yxxxx Straße 44055" suchen". Dein Link scheint sich doch sehr auf amerikanische Adresse zu konzentrieren. Ich hatte aber tatsächlich vergessen zu erwähnen, dass es ausschließlich um deutsche Adressen geht.
- __blackjack__
- User
- Beiträge: 14069
- Registriert: Samstag 2. Juni 2018, 10:21
- Wohnort: 127.0.0.1
- Kontaktdaten:
@steveO_O: Also der Autor ist Brite, aber die Beispiele sind international, weil dann ja auch einiges dabei ist was dann von Lesern an Beispielen gemeldet wurde.
An Grenzen kann man mit dem Verfahren beispielsweise sehr schnell geraten wenn Strasse, Hausnummer, und PLZ alles drei Zahlen sind. Da ist dann die Frage ob die einfache Google-Maps-Abfrage das richtig hinbekommt. Ich weiss nicht wie gut Google da mittlerweile ist, aber jenseits von Grossstädten waren die Karten und damit die Informationen auch mal echt schlecht. Das Strassennetz war okay, aber Häuser, Hausnummern, und Details waren wohl auch nicht ganz so wichtig.
Und das Ergebnis ist auch nie ein existiert oder existiert nicht, sondern immer ein existiert wahrscheinlich, und existiert wahrscheinlich nicht. Weil sich diese Information ja mit der Zeit ändern kann, und der Schnappschuss der Realität den Google oder welche Datenquelle auch immer hat, kann vor oder nach einer Veränderung gegenüber den zu prüfenden Daten haben. Das muss man entsprechend berücksichtigen, je nach dem welche Folgen diese automatisierte Entscheidung haben wird.
An Grenzen kann man mit dem Verfahren beispielsweise sehr schnell geraten wenn Strasse, Hausnummer, und PLZ alles drei Zahlen sind. Da ist dann die Frage ob die einfache Google-Maps-Abfrage das richtig hinbekommt. Ich weiss nicht wie gut Google da mittlerweile ist, aber jenseits von Grossstädten waren die Karten und damit die Informationen auch mal echt schlecht. Das Strassennetz war okay, aber Häuser, Hausnummern, und Details waren wohl auch nicht ganz so wichtig.
Und das Ergebnis ist auch nie ein existiert oder existiert nicht, sondern immer ein existiert wahrscheinlich, und existiert wahrscheinlich nicht. Weil sich diese Information ja mit der Zeit ändern kann, und der Schnappschuss der Realität den Google oder welche Datenquelle auch immer hat, kann vor oder nach einer Veränderung gegenüber den zu prüfenden Daten haben. Das muss man entsprechend berücksichtigen, je nach dem welche Folgen diese automatisierte Entscheidung haben wird.
“Vir, intelligence has nothing to do with politics!” — Londo Mollari
Von welchem Zeitraum sprichst du?__blackjack__ hat geschrieben: Freitag 11. November 2022, 15:01 Ich weiss nicht wie gut Google da mittlerweile ist, aber jenseits von Grossstädten waren die Karten und damit die Informationen auch mal echt schlecht. Das Strassennetz war okay, aber Häuser, Hausnummern, und Details waren wohl auch nicht ganz so wichtig.
Wird keine großen FOlgen haben. Es geht rein um die Vermeidung von Tippfehlern die unprofessionell aussehen.__blackjack__ hat geschrieben: Freitag 11. November 2022, 15:01
Und das Ergebnis ist auch nie ein existiert oder existiert nicht, sondern immer ein existiert wahrscheinlich, und existiert wahrscheinlich nicht. Weil sich diese Information ja mit der Zeit ändern kann, und der Schnappschuss der Realität den Google oder welche Datenquelle auch immer hat, kann vor oder nach einer Veränderung gegenüber den zu prüfenden Daten haben. Das muss man entsprechend berücksichtigen, je nach dem welche Folgen diese automatisierte Entscheidung haben wird.