Automatisierung zwischen Excel und Google

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
Andrew
User
Beiträge: 1
Registriert: Donnerstag 27. Oktober 2016, 11:14

Hi zusammen,

ich bin noch ziemlich neu in der gesamten Python-Materie und hoffe auf Eure wertvollen Gedanken.

Ist es möglich, eine Automatisierung von Suchabfragen bei Google aus einem Excel-Dokument (oder vergleichbar) durchzuführen? Falls ja, wie stelle ich das mit ganz einfachen Mitteln an?

Mein Anwendungsbeispiel ist das Gewinnen von Informationen im Marketing-Umfeld. Beispielsweise Habe ich in der ersten Spalte die Namen von Kinos in München stehen und möchte jetzt sehr schnell die Website-URL herausfinden und in die zweite Spalte schreiben.

Vorab bereits vielen Dank
BlackJack

@Andrew: Daten aus Exceltabellen lesen/schreiben geht: http://www.python-excel.org/

Google bietet für so ziemlich alles eine API, da musst Du einfach mal im Entwicklerbereich suchen.

Allerdings weiss ich nicht wie gut das bei so allgemeinen Sachen funktioniert, also wie Du zum Beispiel den Suchtreffer identifizieren willst, der genau zu dem Kino passt.

Bei dem Beispiel würde man eher den umgekehrten Weg gehen: Nicht von einer Liste mit Kinonamen in München ausgehend, sondern man sucht sich eine Webseite mit den Kinos in München und ”scraped” sich dort die Informationen heraus. Beispielsweise http://kino.muenchen.de/kinos-muenchen.html von wo man sich die URL zur Unterseite jedes Kinos in dem Portal holen kann, und auf den jeweiligen Unterseiten steht dann auch die URL zur Webseite des jeweiligen Kinos. Alternative die auch andere Städte hat: http://www.kino.de/kinoprogramm/stadt/muenchen/ Wobei man immer auch auf die Nutzungsbedingungen achten sollte, die in der Regel automatisierte Abfragen untersagen. Bei der letzten URL zum Beispiel „4. e) Keine unzulässige Nutzung der Services“ in der AGB.

Brauchbare Packages für das abfragen und auswerten von Webseiten sind `requests`, und `lxml.html` und/oder BeautifulSoup 4.
Antworten