Hallo erstmal!
Mein Problem ist folgendes: Ich hatte die Idee ein Programm zu schreiben, welches einen einzugebenden Begriff "googelt", und Begriffe findet die in den gefundenen urls häufig vorkommen, und diese erneut sucht, usw. Das Programm, hätte also den Zweck einen "Wörterbaum" zu erstellen, den man dann für z.B. eine Mindmap verwenden kann.
Gescheitert bin ich dann beim suchen mit Google, denn im mit urllib herunterladbaren Seitenquelltext sind die Ergebnisse nicht zu finden. Es scheint so, als würden diese mit AJAX übertragen werden. Die Preisfrage ist jetzt: Wie komme ich daran? Habe ich überhaupt eine Chance daran zu kommen oder kann ich das vergessen? Und ist das überhaupt Legal Google mit einem Programm zu nutzen?
Achso, um das vorwegzunehmen: Google hat mir auch nicht geholfen. Es gab mal was von Google, das gibt's nicht mehr.
Vielen Dank im Voraus
Captain Normalo
off topic: Juhu, mein erster Post *freu*
Mein Programm Googlen lassen
- cofi
- Python-Forum Veteran
- Beiträge: 4432
- Registriert: Sonntag 30. März 2008, 04:16
- Wohnort: RGFybXN0YWR0
Nein, siehe Punkt 4 der Terms of Service: http://www.google.com/accounts/TOS?hl=de&loc=DECaptain Normalo hat geschrieben:Und ist das überhaupt Legal Google mit einem Programm zu nutzen?
Aber zu deiner Frage: Die Infos sind im Code der Seite.
Michael Markert ❖ PEP 8 Übersetzung ❖ Tutorial Übersetzung (3.x) ⇒ Online-Version (Python 3.3) ❖ Deutscher Python-Insider ❖ Projekte
-
- User
- Beiträge: 2
- Registriert: Montag 28. Februar 2011, 19:59
Wie kann das angehen? Wenn ich in der Python-Kommandozeile(?) tippe:cofi hat geschrieben:Aber zu deiner Frage: Die Infos sind im Code der Seite.
Code: Alles auswählen
f = urllib.urlopen("http://www.google.de/#hl=de&q=narbacular&aq=f&aqi=g2&aql=&oq=&fp=aca1093092ccd403")
f.readlines()
Aber eigentlich ist das ja eh egal, denn wenn mein Skript unheimlich schnell "googeln" würde, würde ja meine IP geblockt werden, sofern ich das richtig verstanden habe.
Trotzdem: Danke
- cofi
- Python-Forum Veteran
- Beiträge: 4432
- Registriert: Sonntag 30. März 2008, 04:16
- Wohnort: RGFybXN0YWR0
Nein, ein einziges Mal fällt auch unterCaptain Normalo hat geschrieben:Aber eigentlich ist das ja eh egal, denn wenn mein Skript unheimlich schnell "googeln" würde, würde ja meine IP geblockt werden, sofern ich das richtig verstanden habe.
Hmm ok ich hatte mir die Seite im Firefox angeschaut, scheinbar wurde das Javascript dort auch ausgewertet auch wenn es eigentlich aus warGoogles TOS hat geschrieben:Es ist Ihnen untersagt, auf die Dienste in automatisierter Weise zuzugreifen, beispielsweise mit Robots oder Skripts.
Michael Markert ❖ PEP 8 Übersetzung ❖ Tutorial Übersetzung (3.x) ⇒ Online-Version (Python 3.3) ❖ Deutscher Python-Insider ❖ Projekte
Aber Meta-Suchmaschinen wie zum Beispiel Meta-ger, machen doch das selbe wenn sie den Begriff des Nutzers in andere Suchmaschinen automatisch eintragen und die Ergebnisse verschiedener Seiten auswerten.
@Lasse: Die werden vorher die Erlaubnis von Google eingeholt haben. Und wahrscheinlich werden die auch eine API benutzen und nicht den HTML-Quelltext vom Suchergebnis parsen.
-
- User
- Beiträge: 1
- Registriert: Montag 15. November 2010, 13:44
Bei einigen user_agent's gibt google eine Fehlermeldung zurück. Der Standart Agent von Python gehört dazu. Wenn du also z.B. einfach den UserAgent
'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.7) Gecko/2009021910 Firefox/3.0.7'
zum Request hinzufügst, bekommste du auch die richtige Antwort.
'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.7) Gecko/2009021910 Firefox/3.0.7'
zum Request hinzufügst, bekommste du auch die richtige Antwort.
Ich will nicht wissen gegen wie viele "Richtlinien" Google verstößt, außerdem, wieso sollte Google jemanden wegen sowas verklagen? Die Merken doch nicht mal ob da ein Browser oder ein anderes Programm darauf zugreift.Leonidas hat geschrieben:Verstößt aber immer noch gegen die Google-Richtlinien…
Technik ist: wenn alles funktioniert und keiner weiß warum.
Wer Rechtschreibfehler findet darf sie behalten.
Wer Rechtschreibfehler findet darf sie behalten.
@Py-Prog: Nur weil jemand anderes sich gegen die Wünsche von anderen hinweg setzt, ist es nicht okay das auch zu tun.
Google verklagt da niemanden sondern sperrt einfach IPs wenn's zu bunt wird. Da sehr viele Leute mit dynamisch zugewiesenen IPs im Netz unterwegs sind, kann so eine IP-Sperre auch andere treffen als den, der sie sich "verdient" hat.
Google verklagt da niemanden sondern sperrt einfach IPs wenn's zu bunt wird. Da sehr viele Leute mit dynamisch zugewiesenen IPs im Netz unterwegs sind, kann so eine IP-Sperre auch andere treffen als den, der sie sich "verdient" hat.
Ich muss dir zustimmen dass so ein Verhalten Kindisch ist aber ...BlackJack hat geschrieben:@Py-Prog: Nur weil jemand anderes sich gegen die Wünsche von anderen hinweg setzt, ist es nicht okay das auch zu tun.
Technik ist: wenn alles funktioniert und keiner weiß warum.
Wer Rechtschreibfehler findet darf sie behalten.
Wer Rechtschreibfehler findet darf sie behalten.