suchmaschine programm in python

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Benutzeravatar
gerold
Python-Forum Veteran
Beiträge: 5555
Registriert: Samstag 28. Februar 2004, 22:04
Wohnort: Oberhofen im Inntal (Tirol)
Kontaktdaten:

Sr4l hat geschrieben:Ich finde bei einer solchen Aufgabe sollte man bei der Standard Library blieben.
Hallo Sr4l!

BeautifulSoup kann auch mit inkonsistentem HTML was anfangen. Mit "re" bist du da aufgeschmissen. Außerdem ist BeautifulSoup ein einzelnes Python-Modul. RE ist in meinen Augen eher eine schlechte Wahl für so etwas. Da es aber ein Beispiel zum Lernen sein soll, denke ich, ist es nicht schlecht, wenn man sich einmal mit RE beschäftigt. Im realen Leben --> BeautifulSoup.

mfg
Gerold
:-)
http://halvar.at | Kleiner Bascom AVR Kurs
Wissen hat eine wunderbare Eigenschaft: Es verdoppelt sich, wenn man es teilt.
Y0Gi
User
Beiträge: 1454
Registriert: Freitag 22. September 2006, 23:05
Wohnort: ja

Wo kämen wir da hin, wenn man sich möglichst auf die Standardlib beschränken würde? Wozu? Zumal eine Suchmaschine beim Betreiber und nicht beim Anwender betrieben wird, da sind die Voraussetzungen des Anwenders nur auf einen Web-Client festgelegt.

Auch im Rahmen der Vermittlung von Wissen und Praxis im Umgang mit einer Programmiersprache ist der Blick über den Tellerrand in jedem Fall wünschenswert und positiv.
Benutzeravatar
Sr4l
User
Beiträge: 1091
Registriert: Donnerstag 28. Dezember 2006, 20:02
Wohnort: Kassel
Kontaktdaten:

Wenn er Tkinter nutzt und es für die Schule macht wird es wohl keine Web Anwednung. Natürlich kann man auch B S einsetzen, ist mir egal :-)

Es gibt leider ein paar gute Librarys die nicht in Python Standard sind, B S finde ich gehört neben MySQLdb und PIL auch dazu.
Y0Gi
User
Beiträge: 1454
Registriert: Freitag 22. September 2006, 23:05
Wohnort: ja

Ohne erneut diese Diskussion anzetteln zu wollen: Tkinter ist unter Linux nicht Teil der Standardbibliothek. PIL ist in der Tat schon wünschenswert. Aber MySQLdb würde auch die anderen DB-Adapter implizieren und das kann es irgendwie auch nicht sein.

Hat eigentlich mal jemand PIL für Py3k vorgeschlagen? Da wird ja eh umfassend aufgeräumt und getauscht.
Benutzeravatar
Sr4l
User
Beiträge: 1091
Registriert: Donnerstag 28. Dezember 2006, 20:02
Wohnort: Kassel
Kontaktdaten:

Ok nur noch eine Antwort, keine Diskussion ;-)

Um genau zu sein sind ja die Pakete unter Linux nicht das Standard Python, wenn man Python aus dem Source erstellen würde wäre Tkinter dabei. Das Linux Distrubtionen einige Sachen ändern, ist mir bisher nicht negativ aufgefallen, da sich vieles allein durch Abhängigkeiten zu meinen Programmen installiert ;-)

MySQLdb gehört für mich dabei, weil sie eine der größten Datenbanken ist.
Man kann es immer nachinstallieren ist klar, wenn es aber immer dabei wäre, hätte man vll bessere Chancen das es auch bei Hosting Angeboten dabei zu haben.
alex
User
Beiträge: 5
Registriert: Sonntag 3. Juni 2007, 23:30
Wohnort: berlin

@ alle

ja jungs , ich hab eure voreschläge gelesen, nachdem ich auch viele über python gelesen habe , aber erlich weiß ich noch nicht , wie ich anfangen soll, und was ich tun soll,,ich hab vorher noch nie python programmiert....


also nach dieser informationen darüber, hat jamand ahnung , wie das programm gemacht werden konnte..

ich danke euch alle
Benutzeravatar
Sr4l
User
Beiträge: 1091
Registriert: Donnerstag 28. Dezember 2006, 20:02
Wohnort: Kassel
Kontaktdaten:

Wenn du garkeine Ahnung hast solltest du erstmal mit einem Tutorial anfangen. Das Tutorial, welches bei der offiziellen Python Dokumentation dabei ist sollte dir genügen vermitteln, um zu wissen wie du anfangen musst.

Wenn du Grundkenntnisse hast kannst du dir Code Beispiele zu ``urllib`` anschauen und einem XML Parser oder SQLite als Datenbank, damit solltest du es schaffen einen Suchprogramm zu programmieren.
Dannach kannst du dich mit Tkinter befassen um die gewünschte GUI Oberfläche zu schreiben.

http://docs.python.org
Antworten