möglichkeit für warscheinlichstes Suchergebnis
- Damaskus
- Administrator
- Beiträge: 995
- Registriert: Sonntag 6. März 2005, 20:08
- Wohnort: Schwabenländle
Also ich hab gestern mal mit SOUNDEX rumgespielt und die Ergebnisse waren schonmal nicht schlecht. Dazu jetzt noch ein paar Verknüpfungen und Filter mit einbauen und dann wirds für den Anfang reichen. Wie sich das dann bei Städten mit richtig vielen Straßen verhält muss ich halt mal ausprobieren.
Kann man nicht einen Spamfilter missbrauchen?
- von denen gibt es genug (auch mit python Anbindung)
- Doku / Beispiele sollten auch genug vorhanden sein
Ich hatte die Idee Bogofilter für ein (Web)Recherchetool zu verwenden.
cu Sebastian
- von denen gibt es genug (auch mit python Anbindung)
- Doku / Beispiele sollten auch genug vorhanden sein
Ich hatte die Idee Bogofilter für ein (Web)Recherchetool zu verwenden.
cu Sebastian
-
- User
- Beiträge: 670
- Registriert: Sonntag 15. Januar 2006, 18:42
- Wohnort: Celle
- Kontaktdaten:
Du sprichst jetzt sicherlich von einem bayesschen Filter, oder nicht? Bayes-Filter "erkennen" Kontext, kein Wort was falsch geschrieben ist. Die Anwendungsgebiete sind völlig andere (zumindest im Normalfall).
--- Heiko.
- Damaskus
- Administrator
- Beiträge: 995
- Registriert: Sonntag 6. März 2005, 20:08
- Wohnort: Schwabenländle
Da der Link zu dem Soundex Modul nicht mehr aktuell ist gibts hier einen Link zu einer compilierten Win32 Version.
www.python-forum.de/downloads/Levenshtein.pyd
Gruß
Damaskus
www.python-forum.de/downloads/Levenshtein.pyd
Gruß
Damaskus
-
- User
- Beiträge: 773
- Registriert: Mittwoch 5. November 2003, 18:06
- Wohnort: Schweiz
- Kontaktdaten:
Wie nicht mit Strassen versehen?jens hat geschrieben:Theoretisch geht das auch mit Google-Maps, allerdings ist Deutschland noch nicht mit Strassen versehen...
Also Strassenname sind drin und Routen planen ist doch auch möglich oder?
Gruss
PS: map.google.com hab ich nur in der Schweiz gebraucht, nicht Deutschland.
Manchmal ist es recht hilfreich, sich einmal näher anzuschauen, wann der Beitrag erstellt wurde.rayo hat geschrieben:Wie nicht mit Strassen versehen?
Also Strassenname sind drin und Routen planen ist doch auch möglich oder?
- Kai Borrmann
- User
- Beiträge: 29
- Registriert: Sonntag 7. Januar 2007, 09:11
- Wohnort: Berlin
Danke für den Tipp.Damaskus hat geschrieben:Da der Link zu dem Soundex Modul nicht mehr aktuell ist gibts hier einen Link zu einer compilierten Win32 Version.
www.python-forum.de/downloads/Levenshtein.pyd
Gruß
Damaskus
Nun habe ich sie in das Verzeichnis C:\Python25\Lib\site-packages runtergeladen.
Wie bekomme ich diese Datei dann zum Laufen?
Wenn ich draufklicke, kommt nur Buchstabensalat, es wird also wohl anders zu machen sein?
Dr. Kai Borrmann
Sperlingsgasse 1
10178 Berlin
Sperlingsgasse 1
10178 Berlin
Hier 2 Loesungen in Standard-Python:
z.B.
Noch ein paar Tipps:
Gruss
OldBoy
Code: Alles auswählen
def dist_lev(a, b):
"""
Calculates the Levenshtein distance between a and b.
Written by Magnus Lie Hetland (hetland.org)
"""
n, m = len(a), len(b)
if n > m:
a,b = b,a
n,m = m,n
current = range(n+1)
dummy = [n] * (n+1)
for i in range(1,m+1):
previous = current
current = dummy[:]
current[0] = i
for j in range(1, n+1):
add = previous[j]+1
delete = current[j-1]+1
change = previous[j-1]
if a[j-1] != b[i-1]: change += 1
current[j] = min(add, delete, change)
return current[n]
def dist_ratio(a, b):
s = difflib.SequenceMatcher(None, a, b)
return s.ratio()
Code: Alles auswählen
>>> a = 'Meier'
>>> b = 'Mayer'
>>> dist_lev(a,b)
2
>>> dist_ratio(a,b)
0.59999999999999998
>>> dist_lev(a,a)
0
>>> dist_ratio(a,a)
1.0
- - vor dem Vergleich die Texte normalisieren
(Gross-/Kleinschreibung, Sonderzeichen, Vereinheitlichung ( St/Str/Strasse))
- bei langen Namen duerfen auch die Abweichungen groesser sein
- anwendungsspezifische Sonderfaelle pruefen
(z.B: Alleestr./Allerstr. in Essen, Iran/Irak bei Laendern)
Gruss
OldBoy