Seite 3 von 3

Re: Großbuchstaben ...?

Verfasst: Mittwoch 16. Januar 2013, 09:19
von mutetella
Schon erstaunlich, wie kompliziert selbst so vermeintlich einfaches Zeugs wie deutsche Namensgebung sein kann... :shock:

Hab' mir mal ein paar Gedanken darüber gemacht, wie die Regeln zum Parsen ausschauen könnten:

Code: Alles auswählen

Wort        uppercase Zusatz Unbekannt  $
'Wo'            X
'steckt'                         X
'Karl'          X
'Heinz'         X
'von'                    X
'Hassel'        X
'wundert'                        X
'sich'                           X
'Herr'          X
'Wunder'        X                       X

- Ein uppercase wird entdeckt:
    - Folgewort ist uppercase        -> in queue
               oder Zusatz           -> in queue
    - Folgewort ist Unbekannt 
               oder $ 
                und queue nicht leer -> Namen bilden 
mutetella

Re: Großbuchstaben ...?

Verfasst: Mittwoch 16. Januar 2013, 12:04
von cofi
Und "von und zu" wird noch nicht beachtet :P

Wenn du Namen per Whitelist erkennen willst, dann brauchst du a) eine sehr grosse und b) eine, die komplette Namen enthaelt. Aber da das neue Meldegesetz so ein riesiges Datenschutzloch ist, ist das herankommen ja vielleicht sogar einfach moeglich ...

Und dann gibt es immernoch lustige Randfaelle: "Hat Frank Josef Michael Heinz angerufen?" Na welche kompletten Namen kann man daraus alle bilden?

Re: Großbuchstaben ...?

Verfasst: Mittwoch 16. Januar 2013, 12:34
von EyDu
cofi hat geschrieben:Und dann gibt es immernoch lustige Randfaelle: "Hat Frank Josef Michael Heinz angerufen?" Na welche kompletten Namen kann man daraus alle bilden?
Einen besonderen Randfall würde ich das noch nicht einmal nennen, mit zwei Namen ist das ja schon nicht mehr eindeutig: "Hat Frank Josef angerufen?" Also: "Hat [Frank] (den) [Josef] angerufen?" oder "Hat [Frank Josef] (dich/hier/heute) angerufen?"

Re: Großbuchstaben ...?

Verfasst: Mittwoch 16. Januar 2013, 12:44
von kbr
Da die Eindeutigkeit wohl nicht immer gegeben ist, habe ich folgende ultimate Lösung, welche die Prüfung auf alle Sonderfälle erübrigt:

Code: Alles auswählen

def get_uppercases(sentence):
    words = [word for word in sentence.split() if word[0].isupper()]
    random.shuffle(words)
    return zip(words[::2], words[1::2])

Re: Großbuchstaben ...?

Verfasst: Mittwoch 16. Januar 2013, 12:50
von jerch
"Hat Walter von der Vogelweide die Beeren geklaut?" ist halt ohne Zusatzwissen unentscheidbar. Die Möglichkeiten könnte man ja zurückgeben lassen, nur düfte das Regelwerk für die ganzen Sonderfälle ziemlich groß sein.

Re: Großbuchstaben ...?

Verfasst: Mittwoch 16. Januar 2013, 12:51
von cofi
@EyDu, das stimmt, ich wollte aber noch den Fall mit Mittelnamen einbringen ... der blieb bisher komplett aussen vor.