Die Suche ergab 11 Treffer

von magmdot
Donnerstag 20. Februar 2014, 12:43
Forum: Allgemeine Fragen
Thema: Strings mit Umlaute in Datei suchen
Antworten: 15
Zugriffe: 2534

Re: Strings mit Umlaute in Datei suchen

Deine Antworten sind sehr lehrreich. Danke dafür!
von magmdot
Donnerstag 20. Februar 2014, 01:45
Forum: Allgemeine Fragen
Thema: Strings mit Umlaute in Datei suchen
Antworten: 15
Zugriffe: 2534

Re: Strings mit Umlaute in Datei suchen

Was mir aber immernoch nicht klar ist...

Code: Alles auswählen

w='Ähre'
print w[0]=='Ä'
liefert false...

Wie macht an das? :O
von magmdot
Mittwoch 19. Februar 2014, 23:05
Forum: Allgemeine Fragen
Thema: Strings mit Umlaute in Datei suchen
Antworten: 15
Zugriffe: 2534

Re: Strings mit Umlaute in Datei suchen

oha ....

wenn ich

Code: Alles auswählen

from __future__ import unicode_literals
rausnehme, klappt

Code: Alles auswählen


with open ("new.txt", "r") as myfile:
    data=myfile.read()
o=data.find("Mönch")
print data[o]
jetzt... juhu


danke!
von magmdot
Mittwoch 19. Februar 2014, 23:00
Forum: Allgemeine Fragen
Thema: Strings mit Umlaute in Datei suchen
Antworten: 15
Zugriffe: 2534

Re: Strings mit Umlaute in Datei suchen

so. ich hab das jetzt mittels iconv alles angeglichen. nun ist alles in utf8 kodiert
von magmdot
Mittwoch 19. Februar 2014, 22:49
Forum: Allgemeine Fragen
Thema: Strings mit Umlaute in Datei suchen
Antworten: 15
Zugriffe: 2534

Re: Strings mit Umlaute in Datei suchen

oh man...

mein Quelltext ist durchgängig in UTF8 kodiert.
Mein Ziel ist folgendes: Ich will aus einer Datei einen Text einlesen. (die ist dann auch UTF8) und die Wörter eds Textes in einer "großen" anderen Datei suchen, also schauen ob die vorkommen und dann die zahl, die hinter diesen Wörtern ...
von magmdot
Mittwoch 19. Februar 2014, 21:57
Forum: Allgemeine Fragen
Thema: Strings mit Umlaute in Datei suchen
Antworten: 15
Zugriffe: 2534

Re: Strings mit Umlaute in Datei suchen

Die Fehlermeldung bei print o ist

File "minex.py", line 66, in <module>
o=data.find("Mönch")
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 1: ordinal not in range(128)


print data liefert den Inhalt der File: Mönch Mönch


Ja, ich nehme zumindest an, dass die textdatei ...
von magmdot
Mittwoch 19. Februar 2014, 21:28
Forum: Allgemeine Fragen
Thema: Strings mit Umlaute in Datei suchen
Antworten: 15
Zugriffe: 2534

Re: Strings mit Umlaute in Datei suchen

Hmmm

Code: Alles auswählen



with open ("ex1.txt", "r") as myfile:
    data=myfile.read().replace('\n', '')
o=data.find("Mönch")
print(o)
funzt auch nicht :/

wenn ich

Code: Alles auswählen

from __future__ import unicode_literals
wegnehme, findet er es einfach nicht. das hilft auch nicht
von magmdot
Mittwoch 19. Februar 2014, 21:23
Forum: Allgemeine Fragen
Thema: Strings mit Umlaute in Datei suchen
Antworten: 15
Zugriffe: 2534

Re: Strings mit Umlaute in Datei suchen

ich hab gelesen, dass für große Dateien mmap gut ist.. aber 7MB zählt noch nicht als große Datei?


Okok.. ich glaube Dir ja ;)
von magmdot
Mittwoch 19. Februar 2014, 21:08
Forum: Allgemeine Fragen
Thema: Strings mit Umlaute in Datei suchen
Antworten: 15
Zugriffe: 2534

Strings mit Umlaute in Datei suchen

Hallo

Ich habe folgendes Problem mit Umlauten..... obwohl ich schon alles versucht habe....

Ich möchte in einer recht großen Text-Datei (etwa 7MB) nach Wörtern suchen, die Umlaute enthalten können


# -*- coding: utf-8 -*-
from __future__ import unicode_literals
import sys
import codecs
import ...
von magmdot
Mittwoch 19. Februar 2014, 20:51
Forum: Allgemeine Fragen
Thema: Probleme mit » und « im String finden
Antworten: 2
Zugriffe: 705

Re: Probleme mit » und « im String finden

danke!

oh man.. jetzt ergibt sich hier ein Riesenproblem. da muss ich morgen mal fragen ...
von magmdot
Mittwoch 19. Februar 2014, 18:13
Forum: Allgemeine Fragen
Thema: Probleme mit » und « im String finden
Antworten: 2
Zugriffe: 705

Probleme mit » und « im String finden

Hallo

Ich möchte in einer Textdatei nach » und « suchen und beide Symbole durch " ersetzen. Oder zumindest am Ende einen String bekommen, bei dem das ersetzt ist:

import codecs

...


f = codecs.open('beispiel.txt', "r", "utf-8")
s = mmap.mmap(f.fileno(), 0,access=mmap.ACCESS_READ)
q=""
for i in ...