002Sub_Das_Parf\xc3\xbcm.txt', '002Meta_Das_Parf\xc3\xbcm.txt~',
ABER das Programm bearbeitet diese Dateien!
['002Sub_Das_Parf\xc3\xbcm.txt', '002Meta_Das_Parf\xc3\xbcm.txt~', '002Meta_Das_Parf\xc3\xbcm.txt', '001Meta_Berlin_Alexanderplatz.txt~', '003Meta_Faust (copy).txt~']
'002Meta_Das_Parf\xc3\xbcm.txt', '001Meta_Berlin_Alexanderplatz.txt~', '003Meta_Faust (copy).txt
werden immer mit bearbeitet (sie waren zuvor im Ordner Input), selbst wenn ich das Programm in andere Ordner lege und die Variablen umbenenne etc...
Wo liegt der Fehler? Wo sind die Dateien gespeichert?
Viele Grüße aus Berlin
Micha
Code: Alles auswählen
def nlp_textrazor():
path = 'Input/'
outdir = ''
dirs = os.listdir(path)
print dirs
for file in dirs:
print "Processing: " + file
filename = path + file
outfilename = (outdir + file)
text = open(filename, 'r').read().split()
s = ''.join(text)
stop_words = open('stopwords.txt', 'r').read().split()
words = (text)
filtered_text = [w for w in words if not w in stop_words]
newfile = open(outfilename, "w")
for line in filtered_text:
s = str(line) + '\n'
newfile.write(s)
return