Zunächst einmal wollte eine Excel File auf Duplikate überprüfen, welches ich auch erfolgreich geschafft habe. Das Programm spuckt quasi raus, wieviele Länder wie oft in der angegebenen Spalte vorkommen.
Code: Alles auswählen
import csv
lesdatei = open("Test_08_01_2015.csv", "r")
schreibdatei= open("Final.csv", "w")
Country = {}
reader = csv.reader(lesdatei, delimiter=';', quotechar="'")
rowNum = 0
for row in reader:
rowNum += 1
countryName = str(row[8]).strip()
if countryName in Country:
Country[countryName] += 1
elif countryName.strip() != "":
Country[countryName] = 1
for country in Country:
if Country[country] > 1:
print("Country Name: " + country + ": " + str(Country[country]))
schreibdatei.write("Country Name: " + country + ": " + str(Country[country]) + "\n") #oder auch \r"\n"
print(rowNum)
schreibdatei.write("Number of Rows: " + str(rowNum)+"\n")
print(len(Country))
schreibdatei.write("Number of Country: " + str(len(Country))+"\n")
Code: Alles auswählen
Country Name: Ghana: 2
Country Name: Detuschland: 2
17223
16469
Mir ist klar, das ich in der neuen Schleife mein Orginaldatei wieder brauche, um die Adress Spalte einzulesen. Und soweit ich das verstanden habe, muss ich mir eine temporäre Variable bilden, damit das Programm mir die Countryname Duplikate und die dazugehörigen Adressen zurück liefert.
Allerings ist mir das Konzept von temporären Variablen nicht klar bzw. verstehe nicht, wie ich anwenden soll. Könnt Ihr mir Tipps geben? Danke für euer Feedback