Pandas/zwei csv vergleichen und streichen

oldboyJR · Sonntag 19. Oktober 2025, 17:07

Ich versuche Pandas zu benutzen um zwei CSV zu vergleichen. Die habe ich mit einem Programm selber generiert und aus Mysql (xampp server intern) exportiert. Als Liste sieht das so aus die man unter irgend einer CSV datei speichern kann

"id";"Anrede";"Vorname";"Nachname";"Email";"Strasse";"Nummer";"Ort";"PLZ";"Bundesland";"Kommentare";"Unterstuetzer";"reg_date"
"1";"Herr";"Otto";"Sauel";"samuel@email";"HAGELBERGERSTR";"9";"bERLIN";"10000";"bERLIN";"haha";"ok";"2024-11-28 11:49:55"
"2";"Herr";"Reihard";"sauter";"samuel@email";"HAGELBERGERSTR";"9";"bERLIN";"10000";"bERLIN";"haha";"ok";"2024-11-28 12:02:11"
"3";"Herr";"Bernd";"richard";"samuel@email";"HAGELBERGERSTR";"9";"bERLIN";"10000";"bERLIN";"haha";"ok";"2024-11-28 12:03:32"
"4";"Herr";"Robby";"Reinersl";"samuel@email";"HAGELBERGERSTR";"9";"bERLIN";"10000";"bERLIN";"haha";"ok";"2024-11-29 09:39:52"
"5";"Herr";"Rudi";"fenterl";"samuel@email";"HAGELBERGERSTR";"9";"bERLIN";"10000";"bERLIN";"haha";"ok";"2024-11-29 09:46:10"
"6";"Herr";"Robert";"Swinkler";"samuel@email";"HAGELBERGERSTR";"9";"bERLIN";"10000";"bERLIN";"haha";"ok";"2024-11-29 10:35:22"
"7";"Herr";"Robert";"Forkerl";"samuel@email";"HAGELBERGERSTR";"9";"bERLIN";"10000";"bERLIN";"haha";"ok";"2024-11-29 12:47:39"
"8";"Herr";"Robert";"Svolkerl";"samuel@email";"HAGELBERGERSTR";"9";"bERLIN";"10000";"bERLIN";"haha";"ok";"2024-11-29 13:01:36"
"9";"Herr";"Robert";"Sanuel";"samuel@email";"HAGELBERGERSTR";"9";"bERLIN";"10000";"bERLIN";"haha";"ok";"2024-11-29 13:01:41"
"10";"Herr";"Robert";"Sanuel";"samuel@email";"HAGELBERGERSTR";"9";"bERLIN";"10000";"bERLIN";"haha";"ok";"2024-11-29 13:01:54"
"11";"Herr";"Robert";"Sanuel";"samuel@email";"HAGELBERGERSTR";"9";"bERLIN";"10000";"bERLIN";"haha";"ok";"2024-11-29 13:03:27"

["id";"Anrede";"Vorname";"Nachname";"Email";"Strasse";"Nummer";"Ort";"PLZ";"Bundesland";"Kommentare";"Unterstuetzer";"reg_date"
"1";"Herr";"Robert";"Sauel";"samuel@email";"HAGELBERGERSTR";"9";"bERLIN";"10000";"bERLIN";"haha";"ok";"2024-11-28 11:49:55"
"2";"Herr";"Robert";"sauter";"samuel@email";"HAGELBERGERSTR";"9";"bERLIN";"10000";"bERLIN";"haha";"ok";"2024-11-28 12:02:11"
"3";"Herr";"Robert";"richard";"samuel@email";"HAGELBERGERSTR";"9";"bERLIN";"10000";"bERLIN";"haha";"ok";"2024-11-28 12:03:32"
"4";"Herr";"Robert";"Reinersl";"samuel@email";"HAGELBERGERSTR";"9";"bERLIN";"10000";"bERLIN";"haha";"ok";"2024-11-29 09:39:52"
"5";"Herr";"Robert";"fenterl";"samuel@email";"HAGELBERGERSTR";"9";"bERLIN";"10000";"bERLIN";"haha";"ok";"2024-11-29 09:46:10"
"6";"Herr";"Robert";"Swinkler";"samuel@email";"HAGELBERGERSTR";"9";"bERLIN";"10000";"bERLIN";"haha";"ok";"2024-11-29 10:35:22"
"7";"Herr";"Robert";"Forkerl";"samuel@email";"HAGELBERGERSTR";"9";"bERLIN";"10000";"bERLIN";"haha";"ok";"2024-11-29 12:47:39"
"8";"Herr";"Robert";"Svolkerl";"samuel@email";"HAGELBERGERSTR";"9";"bERLIN";"10000";"bERLIN";"haha";"ok";"2024-11-29 13:01:36"
"9";"Herr";"Robert";"Sanuel";"samuel@email";"HAGELBERGERSTR";"9";"bERLIN";"10000";"bERLIN";"haha";"ok";"2024-11-29 13:01:41"
"10";"Herr";"Robert";"Sanuel";"samuel@email";"HAGELBERGERSTR";"9";"bERLIN";"10000";"bERLIN";"haha";"ok";"2024-11-29 13:01:54"
"11";"Herr";"Robert";"Sanuel";"samuel@email";"HAGELBERGERSTR";"9";"bERLIN";"10000";"bERLIN";"haha";"ok";"2024-11-29 13:03:27"

/list]
Bei meinen Proben habe ich festgestellt: Man muß für panda zwei csv dateien bilden die beide die selbe Struktur (mit Zeilenüberschrift )hat.
Ich habe nun mit Hilfe von mehrmaligen Versuchenundmit Hilfe von Mikrosoft Copilot folgendes Listing mit Teilen daraus kombiniert bzw. verändert.
Code: Alles auswählen
```
 import pandas as pd
import numpy


df = pd.read_csv("listeprobe1.csv")#importiere in Panda als df
da = pd.read_csv("listeprobe2.csv")#importiere in Panda als da
data = pd.concat([da,df]) #mach aus zwei eine datei data

#dienächsten fünf zeilen stammen aus copilot
#for data in df3:
#data = {
#"name": ["Sally", "Mary", "John", "Mary"],
#"age": [50, 40, 30, 40],
#"qualified": [True, False, False, False]
#}
data = pd.DataFrame(data)

print("Original DataFrame:")
print(data)

# --- Remove duplicates ---
# Keep the first occurrence (default)
data_no_dupes = data.drop_duplicates()

print("\nAfter drop_duplicates (keep='Vorname'):")
print(data_no_dupes)

# --- Remove duplicates based on specific columns ---
data_no_dupes_name = data.drop_duplicates(subset=['Vorname'], keep='last')

print("\nAfter drop_duplicates on 'Vorname' (keep='last'):")
print(data_no_dupes_name)

# --- Remove duplicates in-place ---
data.drop_duplicates(inplace=True, ignore_index=True)

print("\nIn-place removal with reindexing:")
print(data)
 
```
Irgendwie ist das Ergebnis komisch weil zuwenig Duplikate gelöscht werden. Bei Vorname müßten mehr verschwinden

__blackjack__ · Sonntag 19. Oktober 2025, 19:13

@oldboyJR: Warum denkst Du das? Welche sollten da gelöscht werden und warum?

oldboyJR · Montag 20. Oktober 2025, 10:32

Wenn ich das richtig verstanden habe wird die Spalte Vorname genommen um den unterschied festzustellen und dann alles gelöscht was nun doppelt ist. Bei mir bleiben zuviele Robert übrig

__blackjack__ · Montag 20. Oktober 2025, 11:10

@oldboyJR: Dann hast Du das nicht richtig verstanden. Wenn Du das auf die Spalte "Vorname" beziehen möchtest, dann musst Du das auch angeben. Der Rechner kann ja nicht raten welche Spalte Du meinst, Wenn Du keine Spalten angibst, bezieht sich das auf alle Spalten, und die Roberts unterscheiden sich halt mindestens in einer Spalte, also sind es auch keine Duplikate.

juergenkulow · Dienstag 21. Oktober 2025, 04:03

Semikolon als Trennzeichen beraucht pd.read_CSV:

Code: Alles auswählen

# zwei CSV vergleichen
# pd.read_csv ,sep=';'
# import numpy #Wird nicht benutzt.
import pandas as pd

df = pd.read_csv("/tmp/listeprobe1.csv",sep=';')#importiere in Panda als df
# https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html#pandas.read_csv
da = pd.read_csv("/tmp/listeprobe2.csv",sep=';')#importiere in Panda als da
data = pd.concat([da,df]) #mach aus zwei eins
data_no_dupes = data.drop_duplicates()
print(data_no_dupes)
data_no_dupes_name = data.drop_duplicates(subset=['Vorname'], keep='last')
print(data_no_dupes_name)
data.drop_duplicates(inplace=True, ignore_index=True)
# Gebt das DataFrame mit entfernten doppelten Zeilen zurück.
# https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.drop_duplicates.html
print(data)
"""
%runfile /tmp/cmp.py --wdir
    id Anrede  Vorname  ... Kommentare Unterstuetzer             reg_date
0    1   Herr   Robert  ...       haha            ok  2024-11-28 11:49:55
1    2   Herr   Robert  ...       haha            ok  2024-11-28 12:02:11
2    3   Herr   Robert  ...       haha            ok  2024-11-28 12:03:32
3    4   Herr   Robert  ...       haha            ok  2024-11-29 09:39:52
4    5   Herr   Robert  ...       haha            ok  2024-11-29 09:46:10
5    6   Herr   Robert  ...       haha            ok  2024-11-29 10:35:22
6    7   Herr   Robert  ...       haha            ok  2024-11-29 12:47:39
7    8   Herr   Robert  ...       haha            ok  2024-11-29 13:01:36
8    9   Herr   Robert  ...       haha            ok  2024-11-29 13:01:41
9   10   Herr   Robert  ...       haha            ok  2024-11-29 13:01:54
10  11   Herr   Robert  ...       haha            ok  2024-11-29 13:03:27
0    1   Herr     Otto  ...       haha            ok  2024-11-28 11:49:55
1    2   Herr  Reihard  ...       haha            ok  2024-11-28 12:02:11
2    3   Herr    Bernd  ...       haha            ok  2024-11-28 12:03:32
3    4   Herr    Robby  ...       haha            ok  2024-11-29 09:39:52
4    5   Herr     Rudi  ...       haha            ok  2024-11-29 09:46:10

[16 rows x 13 columns]
    id Anrede  Vorname  ... Kommentare Unterstuetzer             reg_date
0    1   Herr     Otto  ...       haha            ok  2024-11-28 11:49:55
1    2   Herr  Reihard  ...       haha            ok  2024-11-28 12:02:11
2    3   Herr    Bernd  ...       haha            ok  2024-11-28 12:03:32
3    4   Herr    Robby  ...       haha            ok  2024-11-29 09:39:52
4    5   Herr     Rudi  ...       haha            ok  2024-11-29 09:46:10
10  11   Herr   Robert  ...       haha            ok  2024-11-29 13:03:27

[6 rows x 13 columns]
    id Anrede  Vorname  ... Kommentare Unterstuetzer             reg_date
0    1   Herr   Robert  ...       haha            ok  2024-11-28 11:49:55
1    2   Herr   Robert  ...       haha            ok  2024-11-28 12:02:11
2    3   Herr   Robert  ...       haha            ok  2024-11-28 12:03:32
3    4   Herr   Robert  ...       haha            ok  2024-11-29 09:39:52
4    5   Herr   Robert  ...       haha            ok  2024-11-29 09:46:10
5    6   Herr   Robert  ...       haha            ok  2024-11-29 10:35:22
6    7   Herr   Robert  ...       haha            ok  2024-11-29 12:47:39
7    8   Herr   Robert  ...       haha            ok  2024-11-29 13:01:36
8    9   Herr   Robert  ...       haha            ok  2024-11-29 13:01:41
9   10   Herr   Robert  ...       haha            ok  2024-11-29 13:01:54
10  11   Herr   Robert  ...       haha            ok  2024-11-29 13:03:27
11   1   Herr     Otto  ...       haha            ok  2024-11-28 11:49:55
12   2   Herr  Reihard  ...       haha            ok  2024-11-28 12:02:11
13   3   Herr    Bernd  ...       haha            ok  2024-11-28 12:03:32
14   4   Herr    Robby  ...       haha            ok  2024-11-29 09:39:52
15   5   Herr     Rudi  ...       haha            ok  2024-11-29 09:46:10

[16 rows x 13 columns]
"""

oldboyJR · Dienstag 21. Oktober 2025, 16:37

Es ist zum Mäusemelken. Mit welcher Version ich das Programm geschrieben habe bzw. mit welcher env kann ich mitlerweile nicht mehr nachvollziehen. Tatsache die Probleme nach einem gescheiterten Updateversuch sind da. Nun unter einer zeitweiligen(nicht dauerhaften Administration) des Spider allone Installation habe ich mit conda install mysql und conda install pandas in eine neue env namens runtime beides installiert. Jetzt probiere ich ohne Adminrechte, mein Programm und funktioniert nur halb.

Code: Alles auswählen

import pandas as pd
import numpy
db = pd.read_csv("listeprobe1.csv")#importiere in Pandas als db
da = pd.read_csv("listeprobe2.csv")#importiere in Pandas als da
data = pd.concat([da,db]) #mach aus zwei eine datei data
print("Original DataFrame:")
print(data)#bis hier funktioniert es aber data als DataFrame ist hier schon nicht gültig. 
#Im variablenmanager steht data als DataFrame mit allen zeilen der beiden csv dateien.


data = data.drop_duplicates(subset=['Vorname']) #soll alle  Einträge löschen die mehrfach 
#in der Zeile Vorname vorkommen. es funktioniert nicht weil hier keine DataFrame erkannt wird und nach dem Punkt das als Text deklariert wird
 
print("\nAfter drop_duplicates(subset=['Vorname'):")
print(data)# deshalb wird hiermit errorcode ausgegeben

KeyError Traceback (most recent call last)
C:\ProgramData\spyder-6\envs\spyder-runtime\Lib\site-packages\spyder_kernels\customize\code_runner.py in ?(self, code, filename, ns_globals, ns_locals, post_mortem, exec_fun, capture_last_expression, global_warning)
657 error_type, error, tb = sys.exc_info()
658 self._post_mortem_excepthook(error_type, error, tb)
659 else:
660 # We ignore the call to exec
--> 661 self.shell.showtraceback(tb_offset=1)
662 finally:
663 __tracebackhide__ = "__pdb_exit__"

C:\ProgramData\spyder-6\envs\spyder-runtime\Lib\site-packages\spyder_kernels\customize\utils.py in ?(code_ast, globals, locals, exec_fun, filename)
207 if filename is None:
208 filename = "<stdin>"
209 exec_fun(compile(code_ast, filename, "exec"), globals, None)
210 finally:
--> 211 if use_locals_hack:
212 # Cleanup code
213 globals.pop("_spyderpdb_code", None)
214 if len(globals["_spyderpdb_locals"]) > 1:

c:\users\gbt b650m gamingx ax\documents\myphyton\csvvergleichstest.py in ?()
12 print("Original DataFrame:")
13 print(data)#bis hier funktioniert es
14
15
---> 16 data = data.drop_duplicates(subset=['Vorname'])
17
18 print("After drop_duplicates(subset=['Vorname']:")
19 print(data)

C:\ProgramData\spyder-6\envs\spyder-runtime\Lib\site-packages\pandas\core\frame.py in ?(self, subset, keep, inplace, ignore_index)
6836
6837 inplace = validate_bool_kwarg(inplace, "inplace")
6838 ignore_index = validate_bool_kwarg(ignore_index, "ignore_index")
6839
-> 6840 result = self[-self.duplicated(subset, keep=keep)]
6841 if ignore_index:
6842 result.index = default_index(len(result))
6843

C:\ProgramData\spyder-6\envs\spyder-runtime\Lib\site-packages\pandas\core\frame.py in ?(self, subset, keep)
6968 # Otherwise, raise a KeyError, same as if you try to __getitem__ with a
6969 # key that doesn't exist.
6970 diff = set(subset) - set(self.columns)
6971 if diff:
-> 6972 raise KeyError(Index(diff))
6973
6974 if len(subset) == 1 and self.columns.is_unique:
6975 # GH#45236 This is faster than get_group_index below

KeyError: Index(['Vorname'], dtype='object')

Wie bekommt man hier Abhilfe? Gestern hatte ich noch mit dem Trick "data = pd.DataFrame (data)" zeitweise den status eines DataFrame wieder gegeben data lagen ja als data im Speicher.

__blackjack__ · Dienstag 21. Oktober 2025, 18:11

@oldboyJR: Du liest die Daten halt falsch ein. Die sind mit ";" getrennt, was Du hier aber nicht angibst, also landen alle Spalten in *einer* Spalte und es gibt keine Spalte mit dem Titel "Vorname". Das Problem hatte der Code aber schon vorher, der ist also noch *nie* Fehlerlos durchgelaufen, mit den Dateiinhalten. Wenn das mal durchgelaufen war, dann hatten die Dateien tatsächlich "," statt ";" zum Trennen der Werte. Das hat nichts mit der Python- oder Pandas-Version zu tun, und auch nicht mit dem Thema venv.

snafu · Dienstag 21. Oktober 2025, 20:10

Einfach mal die Zwischenergebnisse angucken, spätestens wenn der Code nicht das erwartete Ergebnis liefert, soll auch ganz hilfreich sein. Entweder mit ein paar print()-Aufrufen oder durch Einfügen des relevanten Teils in den interaktiven Interpreter. Dann kann man sehen, was wirklich in ``da`` und ``db`` steht. Wenn man da beim Einlesen schon einen Fehler durch eine falsche Konfiguration des Reader gemacht hat, dann können die Folgeschritte die einmal falsch gelesenen Daten leider nicht auf magische Weise im Sinne des Programmierers korrigieren...

mechanicalStore · Dienstag 21. Oktober 2025, 21:11

@oldboyJR: Guck halt, was Dir hier auffällt (ungetestet):

Code: Alles auswählen

import pandas as pd

if __name__ == '__main__':

    da = pd.read_csv("listeprobe1.csv", sep=';')
    db = pd.read_csv("listeprobe2.csv")

    print(da.columns)
    print(da.dtypes)
    print()
    print(db.columns)
    print(db.dtypes)

    da.drop_duplicates(subset='Vorname', inplace=True)
    # db.drop_duplicates(subset='Vorname', inplace=True)     # <-------- Zum Testen auskommentieren

    print(da)

oldboyJR · Mittwoch 22. Oktober 2025, 22:25

Danke für die Wunderwaffe

Code: Alles auswählen

if __name__ == '__main__':

die erinnert mich an ein Java Konstrukt aus einem java FX Tutorial ich so ähnlich wie: this main = main (obwohl es etwas verbindet anstatt verhindert. Damit funktioniert es. Mein altes Listing erweitert

Code: Alles auswählen

import pandas as pd

if __name__ == '__main__':
    
        # importiere in Panda als df
    df = pd.read_csv("listeprobe1.csv", sep = ';')
    # https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html#pandas.read_csv
    da = pd.read_csv("listeprobe2.csv", sep = ';')
    # importiere in Panda als da
    data = pd.concat([da, df])  # mach aus zwei eins
   
    print (data)
    data = data.drop_duplicates(subset=['Nachname'], keep='last')
    print(data)
    data = data.reset_index()
    print(data)

tut was es soll

oldboyJR · Mittwoch 22. Oktober 2025, 23:10

PS danke mechanicelStore Aber dein LIsting mit den jeweiligen Versuch die eingelesenen Daten erst zu droppen hat nach dem löschen der raute einen Fehler produziert. Es tut sich wohl das selbe Problem wie bei mir auf ein zweites drop_duplikates auch mit anderen Parameter will er nicht durchführen!

oldboyJR · Donnerstag 23. Oktober 2025, 00:52

jaja auf den zweiten blick das mit dem seperator haha

Pedroski55 · Freitag 7. November 2025, 01:42

In Python gibt es fast immer mehr als einen Weg zum Ziel. Was pandas hinter den Kulissen macht ist auch nur sich durch Listen wälzen!

Code: Alles auswählen

import pandas as pd
import csv

# Kopien von den angegebenen Daten
path2csv1 = '/home/peterr/temp/duplicates1.csv'
path2csv2 = '/home/peterr/temp/duplicates2.csv'
# mach die Daten lesbar
savename1 = '/home/peterr/temp/duplicates1_lesbar.csv'
savename2 = '/home/peterr/temp/duplicates2_lesbar.csv'

# mach die csv ohne Augenschmerzen lesbar
def korrigiere(einfile, ausfile):
    with open(einfile) as infile, open(ausfile, mode='w') as csvfile:
        lines = csv.reader(infile, delimiter=';')
        csv_writer = csv.writer(csvfile, delimiter=';', quotechar='"', quoting=csv.QUOTE_MINIMAL)
        # line is a list
        for line in lines:
            #print(line)
            for i in range(len(line)):
                # eigentlich ist es egal ob Emailadressen gross oder klein geschrieben werden
                if not '@' in line[i]:
                    # stell normal Schrift her
                    line[i] = line[i].title()
            csv_writer.writerow(line)

# nun haben wir Berlin anstatt bERLIN usw
korrigiere(path2csv1, savename1)
korrigiere(path2csv2, savename2)

df1=pd.read_csv(savename1, sep=';')
df2=pd.read_csv(savename2, sep=';')
df_alles = pd.concat([df1, df2], axis=0, ignore_index=True)
# zeige df_alles
print(df_alles.to_string())
# alle Duplikate zeigen True
print(df_alles.duplicated())
dups = df_alles.duplicated()
# hole alle index Nummern wo dups = True
kopien = dups[dups].index
df_no_dups = df_alles.drop(kopien)
print(df_no_dups.to_string())

# entferne alle Robert Duplikate
robs = df_alles.duplicated(subset=['Vorname'])
alter_ego = robs[robs].index
df_one_rob = df_alles.drop(alter_ego)
print(df_one_rob.to_string())

print(df_one_rob.to_string()) zeigt:

Id Anrede Vorname Nachname Email Strasse Nummer Ort Plz Bundesland Kommentare Unterstuetzer Reg_Date
0 1 Herr Otto Sauel samuel@email Hagelbergerstr 9 Berlin 10000 Berlin Haha Ok 2024-11-28 11:49:55
1 2 Herr Reihard Sauter samuel@email Hagelbergerstr 9 Berlin 10000 Berlin Haha Ok 2024-11-28 12:02:11
2 3 Herr Bernd Richard samuel@email Hagelbergerstr 9 Berlin 10000 Berlin Haha Ok 2024-11-28 12:03:32
3 4 Herr Robby Reinersl samuel@email Hagelbergerstr 9 Berlin 10000 Berlin Haha Ok 2024-11-29 09:39:52
4 5 Herr Rudi Fenterl samuel@email Hagelbergerstr 9 Berlin 10000 Berlin Haha Ok 2024-11-29 09:46:10
5 6 Herr Robert Swinkler samuel@email Hagelbergerstr 9 Berlin 10000 Berlin Haha Ok 2024-11-29 10:35:22

sparrow · Samstag 8. November 2025, 11:43

@Pedroski55: Grundsätzlich gibt es in Programmiersprachen immer gute und weniger gute Wege um an das Ziel zu kommen. Python ist aufgrund der Art der Typisierung etwas verzeihlicher, was das Vorgehen angeht, trotzdem sollte es der Anspruch eines Entwicklers sein, "guten" Code zu schreiben. Zum einen wird Code viel öfter gelesen als geschrieben, also sollte er verständlich sein. Und während der Ausführung sollte er zumindest nicht unnötig ineffizient sein, wenn es einen deutlich besseren Weg gibt.

Zu deinen Ausführungen:
Pandas wälzt nicht nur Listen. Nur für den Fall, dass du denkst, dass das nur ein Wrapper um Python-Coder herum ist. Das klingt ein bisschen so.
Pandas ist eben nicht in Pyhton implementiert und verwendet eigene interne Datenstrukturen. Es ist deutlich schneller als eine reine Umsetzung in Python, gerade bei größeren Datenmengen.
Gerade deshalb ist es sinnvoll, die Dataframes einmal zu laden und dann darauf zu arbeiten. Du tust hier aber erst Dinge mit dem CSV-Modul, lädst dann die CSVs in Pandas und verwnedest dann dessen Tools.
Deutlich besser zu lesen - und deutlich schneller ind er Ausführung - wäre es, die CSVs in Dataframes zu laden und dann darauf die Änderungen anzupassne.

Deine Aussage "eigentlich ist es egal ob Emailadressen gross oder klein geschrieben werde" ist so falsch. Die Annahme ist weit verbreitet und man sollte bedenken, dass Anwendungen die Mail-Adresse ungefragt in ihrer Schreibweise ändern (zum Beispiel die E-Mail-Adresse für die Anmeldung automatisch auf Kleinschreibung ändern), theoretisch ist PeterR@example.test eine andere Adresse als peterr@example.test.

__blackjack__ · Mittwoch 12. November 2025, 09:59

Zudem kann das @-Zeichen auch in anderen Spalten auftauchen. Und bei Namen kann es Bestandteile geben die klein geschrieben werden. Bei „von Rabbit“ muss das „von“ klein geschrieben bleiben.