Pandas Dataframe "Unique-Einschränkung"

mit matplotlib, NumPy, pandas, SciPy, SymPy und weiteren mathematischen Programmbibliotheken.
Antworten
Heon
User
Beiträge: 8
Registriert: Dienstag 27. Februar 2018, 10:03

Hallo zusammen,

gibt es für einen Dataframe in Pandas sowas wie eine unique-Einschränkung in SQL auf eine Spalte oder die Kombi mehrer Spalten ?
Ich weiß, dass ich dies für den Index machen kann und dann bei .append den parameter verify_integrity mitgeben kann.
Aber geht sowas auch für eine vom index unabhängige Spalte ?
Mir ist klar, dass ich vor dem Einfügen natürlich auf Duplicate prüfen kann, die Frage ist aber ob pandas sowas für "normale" Spalten mit seinen Bordmitteln schon mitbringt.

Danke

Heon
DataChris
User
Beiträge: 2
Registriert: Montag 20. August 2018, 15:20

Hi Heon,

meinst du einfach das Überprüfen bzw. Löschen von Duplikaten in Spalten, die nicht der Index sind?

Wenn ja, dann gibt es die Funktion .drop_duplicates().

Hier kannst du mit dem Argument "subset" die Spalte(n) auswählen, bei denen die Duplikate gelöscht werden sollen.

Viele Grüße

Chris
Antworten