Unterliste auf doppelte Einträge Prüfen

LRK · Donnerstag 15. August 2019, 20:28

Vielen Dank für die lieben Worte. Habe überlegt ob ich mich beruflich umorientieren sollte und wollte evtl. etwas im IT Bereich machen. (Der Zeit Lagerarbeiter) Da mir Kollegen aus dem Büro und Lager sagen ich solle etwas mit PC machen, da ich mich gut auskenne. Naja kleinere Scripte in VB und Excel gemacht habe und mich mit der ein oder anderen Software gut auskenne. Ich weiß das die Jungs und Mädels hier viel Erfahrung haben. Mein Vater meinte früher immer zu mir "man muss denn Anfang von etwas kennen um das neue zu verstehen" ich denke beim Programmieren ist es ähnlich. Zuerst wissen wie man es früher gemacht hat ist nicht verkehrt um zu verstehen warum es heute anderst ist. Ich finde es toll wie andere hier einem helfen auch wenn ich es nicht immer gleich verstehe. Aber ich nehme mir Zeit um nach zu schauen welcher Baustein, eines Codes was macht. Ein Freund von mir ist Programmierer und er meint auch das es das richtige für mich ist und er auch nicht alles versteht und vieles nachlesen muss.
Danke nochmals.

LRK · Donnerstag 15. August 2019, 21:14

Derzeit sieht es durch die Hilfe von _blackjack_ so aus.

data = [['A', 'B'], ['C', 'D'], ['E', 'F'], ['G', 'C'], ['F', 'H']]

Ergebnis: [['A', 'B'], ['C', 'D'], ['E', 'F'], ['G'], ['H']]

Ich möchte aber eigentlich dass das Ergebniss so aussieht.

Ergebnis: [['A', 'B'], ['C', 'D'], ['E', 'F'], ['F', 'H']]

Das dass ganze Object gelöscht wird und ich die Möglichkeit habe nur nach doppelten werten in Data[x][1] zu suchen und dessen Object gelöscht wird.

"for letters in data:" soll und wird durchlaufen
Aber
"for letter in letters:" soll nur die zweite Position durchlaufen. [1] Und wenn etwas doppelt ist in "Letters" gelöscht werden. [x] löschen.

Soll in Liste bleiben
Data[4][0] Darf nur doppelt vorkommen, wenn Data[4][1] nicht doppelt vorkommt.

Darf nicht in Liste bleiben
Data[3][0] kommt zwar nicht doppelt vor, aber Data[3][1] kommt doppelt vor. Deswegen soll Data[3] gelöscht werden.

Es fällt mir wahnsinnig schwer mich aus zu drücken.

Sirius3 · Donnerstag 15. August 2019, 21:42

Wenn in letters nur Element [1] interessant ist, dann brauchst Du keine for-Schleife.

Was hast du denn schon versucht. Alles was Du brauchst, sollte Dir ja jetzt bekannt sein.

LRK · Donnerstag 15. August 2019, 21:52

Ich dachte ich muss Letters mit einer for Schleife durchlaufen und wenn letter[1] schon gesehen worden ist Letters löschen.

__blackjack__ · Donnerstag 15. August 2019, 21:55

@LRK: Vielleicht ist hier ein Problem auch das keiner hier weiss was das da überhaupt bedeuten soll und Code der mit irgendwelchen sinnfreien Listen und Indexen herum hampelt nur schwer verständlich ist.

Wenn die inneren Listen immer genau zwei Werte haben und beide Werte etwas anderes bedeuten, also der Index des Elements die Bedeutung festlegt, dann sind die inneren Listen eigentlich keine Listen sondern Tupel. Und wenn die beiden Elemente eine unterschiedliche Bedeutung haben, dann kann man ja auch einfach mal sagen *was* die Bedeuten. Und zwar *im Code*, in dem man mit `collections.namdedtupel()` einen Typ erstellt an dessen Namen die Bedeutung der beiden zusammengefassten Werte als Einheit klar wird, und an den Attributnamen die Bedeutung der beiden Werte. Dann wird es nicht nur leichter solchen Code zu lesen und zu verstehen, sondern auch ihn zu schreiben, weil Fehler viel leichter auffallen – auch dem Programmierer beim schreiben des Codes.

Gute Namen sind wichtig! Das ist keine Kosmetik, sondern wirklich wichtiges Hilfsmittel zum Programmieren und zur Fehlersuche.

Da Du immer von „löschen“ sprichst: Das macht man nicht solange man das vermeiden kann. Habe ich ja auch nicht gemacht. Man baut eine neue Liste auf in der nur das steht was man haben will. Das was man nicht haben will wird nicht gelöscht, sondern einfach nicht in die neue Liste übernommen.

LRK · Donnerstag 15. August 2019, 22:18

Tut mir leid ich war mir der Dimension nicht bewusst.
Mit "collections.namdedtupel()" tubel kann ich noch nichts anfangen aber Versuche mich natürlich damit zu beschäftigen.

Das mit dem neue Liste erstellen verstehe ich jetzt ja und das man einfach das was man nicht haben möchte einfach weg lässt in der neuen Liste.

Zu meiner Namensgebung der Liste und meiner Vorstellung im Kopf.
Kann ich nur so beschreiben.
Ich habe eine Text Datei mit Firmenname und Internet Adressen die sieht so aus.

Firmenname
Internet-Adresse

...
...

Oft ist der Firmenname gleich und die Internet-Adresse eine andere. Diese Einträge möchte ich behalten.
Aber es kommt sehr oft vor das der Firmenname unterschiedlich ist aber die Internet-Adresse doppelt vor kommt. Diese brauche ich nicht doppelt und wollte deswegen Firmenname und Internet-Adresse in der neuen Liste weg lassen.

Stelle es mir so vor.
Liste[[Firmenname1, Internet-Adresse1],[Firmenname2, Internet-Adresse2],[Firmenname3, Internet-Adresse1],[Firmenname1, Internet-Adresse4]]

Hier wäre "[Firmenname3, Internet-Adresse1]" überflüssig, weil ich die Internet-Adresse1 schon habe.

__blackjack__ · Donnerstag 15. August 2019, 23:09

@LRK: Also in Worten: Man hat Firmeneinträge und für jeden Eintrag einen Namen und eine URL. Man muss sich die URLs merken die man schon gesehen hat. Und das Ergebnis. Dann schaut man für jede Firma ob die URL schon mal vorkam. Falls nicht, merkt man sich die URL und schreibt den Firmeneintrag ins Ergebnis. Falls nicht, macht man einfach nichts.

Wenn man das mit namenlosen verschachtelten Listen macht und nicht weiss was das eigentlich alles bedeuten soll, ist das beste was man machen kann: