Validation-Data für tensorflow

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
JakobPrie
User
Beiträge: 91
Registriert: Sonntag 21. Juni 2020, 11:12

Hallo, ich habe eine KI die einen eingegeben Text in eine Antwort umwandelt. Nun möchte ich zum besseren Lernen das validation_data Attribut zum trainieren setzen. Ich lade die Daten aus einem JSON-File im Format

Code: Alles auswählen

{
"Eingabe": "was raus kommen soll"
}
wie muss ich die Daten Verarbeiten, damit die KI damit lernen (bzw. validiert werden) kann?
Benutzeravatar
ThomasL
User
Beiträge: 1378
Registriert: Montag 14. Mai 2018, 14:44
Wohnort: Kreis Unna NRW

Üblicherweise liest man alle Daten die man hat ein, z.B. mit Numpy oder Pandas.
Dann unterteilt man die Daten zuerst in einen "Trainings"- und einen Testdatensatz, so 80% / 20% oder 90% / 10%.
Danach unterteilt man den "Trainings"-Datensatz nochmals in einen echten Trainingsdatenteil und einen Validierungsdatensatz, Prozente wieder wie oben.
Mit dem Trainingsdatenteil wird dann trainiert und das Training mit dem Validierungsdatensatz überwacht.
Wenn man dann ein Modell hat, bei dem die Validierung den geringsten Fehler zeigt
lässt man einmalig die Testdaten auf das Modell los und errechnet damit die Genauigkeit des Modells.

Zum aufsplitten der Daten benutzt man üblicherweise die Methode train_test_split() von Scikit-Learn.
Ein gutes Tutorial findest du hier: https://realpython.com/train-test-split-python-data/
Ich bin Pazifist und greife niemanden an, auch nicht mit Worten.
Für alle meine Code Beispiele gilt: "There is always a better way."
https://projecteuler.net/profile/Brotherluii.png
Antworten