Lineare Regression - Theorie / Mathe

mit matplotlib, NumPy, pandas, SciPy, SymPy und weiteren mathematischen Programmbibliotheken.
Antworten
NullPointer
User
Beiträge: 1
Registriert: Dienstag 26. April 2022, 16:42

Hallo zusammen!

ich bin neu hier und hoffe, dass mir hier jemand weiterhelfen kann.
Vielleicht wäre meine Frage auch in einem Mathe-Forum besser aufgehoben aber irgendwie gehts ja auch um Machine-Learning (wo - soweit ich weiß - häufig Python verwendet wird).

Also: Ich beschäftige mich derzeit mit der Theorie hinter der linearen/multiplen Regression - wenn man das so sagen kann. In meinem Lehrbuch stehen nun 2 Formeln, bei denen ich mir nicht sicher bin, ob ich diese richtig verstanden habe.

1. Bild
https://ibb.co/6Zfgjrj


2.Bild
https://ibb.co/2Zf9nCY

Nun meine Erläuterung der beiden:

Zur 1. Formel: Diese zeigt, wie sich der Vorhersagewert für einen neuen Wert 'x' berechnet.
w sind dabei die verschiedenen Parameter der Regression, die (In Formel 2) angepasst werden.

Zur 2. Formel: Diese beschreibt die Fehlerfunktion eines jeden Parameters w, die minimiert wird bei der Anpassung des jeweiligen Parameters. Dafür wird die Summe der quadratischen Abweichungen berechnet.
Diese wird also für jeden einzelnen Parameter w aufgestellt und anschließend minimiert. Dann hat man den 'besten' Wert für w gefunden, der die Funktion beschreibt.

Liege ich mit meiner Erklärung hier richtig? Oder ist das völliger Unsinn?
Antworten