erstmal schön, dass es das hier gibt - danke dafür.
Mein Name ist Alex, ich interessiere mich für maschinelles Lernen und habe eine Frage.
Im Studium habe ich Java gelernt, lerne jetzt aber seit zwei Monaten Python und habe für mich jetzt ganz frisch das SciKit entdeckt, damit auch schon ein paar Regressionen usw. ausprobiert - ist ja sehr Benutzerfreundlich gehalten. Die Frage ist: Wenn ich stark verrauschte Daten habe, dann gibt es natürlich Bereiche, in denen ich mich nicht sicher bin, worum es sich tatsächlich handelt. Ich habe gelesen, dass man diese Bereiche identifizieren kann - mit welcher Möglichkeit? Wie funktioniert das? Wenn ich zum Beispiel wissen will, wo meine Aussage mit einer 95%tigen Wahrscheinlichkeit noch zutrifft.
Beispiel: Kinder werfen Bälle auf einen Strand, da hinter ist das Meer. Zu wählen ist die Abwurflinie, von der die Kinder werfen. Nur maximal 5% der Bälle darf das Meer erreichen. Mein Datensatz enthält die Wurfweite von sagen wir 1000 Kindern. Wie kann ich eine Aussage darüber treffen, von wo aus geworfen werden soll, damit die 5% eingehalten werden?
Ich hoffe ich bin hier nicht falsch

