Was bedeutet bc.data und bc.target aus dem Beispiel?

Wenn du dir nicht sicher bist, in welchem der anderen Foren du die Frage stellen sollst, dann bist du hier im Forum für allgemeine Fragen sicher richtig.
Antworten
jabelio
User
Beiträge: 9
Registriert: Dienstag 6. April 2021, 16:11

Hallo,
ich beschäftige mich momentan mit dem F1 Score und bin auf dieses Beispiel gestoßen.
Ich blicke nicht ganz durch, was X = bc.data und y = bc.target sein sollen.
Dankeschön

Code: Alles auswählen

from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.ensemble import RandomForestClassifier
from sklearn.pipeline import make_pipeline
#
# Load the breast cancer data set
#
bc = datasets.load_breast_cancer()
X = bc.data
y = bc.target
#
# Create training and test split
#
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.30, random_state=1, stratify=y)
#
# Create the pipeline
#
pipeline = make_pipeline(StandardScaler(),
RandomForestClassifier(n_estimators=10, max_features=5, max_depth=2, random_state=1))
#
# Fit the Pipeline estimator
#
pipeline.fit(X_train, y_train)
Benutzeravatar
kbr
User
Beiträge: 1487
Registriert: Mittwoch 15. Oktober 2008, 09:27

bc ist der Rückgabewert von datasets.load_breast_cancer() und bc.data und bc.target sind Attribute von diesem. Worum es sich dabei im Detail handelt findest Du sicher in der Doku zu sklearn.
jabelio
User
Beiträge: 9
Registriert: Dienstag 6. April 2021, 16:11

Ja, aber wofür soll das data bzw. target stehen?
Benutzeravatar
sparrow
User
Beiträge: 4193
Registriert: Freitag 17. April 2009, 10:28

Das hat @kbr doch geschrieben: da musst du in die entsprechende Dokumentation von sklearn schauen.
jabelio
User
Beiträge: 9
Registriert: Dienstag 6. April 2021, 16:11

The data matrix. If as_frame=True, data will be a pandas DataFrame.
The classification target. If as_frame=True, target will be a pandas Series.

Das sagt mir leider gar nichts.
Benutzeravatar
sparrow
User
Beiträge: 4193
Registriert: Freitag 17. April 2009, 10:28

Dafür muss man wissen, was Pandas ist.
Das Tutorial habe ich dir bereits in dem anderen Thread verlinkt. Schade, dass du es nicht gelesen hast.
Antworten