ich habe eine eigene Klasse "Spalten_hinzufüger" geschrieben. Dieser Klasse können 3 Parameter übergeben werden.
Die Klasse wird in einer Pipeline "num_spalten_pipeline" verwendet. Die Pipeline wird wiederum in einer Instanz "column_transform_instanz " der Klasse ColumnTransformer von sklearn verwendet
Pipeline: "num_spalten_pipeline"
Code: Alles auswählen
num_spalten_pipeline = Pipeline(
[
# HIER WIRD DIE SELBST ANGELEGTE KLASSE "Spalten_hinzufüger" VERWENDET
("spalten_hinzufügen", Spalten_hinzufüger(zusatzSpaltenDataframe, y_test , 0.25)),
("ausfüllen", SimpleImputer(strategy = "median")),
("skalieren", MinMaxScaler())
]
)
Code: Alles auswählen
columnTransformInstanz = ColumnTransformer([
("cat_transfromation",OneHotEncoder(),kategorischeSpalten),
#HIER WIRD DIE PIPELINE AUS DEM OBEREN CODE VERWENDET
("num_transformation",num_spalten_pipeline, numerischeSpalten),
])
ich glaube ich weiß wie ich von der Pipeline aus auf die klasse zugreife. Das mache ich nämlich mit der fit -methode.
Code: Alles auswählen
# ich bin mir damit unsicher
num_spalten_pipeline.fit(X,y, spalten_hinzufügen__zusatzSpaltenDataframe = blabla)