KeyError: '[193, 85, 39, 58, 274, 120, 152, 176, 320, 300, 37, 121, 130, 253, 12, 87, 315, 161, 46, 201, 278, 178, 237, 92, 65, 224, 243, 187, 231, 213] not in index'
Code: Alles auswählen
import pandas as pd
import numpy as np
from sklearn.model_selection import StratifiedShuffleSplit
def split_in_train_val_test(dataframe_was_gesplittet_werden_soll, größe_der_kleinen_gruppen = 0.1, spaltenname_nach_der_gesplittet_werden_soll="Kategorienummer"):
aufteilungsgruppen = dataframe_was_gesplittet_werden_soll[spaltenname_nach_der_gesplittet_werden_soll].copy()
aufteilung = StratifiedShuffleSplit(n_splits=1, test_size=größe_der_kleinen_gruppen, random_state=0)
for große_gruppe_id, kleine_gruppe_id in aufteilung.split(dataframe_was_gesplittet_werden_soll, aufteilungsgruppen):
große_gruppe = dataframe_was_gesplittet_werden_soll.loc[große_gruppe_id]
kleine_gruppe = dataframe_was_gesplittet_werden_soll.loc[kleine_gruppe_id]
return große_gruppe, kleine_gruppe
main_data, test_data = split_in_train_val_test(df)
train_data, validation_data = split_in_train_val_test(main_data)
Code: Alles auswählen
train_data, validation_data = split_in_train_val_test(main_data)