Comme indiqué dans l'erreur ci-dessus, les données contiennent un type qui n'est pas NaN, inf ou float64. J'ai écrit une colonne contenant une chaîne de caractères dans pandas comme suit, et même si j'ai rempli Na, une erreur s'est produite.
df=df.drop(columns=df.select_dtypes(include='object').columns)
Il semble qu'il n'est pas possible de convertir des valeurs autres que float qui sont partiellement incluses dans la colonne. Par conséquent, après la conversion en ndarray afin qu'il puisse être utilisé avec numpy, ceux avec des valeurs autres que float ont été convertis en type float, ceux qui ne pouvaient pas être modifiés en type float ont été convertis en Na, puis les valeurs manquantes ont été converties.
X = df.iloc[:, 1:].values
y = df.iloc[:, 0].values
for i in range(X.shape[1]):
X[:,i]= pd.to_numeric(X[:,i], errors='coerce')
X1=np.nan_to_num(X)
Je ne sais pas si c'est le bon processus, mais pour le moment, l'erreur lors de la formation du modèle a disparu. Veuillez commenter s'il existe un bon moyen.
Recommended Posts