Dans cet article, je vais résumer les paramètres de LightGBM. Je viens de traduire le Document officiel en japonais, mais j'espère que vous le trouverez utile. (Je voudrais mettre à jour l'histoire de LightGBM lui-même de temps en temps.)
max_depth
Spécifie la profondeur de l'arborescence à utiliser. Pensons-y avec le paramètre num_leaves
.
num_leaves
C'est un paramètre qui détermine la complexité du modèle. Théoriquement, 2 ^ (max_depth
) semble être bon, mais en pratique, une valeur inférieure à 2 ^ ( max_depth
) semble être bonne. ** Si max_depth
est spécifié comme 7, est-ce que num_leaves
doit être spécifié comme environ 70-80? Était écrit. ** **
min_data_in_leaf
C'est un paramètre important pour éviter le surajustement. Il est écrit que cela sera décidé par le nombre d'échantillons de données d'apprentissage et la valeur de num_leaves
. Lorsqu'il s'agit d'un grand nombre d'échantillons, il semble qu'une valeur de centaines à milliers soit bonne.
J'ai trouvé un [site] bien organisé (https://www.codexa.net/lightgbm-beginner/). Veuillez également lire ceci!