Comprendre pourquoi vous faites des hypothèses avec la régression linéaire Faire une ligne d'hypothèse Comprendre la fonction de coût qui peut identifier les hypothèses proches de la bonne réponse
le terme | La description |
---|---|
Linear Regression | Régression linéaire |
Hypothesis | hypothèse |
le terme | La description |
---|---|
H(x) | Hypothèse |
Wx | Incliné(W (Est-ce une chaîne peu claire?)) |
b | déviation(bias) |
Par souci de simplicité, nous avons préparé les données d'entraînement suivantes.
x | y |
---|---|
1 | 1 |
2 | 2 |
3 | 3 |
Ceci est exprimé linéairement comme suit.
Il existe de nombreuses choses linéaires et prévisibles dans le monde. Par exemple:
Si vous souhaitez estimer le loyer d'une maison (plus la maison est grande, plus le loyer est élevé) Si vous souhaitez prédire vos notes d'examen (plus vous accordez de temps pour étudier, plus vos notes sont élevées)
Etc.
Faisons une ligne pour faire une hypothèse Données d'entraînement x et données arbitraires Faites-le en ajoutant W et b.
Dans la formule, écrivez comme suit.
La figure ci-dessous est une version linéaire de trois hypothèses.
Parce que les données d'entraînement sont x = 1, y = 1, x = 2, y = 2, x = 3, y = 3 Vous pouvez voir que la ligne bleue s'applique aux données d'entraînement. (Il n'y a que trois hypothèses) Mais nous avons besoin d'un moyen de le trouver mathématiquement afin qu'il puisse être compris par l'ordinateur.
Par conséquent, nous utilisons quelque chose appelé Fonction de coût.
En gros, fonction de coût Il s'agit de comparer la distance debout (y) de la «ligne hypothétique» et de la «ligne correcte» et d'identifier que plus la distance est courte, plus la ligne sera correcte.
Comparez les distances debout comme indiqué dans la figure ci-dessous.
"Ligne faite par hypothèse" - "Distance debout (y)" La formule que je viens de dire est la suivante.
Cependant, avec cela Si y est plus grand que la ligne hypothétique Ce sera négatif, alors carrément.
L'application de cette formule à ces données d'entraînement donne:
Les données d'entraînement sont de trois, donc je les ai divisées par trois.
Pour l'exprimer sous la forme d'une expression pouvant être utilisée pour des millions de données d'entraînement, exprimez-la comme suit.
Où H est C'était le résultat de Je pense donc que cela peut être exprimé comme suit.
De plus, plus la valeur de coût (W, b) est petite, plus l'hypothèse correcte peut être identifiée. Par conséquent, il est exprimé comme suit.
Créez une ligne hypothétique en utilisant des données d'entraînement et des valeurs W, b arbitraires Plus la valeur Coût (W, b) est petite, plus la ligne correcte est proche
Recommended Posts