Mémorandum of scraping & machine learning [technique de développement] par Python (chapitre 4)

Chapitre 4

lang-train.py Lorsque j'ai exécuté lang-train.py à la page 166, j'ai obtenu l'affichage suivant.

root@057e36518a17:/c/Users/yuki/my_dir/wap_scraping/src/ch4# python3 lang-train.py
/opt/conda/lib/python3.5/site-packages/sklearn/utils/validation.py:395: DeprecationWarning: Passing 1d arrays as data is deprecated in 0.17 and will raise ValueError in 0.19. Reshape your data either using X.reshape(-1, 1) if your data has a single feature or X.reshape(1, -1) if it contains a single sample.
  DeprecationWarning)
Traceback (most recent call last):
  File "lang-train.py", line 45, in <module>
    clf.fit(data["freqs"], data["labels"])
  File "/opt/conda/lib/python3.5/site-packages/sklearn/svm/base.py", line 151, in fit
    X, y = check_X_y(X, y, dtype=np.float64, order='C', accept_sparse='csr')
  File "/opt/conda/lib/python3.5/site-packages/sklearn/utils/validation.py", line 521, in check_X_y
    ensure_min_features, warn_on_dtype, estimator)
  File "/opt/conda/lib/python3.5/site-packages/sklearn/utils/validation.py", line 424, in check_array
    context))
ValueError: Found array with 0 feature(s) (shape=(1, 0)) while a minimum of 1 is required.

Solution

Ce n'était pas un gros problème. Puisque le texte indiquait que lang.zip devait être décompressé sous lang, il était littéralement décompressé sous "lang". Mais dans l'exemple de code

data = load_files("./lang/train/*.txt")
test = load_files("./lang/test/*.txt")

Il y a. Puisque lang-train.py fonctionnait sur ch4, cela signifie que nous n'avons pas pu charger les données que nous voulions.

Exemple de manteau

"./lang/train/*.txt"

ne pas

"./lang/lang/train/*.txt"

J'y ai pensé, mais je ne voulais pas trop jouer avec l'exemple de code, Le problème a été résolu en définissant la destination de décompression directement sous "ch4" au lieu de sous "lang".

lang-Webapp.py Ce n'est pas résolu.

J'ai exécuté la commande suivante au démarrage de docker.

$ docker run -it -v $HOME:$HOME -p 8080:8080  <CONTAINER ID> /bin/bash

Après le démarrage, je suis passé au ch4 avec cd, puis j'ai exécuté la commande suivante. Le résultat est le suivant

$ python3 -m http.server --cgi 8080
Serving HTTP on 0.0.0.0 port 8080 ...

Même si vous ouvrez un navigateur Web dans cet état et spécifiez "http: //localhost:8080/cgi-bin/lang-Webapp.py", la page ne sera pas affichée. image

Que devrais-je faire? ..

Recommended Posts

Mémorandum of scraping & machine learning [technique de développement] par Python (chapitre 4)
Mémorandum of scraping & machine learning [technique de développement] par Python (chapitre 5)
Mémorandum d'extraction par requête python bs4
Touchons une partie de l'apprentissage automatique avec Python
Mémo d'apprentissage Python pour l'apprentissage automatique par Chainer Chapitre 13 Bases du réseau neuronal
Mémo d'apprentissage Python pour l'apprentissage automatique par Chainer jusqu'à la fin du chapitre 2
Créer un environnement de développement d'applications d'apprentissage automatique avec Python
Un résumé de l'apprentissage automatique Python pour débutant est très concis.
[Python] Un mémorandum de belle soupe4
Résumé de l'apprentissage automatique par les débutants de Python
Mémo d'apprentissage "Scraping & Machine Learning avec Python"
Mémo d'apprentissage Python pour l'apprentissage automatique par Chainer Chapitre 10 Introduction à Cupy
Mémo d'apprentissage Python pour l'apprentissage automatique par Chainer Chapitre 9 Introduction à scikit-learn
[Mémo d'apprentissage] Bases de la classe par python
Mémo d'étude Python & Machine Learning ④: Machine Learning par rétro-propagation
Créer un environnement de développement pour l'apprentissage automatique
Mémorandum du processus de suppression de chaîne python
Mémo d'apprentissage Python pour l'apprentissage automatique par Chainer Chapitre 13 Formation sur les réseaux neuronaux ~ Chainer terminé
Mémo d'apprentissage automatique d'un ingénieur débutant Partie 1
Classification des images de guitare par apprentissage automatique Partie 1
Apprentissage automatique à partir de Python Personal Memorandum Part2
Mémo d'étude Python & Machine Learning ⑤: Classification d'Ayame
Apprentissage automatique à partir de Python Personal Memorandum Part1
Un mémorandum sur l'appel de Python à partir de Common Lisp
Mémo d'étude Python & Machine Learning ②: Introduction de la bibliothèque
À propos du contenu de développement de l'apprentissage automatique (exemple)
Obtenez la liste "J'aime" de Qiita en grattant
Analyse de l'utilisation de l'espace partagé par l'apprentissage automatique
[Français] scikit-learn 0.18 Introduction de l'apprentissage automatique par le didacticiel scikit-learn
Mémo d'apprentissage automatique d'un ingénieur débutant Partie 2
Estimation raisonnable du prix de Mercari par apprentissage automatique
Classification des images de guitare par apprentissage automatique, partie 2
Histoire de l'analyse de données par apprentissage automatique
Créer un environnement d'apprentissage automatique Python avec des conteneurs
Chapitre 6 Apprentissage supervisé: Classification pg212 ~ [Apprenez en vous déplaçant avec Python! Nouveau manuel d'apprentissage automatique]
Mise en place d'un modèle de prédiction des taux de change (taux dollar-yen) par machine learning
Opérations de base sur les blocs de données écrites par des débutants au cours d'une semaine d'apprentissage de Python
Un mémorandum de méthode souvent utilisé dans l'apprentissage automatique utilisant scikit-learn (pour les débutants)
Prédire le temps objectif d'un marathon complet avec l'apprentissage automatique-③: j'ai essayé de visualiser les données avec Python-
[Balisage recommandé dans le machine learning # 2.5] Modification du script de scraping
Exécutez un pipeline de machine learning avec Cloud Dataflow (Python)
Créer un environnement Python d'apprentissage automatique sur Mac OS
Mémo d'apprentissage Python pour l'apprentissage automatique par Chainer chapitres 1 et 2
Installation de TensorFlow, une bibliothèque d'apprentissage automatique de Google
[Apprentissage automatique] "Détection d'anomalies et détection de changement" Dessinons la figure du chapitre 1 en Python.
Résumé du flux de base de l'apprentissage automatique avec Python
Regrouper par éléments consécutifs d'une liste en Python
Mémo de construction d'environnement d'apprentissage automatique par Python
[Python] Chapitre 01-02 À propos de Python (Exécution et installation de l'environnement de développement)
MALSS (introduction), un outil qui prend en charge l'apprentissage automatique en Python
Une méthode concrète pour prédire les courses de chevaux et simuler le taux de récupération par apprentissage automatique
Un exemple de mécanisme qui renvoie une prédiction par HTTP à partir du résultat de l'apprentissage automatique
Créer un environnement d'étude d'apprentissage automatique Python avec macOS Sierra
Programmation Python Machine Learning Chapitre 2 Problèmes de classification - Résumé de la formation à l'algorithme d'apprentissage automatique
Un mémorandum où je suis tombé sur mon HEROKU & Python personnel (Flask)
Collectez des données d'apprentissage automatique en grattant des bases de données publiques biosourcées
[Python] Comment créer une liste de chaînes de caractères caractère par caractère