Article du Data Scientist 2e ww
Je pense que les data scientists ont de nombreuses occasions de faire des présentations et de discuter tout en regardant les données. <- Spéculation appropriée Par conséquent, je pense qu'un environnement de codage différent de vim / emacs et de l'ancien IDE est nécessaire.
Je pense que les quatre points suivants sont des spécifications requises.
Spécifications requises | vim/emacs | Rstudio/Spyder | Spotfire/Tableu | Jupyter Notebook |
---|---|---|---|---|
Peut coder | ◎ | ○ | × | ○ |
Les données peuvent être visualisées de manière interactive | × | ○ | ◎ | ○ |
Facilité d'assurer la reproductibilité | △ | △ | × | ○ |
sexy | Vu du grand public × | ○ | ◎ | ◎ |
C'est une table arbitraire qui est loin de la science des données, mais il est vrai qu'il n'y a pas de perte à utiliser le Jupyter Notebook. RStudio (python est Spyder) est bon, mais du point de vue de la reproductibilité, Jupyter Notebook, qui vous permet de laisser des commentaires avec démarque, est meilleur. Il est recommandé car vous pouvez enregistrer le processus de codage même si vous n'êtes pas un data scientist.
――Python est livré avec un shell interactif depuis le début, mais les personnes qui n'en étaient pas satisfaites ont créé un shell interactif appelé IPython (Interactive Python). -Extrait de Comment utiliser IPython
- Codage orienté cellule: peut être exécuté collectivement dans des unités appelées cellules
- Complétion en onglet des mots réservés, des variables, des noms de modules, etc. --Investigate Objects: Add? To the object name for more information --Diverses commandes magiques: Vérifiez la vitesse d'exécution avec
%% timeit
, etc. --Commandes Shell: les lignes commençant par! Telles que! Ls
peuvent être exécutées comme des commandes shell --Réutilisation des entrées et sorties: les entrées et sorties des cellules sont stockées dans des variables appelées In et Out
--Dans le projet IPython, un notebook IPython qui peut entrer et sortir IPython à partir du Web est apparu.
Par conséquent,
--Dans différentes langues --Facile à coder
** C'est une application qui a la reproductibilité, le stockage et le partage du processus d'analyse **. C'est une sorte de note d'expérimentation électronique. (Il n'y a pas de témoin)
Si vous mettez anaconda, tout est inclus. La construction de l'environnement d'anaconda peut être trouvée à ici.
Démarrez le terminal dans un dossier approprié et appuyez sur la commande suivante.
jupyter notebook
C'est OK si le navigateur démarre et que la page Jupyter est affichée à http: // localhost: 8888
.
Ancien article Intégration
Cela fonctionne pour le moment même si vous ne le définissez pas. Si cela ne vous dérange pas, veuillez l'ignorer.
alias
jupyter notebook
est assez long, vous pouvez donc créer une note
ou un alias.
Il semble que la zone de configuration a considérablement changé dans jupyter 4.0, donc ceux qui l'utilisent depuis longtemps devraient la vérifier. https://jupyter.readthedocs.org/en/latest/migrating.html
jupyter notebook --generate-config
#>>> Writing default config to: ~/.jupyter/jupyter_notebook_config.py
python -c "from notebook.auth import passwd;print(passwd())"
#>>> Enter password:
#>>> Verify password:
#>>> 'sha1:........'
Faites une copie du mot de passe de hachage commençant par «sha1: ...».
vi ~/.jupyter/jupyter_notebook_config.py
Trouvez les paramètres ci-dessous, décommentez-les si nécessaire et entrez les valeurs.
Paramètres | valeur initiale | commentaire |
---|---|---|
c.NotebookApp.ip | 'localhost' | Modifiez si vous souhaitez accéder à partir d'autres ordinateurs clients.'*'Entièrement ouvert. |
c.NotebookApp.notebook_dir | null | Spécifiez le répertoire actuel de Jupyter. Il est bon de le préciser quelque part. |
c.NotebookApp.open_browser | True | Voulez-vous ouvrir le navigateur au démarrage? Définissez le serveur sans X sur False. |
c.NotebookApp.port | 8888 | Si vous utilisez 8888 ailleurs, spécifiez un port différent. |
c.NotebookApp.password | null | Si vous entrez la chaîne de caractères de hachage que vous avez copiée précédemment, l'authentification par mot de passe sera appliquée. |
Il existe également d'autres paramètres SSL, alors consultez la documentation si vous devez publier sur le Web.
Si vous décrivez la bibliothèque à charger en premier dans ~ / .ipython / profile_default / startup
, elle sera lue ensemble au démarrage du noyau.
La magie cellulaire peut également être décrite au format ipy, il est donc bon de décrire également % matplotlin inline
.
Si vous écrivez la manière d'écrire préférée de seaborn, ce sera plus facile après cela.
Si vous écrivez trop, le démarrage du noyau sera retardé, ce qui est frustrant. (Les pandas sont relativement lourds)
Exemple:
00_init.ipy
%matplotlib inline
from matplotlib import pyplot as plt
import seaborn as sns
import numpy as np
import pandas as pd
extension Jupyter Notebookn a également une extension. Je vais l'omettre car il est résumé dans l'article suivant. Ajoutez une extension pour créer un environnement Jupyter plus confortable [jupyter notebook extensions python-markdown(markdown + jinja2)] (http://qiita.com/ksomemo/items/ba0f24daae2276ffd9b2)
RISE
Il existe une extension intéressante qui vous permet de présenter sur votre notebook Jupyter.
git clone https://github.com/damianavila/RISE
cd RISE
python setup.py install
Un bouton de diaporama sera ajouté en haut à droite de la page du bloc-notes Si vous sélectionnez Diaporama avec le bouton de la barre d'outils Cellule sur la page du bloc-notes, vous pouvez spécifier la distance à laquelle vous souhaitez faire une diapositive.
Jupyter Content Management Extensions (Post-scriptum 3/21) J'ai oublié qu'IBM a créé une extension super utile. Si vous mettez cela, vous pouvez effectuer une recherche en texte intégral dans le fichier notebook de jupyter. Blog d'introduction IBM Il est publié sur pip donc il est facile à installer.
pip install jupyter_cms
jupyter cms install --user -s
jupyter cms activate
jupyter notebook
Si vous lancez le notebook après jupyter cms activate
, un bouton de recherche sera ajouté à l'écran de l'arborescence.
Vous pouvez également rechercher des codes subordonnés et des commentaires, ce qui améliore la réutilisabilité.
La recherche est également assez flexible (http://whoosh.readthedocs.org/en/latest/querylang.html).
(Je serais plus heureux s'il y avait un aperçu ...)
De plus, il existe également des extensions qui vous permettent de créer des tableaux de bord avec jupyter notebook. Diapositive JupyterDay NYC github
(3/21 postscript jusqu'à ici)
Il y a un bon article. Jupyter Beginning
(Ajouté le 13 avril 2016) Pour changer d'environnement, entrez jupyter_environment_kernels. J'ai découvert dans un merveilleux article ici.
Recommended Posts