Je fais généralement ** l'analyse de données et la construction de modèles ** principalement sur Jupyter. Notez combien de fois vous devez le rechercher. (Mis à jour de temps en temps)
Les modules qui ont déjà été importés seront mis en cache ou ne seront pas mis à jour même s'ils sont à nouveau importés normalement. ** Vous pouvez recharger (réimporter) avec ce qui suit. ** **
import importlib
importlib.reload(hoge)
#hoge est un module importé
Je ne le savais que récemment, et je l'ai redémarré à chaque fois, donc c'est vraiment une révélation.
Une autre option est Comment mettre à jour automatiquement les modules avec % autoreload
.
Si vous avez plusieurs serveurs en cours d'exécution, vous ne savez souvent pas quel onglet est le notebook sur quel serveur. Vous pouvez modifier le nom de l'onglet comme suit.
Exécutez ce qui suit dans Jupyter
%%javascript
document.title='Jupyter-GPU'
Alternativement, il peut être spécifié au moment de la construction.
jupyter lab build --name='Jupyter-GPU'
Référence: https://github.com/jupyterlab/jupyterlab/issues/4422#issuecomment-395962448
Si vous n'êtes pas particulièrement attentif aux polices, ** japanize-matplotlib est le moyen le plus rapide. ** **
pip install japanize-matplotlib
import matplotlib.pyplot as plt
import japanize_matplotlib
plt.plot([1, 2, 3, 4])
plt.xlabel('La joie d'utiliser facilement le japonais')
plt.show()
Il y a deux horaires pour démarrer le débogueur.
** Spécifiez un point d'arrêt et démarrez le débogueur ** Insérez le code ci-dessous
from IPython.core.debugger import Pdb; Pdb().set_trace()
** Lancer le débogueur en cas de bogue ** S'applique uniquement à des cellules spécifiques
#Placez-le au début de la cellule que vous souhaitez déboguer
%%debug
S'applique à l'ensemble du bloc-notes
#Mettez-le quelque part dans le cahier
%pdb on
#C'est à ce moment que vous souhaitez désactiver le mode de détection de bogue
%pdb off
[Jupyter Notebook / Lab] Trois façons de déboguer sur Jupyter [Pdb]
Je me demande si je peux y aller une fois
from tqdm.auto import tqdm
import numpy as np
#Joindre dans tqdm
for i in tqdm(np.arange(1, 100000, 1)):
#Traitez ici
pass
import pandas as pd
import numpy as np
from tqdm.auto import tqdm
# set description
tqdm.pandas(desc="Faire ça")
# apply
df = pd.DataFrame({'hoge': np.arange(1, 100000, 1)})
df['hoge'] = df['hoge'].progress_apply(lambda x: x + 1)
Augmentez le nombre d'éléments pouvant être affichés et le nombre maximum de caractères pouvant être affichés dans une cellule.
import pandas as pd
pd.set_option("display.max_colwidth", 500) #500 caractères dans 1 cellule
pd.set_option("display.max_rows", 100) #Peut afficher 100 lignes
** * Si set_option ne fonctionne pas dans JupyterLab, cela fonctionne bien si vous affichez les enregistrements sous max_rows
comme df [: 100]
(d'après mon expérience personnelle) **
Si vous souhaitez éviter l'omission d'une seule cellule spécifique, procédez comme suit (@chik_taks m'a dit!)
with pd.option_context('display.max_colwidth', 200):
display(df)
Vous pouvez générer le DataFrame sous forme de démarque et le copier. Je l'utilise sobrement
pip install pytablewriter
import pytablewriter
writer = pytablewriter.MarkdownTableWriter()
writer.from_dataframe(df)
writer.write_table()
# | col1 | col2 |
# |------|--------|
# |hoge1 |line1 |
# |hoge2 |line2 |
Recommended Posts