Ce blog est la troisième entrée du Calendrier de l'Avent jupyter notebook 2016.
Il existe un service d'apprentissage en ligne appelé Udemy et "Practical Python Data Science" coûtait 2 300 yens. Alors j'ai essayé. Dans le cours de 17,5 heures, Shingo Tsuji, l'auteur du "Python Start Book", a expliqué en japonais. C'est un cours très facile à comprendre. Je n'ai pas encore écouté toutes les sections, mais j'aimerais vous présenter ce cours.
Étant donné que ce cours utilise essentiellement Jupyter Notebook pour expliquer presque toutes les sections, quelles sont les fonctionnalités de Jupyter Notebook présentées dans ce cours? Je vais vous présenter en échangeant.
La première partie consiste à expliquer comment utiliser la bibliothèque d'analyse de données de Python. Après cela, l'analyse et la visualisation des données sont expliquées, et dans la seconde moitié, une analyse plus pratique des données est expliquée à l'aide de données réelles.
Anaconda Il s'agit d'un package de bibliothèques fourni par Continuum Analytics pour l'analyse des données. Jupyter Notebook est également inclus dans ce package. Si vous installez Anaconda, un logiciel de gestion de packages Python appelé pip est inclus, vous pouvez donc également l'utiliser pour installer les bibliothèques requises. Je pense qu'un super débutant comme moi devrait d'abord installer cet Anaconda afin de préparer l'environnement d'analyse de données pour Python.
Après avoir installé Anaconda, démarrez-le simplement dans le répertoire de travail comme indiqué ci-dessous pour démarrer le navigateur.
$ ipython notebook
<img src="lec28.png ">
%matplotlib inline
Les sections 3 et au-delà de ce cours utilisent Jupyter pour expliquer les bases de la science des données. Il coulera sous la forme de l'introduction de la bibliothèque.
NumPy
Les tableaux NumPy jouent un rôle central dans l'analyse des données
Pandas
Une bibliothèque de données très souvent utilisée lors de l'analyse de données avec Python --Series est une bibliothèque très populaire --DataFrame est un type de données très populaire
De cette façon, vous pouvez également lire les données du presse-papiers.
from pandas import Series, DataFrame
import pandas as pd
#Collez les données que vous souhaitez lire dans le presse-papiers
nfl_frame = pd.read_clipboard()
nfl_frame
Kaggle est une plateforme de modélisation prédictive et de méthodes analytiques et sa société d'exploitation où les entreprises et les chercheurs publient des données et les statisticiens et les analystes de données du monde entier se disputent le modèle optimal. Voir aussi: https://ja.wikipedia.org/wiki/Kaggle
from pandas.io.data import DataReader
from datetime import datetime
tech_list = ['AAPL','GOOG','MSFT','AMZN']
end = datetime.now()
start = datetime(end.year - 1,end.month,end.day)
for stock in tech_list:
globals()[stock] = DataReader(stock,'yahoo',start,end)
AAPL.describe()
Comme mentionné ci-dessus, le contenu est un peu différent du contenu lié à Jupyter Notebook, mais j'espère que ce sera utile. Je pense que "Practical Python Data Science" vaut plus de 2 300 yens. Le contenu est très facile à comprendre pour un super débutant comme moi, je vous recommande donc de le prendre.
Recommended Posts