Un débutant en Python a d'abord essayé une analyse rapide et facile des données météorologiques des 10 dernières années.

introduction

J'ai récemment commencé à étudier Python. Comme c'est un gros problème, j'aimerais faire un article utile pour ceux qui commencent tout juste à toucher Python comme moi. Comme je n'ai jamais écrit Python, cette fois, j'aimerais effectuer une analyse de données simple tout en comprenant la syntaxe de python et le type de bibliothèque existant.

Livre de référence: [Prêt à l'emploi! Peut être pratiqué en entreprise! Comment créer des applications d'IA / d'apprentissage automatique / d'apprentissage en profondeur avec Python](https://www.amazon.co.jp/%E3%81%99%E3%81%90% E3% 81% AB% E4% BD% BF% E3% 81% 88% E3% 82% 8B-% E6% A5% AD% E5% 8B% 99% E3% 81% A7% E5% AE% 9F% E8 % B7% B5% E3% 81% A7% E3% 81% 8D% E3% 82% 8B-Python% E3% 81% AB% E3% 82% 88% E3% 82% 8B-AI% E3% 83% BB % E6% A9% 9F% E6% A2% B0% E5% AD% A6% E7% BF% 92% E3% 83% BB% E6% B7% B1% E5% B1% A4% E5% AD% A6% E7 % BF% 92% E3% 82% A2% E3% 83% 97% E3% 83% AA% E3% 81% AE% E3% 81% A4% E3% 81% 8F% E3% 82% 8A% E6% 96 % B9-% E3% 82% AF% E3% 82% B8% E3% 83% A9% E9% A3% 9B% E8% A1% 8C% E6% 9C% BA / dp / 4802611641)

Procédure et préparation

** Environnement d'exécution ** Google Colaboratory

** Bibliothèque à utiliser **

la mise en oeuvre

Tout d'abord, préparez les données nécessaires à l'analyse.

Préparation des données

Pour analyser les données météorologiques, téléchargez l'ensemble de données à partir de l'URL suivante. Vous pouvez le télécharger directement, mais installons-le en utilisant une bibliothèque appelée urllib.

#Accéder à une fonction appelée urlretrieve depuis urllib
from urllib.request import urlretrieve
#Préparez une variable appelée nom de fichier. Nom du fichier tempreture.csv
filename = "tempreture.csv"
#Spécifiez l'URL
url = "https://raw.githubusercontent.com/kujirahand/mlearn-sample/master/tenki2006-2016/kion10y.csv"
#Lisez l'url et la température décrites dans la ligne ci-dessus.Enregistrez les données dans un fichier nommé csv
urlretrieve(url, filename)

Ensuite, essayez d'afficher les données acquises

Pandas est une bibliothèque pour une analyse efficace des données en Python. Pandas vous permet d'effectuer facilement des tâches d'analyse de données telles que le chargement de données, l'affichage de statistiques et la création de graphiques.

#Lors de l'importation et de l'utilisation de pandas, il semble qu'il soit courant d'écrire pd, alors utilisez pd.
import pandas as pd
#Pour voir le contenu du fichier csv obtenu précédemment, lisez_csv()Utilisez le
pd.read_csv(filename)

À la suite de l'exécution, j'ai constaté que les données étaient de 4018 lignes x 6 colonnes.

スクリーンショット 2019-12-13 16.10.33.png

Vérifions la valeur moyenne de la température


#[Transformez les données des 10 dernières années en un type de dictionnaire et simplifiez la programmation]

history = {}
#Obtenez l'index et les données pour chaque ligne. Identique à la fonction enumurate dans d'autres langues
for i, row in df.iterrows():
  #Remplacez la température mensuelle dans chaque variable
  month, day, tempreture = (int(row['Mois']), int(row['journée']), float(row['Température']))
  #clé de "12/Donne-lui un aspect de 25 "
  key = str(month) + "/" + str(day)
  #Le jugement est fait pour que la même clé ne soit pas dupliquée
  if not(key in history): history[key] = []
  #S'il n'y a pas de duplication, ajoutez-le à l'historique
  history[key] += [tempreture]

# [Trouvez la valeur moyenne]

average = {}
#Bouclez l'historique et obtenez la clé
for key in history:
  #Liez la valeur moyenne calculée à la clé et ajoutez-la à la moyenne
  average[key] = sum(history[key]) / len(history[key])
  result = average[key]
  # print("{0}: {1}".format(key, result))

Vérifions la température moyenne d'un jour

import math

#fonction pour vérifier le type(Pour n'accepter que les chaînes de caractères)
def isString(date):
  return type(date) is str

#Obtenir la valeur moyenne de la date spécifiée à partir de la moyenne du type de dictionnaire
def getTempreture(date):
  if isString(date):
    return average[date]

tempreture = getTempreture("12/25")
value = round(tempreture)
#Type de conversion int en chaîne
print(str(value)+ "Diplôme")

Essayez de dessiner

#Importez matplotlib pour dessiner le graphique
import matplotlib.pyplot as plt

#Traitement pour diviser les données de température par mois
tempreture_per_month = df.groupby(['Mois'])['Température']
#Additionnez les données de température divisées mensuellement et divisez-les par le nombre de données par mois
average_tempreture = tempreture_per_month.sum() / tempreture_per_month.count()
#dessiner
average_tempreture.plot()

J'ai pu dessiner. スクリーンショット 2019-12-13 16.31.31.png

Impressions

――Il est recommandé aux débutants de commencer avec Google Colaboratory car cela évite les problèmes d'installation et autres travaux. «J'ai pu manipuler et dessiner des données plus facilement que prévu et j'ai appris à quel point la bibliothèque python est géniale.

Depuis que j'ai touché python pour la première fois, il y a encore beaucoup de choses que je ne comprends pas, mais je vais continuer à apprendre pour pouvoir effectuer progressivement des analyses avancées.

Recommended Posts

Un débutant en Python a d'abord essayé une analyse rapide et facile des données météorologiques des 10 dernières années.
Le premier débutant en programmation à essayer une analyse de données simple avec programmation
Remarque: obtenez les premier et dernier éléments de Python OrderedDict de manière non destructive
[Python] Comment obtenir le premier et le dernier jour du mois
L'histoire du retour au front pour la première fois en 5 ans et de la refactorisation de Python Django
Pandas du débutant, par le débutant, pour le débutant [Python]
Résumé du livre électronique Python utile pour l'analyse de données gratuite
J'ai essayé la programmation python pour la première fois.
Environnement enregistré pour l'analyse des données avec Python
Prise en compte des forces et faiblesses de Python
[Introduction à Python] Comment obtenir l'index des données avec l'instruction for
Jusqu'à ce que vous obteniez des données quotidiennes pour plusieurs années de stock japonais et que vous les sauvegardiez dans un seul CSV (Python)
Liste des bibliothèques Python pour les data scientists et les data ingénieurs
J'ai essayé python pour la première fois avec heroku
Une comparaison rapide des bibliothèques de test Python et node.js
J'ai essayé la même analyse de données avec kaggle notebook (python) et PowerBI en même temps ①
[Comprendre au plus court] Principes de base de Python pour l'analyse des données
Créer un environnement Python et transférer des données vers le serveur
<Python> Construisez un serveur dédié pour l'analyse des données Jupyter Notebook
[Python] J'ai essayé de collecter des données en utilisant l'API de wikipedia
Google recherche la chaîne sur la dernière ligne du fichier en Python
Python pour l'analyse des données Chapitre 4
Python pour l'analyse des données Chapitre 3
[Premier grattage] J'ai essayé de créer un personnage VIP pour Smash Bra [Beautiful Soup] [En plus, analyse de données]
L'histoire de la sortie d'un outil de vérification de texte créé par Python sur GitHub x CircleCI pour la première fois
Mémorandum de l'outil de gestion de paquets Python ez_setup
Créer et tester un environnement CI pour plusieurs versions de Python
Une analyse simple des données de Bitcoin fournie par CoinMetrics en Python
L'histoire de la création d'un pilote standard pour db avec python.
Pratique de l'analyse de données par Python et pandas (Tokyo COVID-19 data edition)
Créer un Ubuntu de démarrage USB avec un environnement Python pour l'analyse des données
L'histoire de Python et l'histoire de NaN
First Python 3 ~ Le début de la répétition ~
Reconnaître le contour et la direction d'un objet façonné avec OpenCV3 et Python3 (analyse des composants principaux: PCA, vecteur propre)
Modèle de prétraitement pour l'analyse des données (Python)
J'ai essayé d'obtenir et d'analyser les données statistiques de la nouvelle Corona avec Python: données de l'Université John's Hopkins
Voir python pour la première fois
Calculer l'itinéraire le plus court d'un graphe avec la méthode Dyxtra et Python
SE, débutant en analyse de données, apprend avec l'équipe de science des données vol.1
Résumer les principaux points de croissance hack des services web et les points d'analyse
Apprendre le latin dans le but d'écrire un programme d'analyse de phrases latines (partie 1)
L'histoire d'une personne qui a commencé à viser un data scientist depuis un débutant
J'ai 0 ans d'expérience en programmation et je défie le traitement des données avec python
J'ai essayé de vérifier et d'analyser l'accélération de Python par Cython
Créez rapidement un environnement python pour le Deep Learning / Data Science (Windows)
J'ai essayé d'effectuer une analyse de cluster de clients à l'aide des données d'achat
Une note utile lors de l'utilisation de Python après une longue période
J'ai mesuré la vitesse de la notation d'inclusion de liste, pendant et pendant avec python2.7.
Obtenez la clé pour la migration de la deuxième couche de données JSON avec python
Depuis que je suis libre, l'ingénieur front-end a essayé Python (v3.7.5) pour la première fois
J'ai essayé tensorflow pour la première fois
Connectez beaucoup de Python ou et et
[Python] Première analyse de données / apprentissage automatique (Kaggle)
MongoDB avec Python pour la première fois
Introduction facile de la série python3 et d'OpenCV3
Différentes façons de lire la dernière ligne d'un fichier csv en Python