Pour que les utilisateurs de Pandas puissent pratiquer SQL facilement

Contexte

Pandas est plus habitué à trébucher sur SQL au travail ⇨ Je veux un environnement où je peux pratiquer facilement (local, Python) ⇨pandasql

Remarques

Installer le paquet

pip install pandasql

Exemple de code

Mettez simplement le nom de la variable du bloc de données dans le nom de la table et écrivez SQL Vous pouvez émettre SQL pour les blocs de données que vous touchez toujours avec Pandas

import pandas as pd
from pandasql import sqldf, load_meat, load_births


# get data
df_meat = load_meat()
#df_births = load_births()


# check data (if you want)
if False: # just check
    df_meat.shape
    df_meat.head(2).T
    df_meat.dtypes
    df_meat.duplicated().sum()
    df_meat.isnull().sum()
    df_meat.nunique()
    desc = df_meat.describe().T
    desc[['min','25%','50%','75%','max']]
    desc[['mean','std']]


# sql scripts 1
sql = '''
    SELECT
        *
    FROM  
        df_meat
    LIMIT 
        10;
'''
# execute sql 1
res = sqldf(sql, locals())
res


# sql scripts 2
sql = '''
    SELECT
        other_chicken,
        avg(beef) as avg_beef
    FROM  
        df_meat
    GROUP BY
        other_chicken 
    ORDER BY
        avg_beef DESC
    LIMIT
        10
    ;
'''
# execute sql 2
res = sqldf(sql, locals())
res

Lien de référence

pypi

Recommended Posts

Pour que les utilisateurs de Pandas puissent pratiquer SQL facilement
Convertir 202003 en 2020-03 avec les pandas
Une bibliothèque "apywrapper" qui développe facilement un wrapper pour l'API RESTful
Conversion de Pandas DataFrame en System.Data.DataTable à l'aide de Python pour .NET
Méthode de confirmation de la pratique / des données [Pandas] facile à comprendre pour les diplômés du secondaire