Contexte

Pandas est plus habitué à trébucher sur SQL au travail ⇨ Je veux un environnement où je peux pratiquer facilement (local, Python) ⇨pandasql

Remarques

SQLite. C'est différent de l'environnement de travail, mais c'était une bonne pratique SQL générale
Il y a d'autres pages qui présentent pandasql, mais il y a beaucoup de pages qui disent "Comment écrire sql dans pandas?", Et j'avais l'impression qu'il y avait peu de gens avec le même background que moi, alors j'ai décidé de quitter la page. fait

Installer le paquet

pip install pandasql

Exemple de code

Mettez simplement le nom de la variable du bloc de données dans le nom de la table et écrivez SQL Vous pouvez émettre SQL pour les blocs de données que vous touchez toujours avec Pandas

import pandas as pd
from pandasql import sqldf, load_meat, load_births


# get data
df_meat = load_meat()
#df_births = load_births()


# check data (if you want)
if False: # just check
    df_meat.shape
    df_meat.head(2).T
    df_meat.dtypes
    df_meat.duplicated().sum()
    df_meat.isnull().sum()
    df_meat.nunique()
    desc = df_meat.describe().T
    desc[['min','25%','50%','75%','max']]
    desc[['mean','std']]


# sql scripts 1
sql = '''
    SELECT
        *
    FROM  
        df_meat
    LIMIT 
        10;
'''
# execute sql 1
res = sqldf(sql, locals())
res


# sql scripts 2
sql = '''
    SELECT
        other_chicken,
        avg(beef) as avg_beef
    FROM  
        df_meat
    GROUP BY
        other_chicken 
    ORDER BY
        avg_beef DESC
    LIMIT
        10
    ;
'''
# execute sql 2
res = sqldf(sql, locals())
res

Lien de référence

pypi

Pour que les utilisateurs de Pandas puissent pratiquer SQL facilement

Contexte

Remarques

Installer le paquet

Exemple de code

Lien de référence