Traitement pleine largeur et demi-largeur des données CSV en Python

Comment unifier des données qui sont un mélange de katakana, de symboles, d'alphabets et de nombres.

référence:

https://qiita.com/shakechi/items/d12641d6cad01479785f

Comme il est gênant, lorsque CSV est ouvert avec des pandas, il est transformé en une fonction afin que le traitement pleine largeur et demi-largeur puisse être effectué pour chaque colonne. Mettez simplement le nom de la colonne dans la liste des colonnes = [] et c'est OK.

Que traiter: Faites en sorte que tous les katakana, symboles (espaces, etc.) et nombres soient en demi-largeur.


#Pré-installez pip installez jaconv avec un terminal ou un outil de ligne de commande.
import jaconv


def shori(column):
    list=  df[column].values.tolist()
    new_list = []
    
    for li in list:
        li = jaconv.z2h(li,digit=True, ascii=True,kana=True)
        new_list.append(li)
        
    df[column] = new_list
    
    return df[column]

##Répertoriez les noms de colonnes que vous souhaitez traiter.
columns = []

#Tournez avec pour.
for column in columns:
    shori(column)

Recommended Posts

Traitement pleine largeur et demi-largeur des données CSV en Python

Corriger les fluctuations de notation demi-largeur et pleine largeur en Python

Récapitulatif du traitement de la date en Python (datetime et dateutil)

Hashing de données en R et Python

traitement pour utiliser les données notMNIST en Python (et essayé de les classer)

Entrée / sortie de données en Python (CSV, JSON)

Représentez facilement des données graphiques dans le shell et Python

Séparation de la conception et des données dans matplotlib

CSV en Python

Statut de chaque système de traitement Python en 2020

Projet Euler # 1 "Multiple de 3 et 5" en Python

Analyse des données: application facile des statistiques descriptives et des statistiques d'estimation aux données CSV en Python

J'ai 0 ans d'expérience en programmation et je défie le traitement des données avec python

Tracer CSV de données de séries temporelles avec une valeur unixtime en Python (matplotlib)

Python: prétraitement en machine learning: gestion des données manquantes / aberrantes / déséquilibrées

Variables Python et types de données appris avec la chimio-automatique

Recevoir et afficher les données de formulaire HTML en Python

Afficher le résultat du traitement de la géométrie en Python

[Python] Permutation des lignes et des colonnes de données Numpy

Visualisation en temps réel des données thermographiques AMG8833 en Python

Lire et écrire des fichiers CSV et JSON avec Python

L'histoire de la lecture des données HSPICE en Python

Traitement Y / n avec bash, Python et Go

Environnement enregistré pour l'analyse des données avec Python

Explication de la distance d'édition et de l'implémentation en Python

Évaluation de la vitesse de sortie du fichier CSV en Python

Exemple de lecture et d'écriture de CSV avec Python

Traitement de fichiers en Python

Traitement multithread en python

Traitement de texte avec Python

Traitement des requêtes en Python

Divers traitements de Python

[Python] De l'analyse morphologique des données CSV à la sortie CSV et à l'affichage graphique [GiNZA]

traitement (python) Diagramme les coordonnées de la liste Spécifiez le nombre de fois dans draw ()

[Python] Comment nommer les données de table et les sortir avec csv (méthode to_csv)

"Régression linéaire" et "Version probabiliste de la régression linéaire" en Python "Régression linéaire de Bayes"

Résumé des outils nécessaires pour analyser les données en Python

Calcul de l'écart type et du coefficient de corrélation en Python

Liste des bibliothèques Python pour les data scientists et les data ingénieurs

Enregistrez collectivement des données dans Firestore à l'aide d'un fichier csv en Python

Différence entre Ruby et Python en termes de variables

[python] Calcul des mois et des années de différence de date / heure

Vérification des performances du prétraitement des données dans le traitement du langage naturel

Ne pas être conscient du contenu des données en python

Liste du code Python utilisé dans l'analyse de Big Data

Utilisons les données ouvertes de "Mamebus" en Python

Traitement asynchrone de Python ~ Comprenez parfaitement async et attendez ~

Traiter les données csv avec python (traitement du comptage à l'aide de pandas)

J'ai créé un programme en Python qui lit les données FX CSV et crée un grand nombre d'images de graphiques

Exemple d'obtention du nom du module et du nom de la classe en Python

Vue d'ensemble du traitement du langage naturel et de son prétraitement des données

Comparez la vitesse de lecture / écriture et la capacité de csv, pickle, joblib, parquet dans un environnement python

Consolider un grand nombre de fichiers CSV dans des dossiers avec python (données sans en-tête)

Vérifiez le temps de traitement et le nombre d'appels pour chaque processus avec python (cProfile)

Gérer les données ambiantes en Python

Traitement de texte UTF8 avec python

Jusqu'à ce que vous obteniez des données quotidiennes pour plusieurs années de stock japonais et que vous les sauvegardiez dans un seul CSV (Python)

Afficher les données UTM-30LX en Python

Traitement asynchrone (threading) en python