Traitement pleine largeur et demi-largeur des données CSV en Python

Comment unifier des données qui sont un mélange de katakana, de symboles, d'alphabets et de nombres.

référence:

https://qiita.com/shakechi/items/d12641d6cad01479785f

Comme il est gênant, lorsque CSV est ouvert avec des pandas, il est transformé en une fonction afin que le traitement pleine largeur et demi-largeur puisse être effectué pour chaque colonne. Mettez simplement le nom de la colonne dans la liste des colonnes = [] et c'est OK.

Que traiter: Faites en sorte que tous les katakana, symboles (espaces, etc.) et nombres soient en demi-largeur.


#Pré-installez pip installez jaconv avec un terminal ou un outil de ligne de commande.
import jaconv


def shori(column):
    list=  df[column].values.tolist()
    new_list = []
    
    for li in list:
        li = jaconv.z2h(li,digit=True, ascii=True,kana=True)
        new_list.append(li)
        
    df[column] = new_list
    
    return df[column]

##Répertoriez les noms de colonnes que vous souhaitez traiter.
columns = []

#Tournez avec pour.
for column in columns:
    shori(column)

Recommended Posts

Traitement pleine largeur et demi-largeur des données CSV en Python
Corriger les fluctuations de notation demi-largeur et pleine largeur en Python
Récapitulatif du traitement de la date en Python (datetime et dateutil)
Hashing de données en R et Python
traitement pour utiliser les données notMNIST en Python (et essayé de les classer)
Entrée / sortie de données en Python (CSV, JSON)
Représentez facilement des données graphiques dans le shell et Python
Séparation de la conception et des données dans matplotlib
CSV en Python
Statut de chaque système de traitement Python en 2020
Projet Euler # 1 "Multiple de 3 et 5" en Python
Analyse des données: application facile des statistiques descriptives et des statistiques d'estimation aux données CSV en Python
J'ai 0 ans d'expérience en programmation et je défie le traitement des données avec python
Tracer CSV de données de séries temporelles avec une valeur unixtime en Python (matplotlib)
Python: prétraitement en machine learning: gestion des données manquantes / aberrantes / déséquilibrées
Variables Python et types de données appris avec la chimio-automatique
Recevoir et afficher les données de formulaire HTML en Python
Afficher le résultat du traitement de la géométrie en Python
[Python] Permutation des lignes et des colonnes de données Numpy
Visualisation en temps réel des données thermographiques AMG8833 en Python
Lire et écrire des fichiers CSV et JSON avec Python
L'histoire de la lecture des données HSPICE en Python
Traitement Y / n avec bash, Python et Go
Environnement enregistré pour l'analyse des données avec Python
Explication de la distance d'édition et de l'implémentation en Python
Évaluation de la vitesse de sortie du fichier CSV en Python
Exemple de lecture et d'écriture de CSV avec Python
Traitement de fichiers en Python
Traitement multithread en python
Traitement de texte avec Python
Traitement des requêtes en Python
Divers traitements de Python
[Python] De l'analyse morphologique des données CSV à la sortie CSV et à l'affichage graphique [GiNZA]
traitement (python) Diagramme les coordonnées de la liste Spécifiez le nombre de fois dans draw ()
[Python] Comment nommer les données de table et les sortir avec csv (méthode to_csv)
"Régression linéaire" et "Version probabiliste de la régression linéaire" en Python "Régression linéaire de Bayes"
Résumé des outils nécessaires pour analyser les données en Python
Calcul de l'écart type et du coefficient de corrélation en Python
Liste des bibliothèques Python pour les data scientists et les data ingénieurs
Enregistrez collectivement des données dans Firestore à l'aide d'un fichier csv en Python
Différence entre Ruby et Python en termes de variables
[python] Calcul des mois et des années de différence de date / heure
Vérification des performances du prétraitement des données dans le traitement du langage naturel
Ne pas être conscient du contenu des données en python
Liste du code Python utilisé dans l'analyse de Big Data
Utilisons les données ouvertes de "Mamebus" en Python
Traitement asynchrone de Python ~ Comprenez parfaitement async et attendez ~
Traiter les données csv avec python (traitement du comptage à l'aide de pandas)
J'ai créé un programme en Python qui lit les données FX CSV et crée un grand nombre d'images de graphiques
Exemple d'obtention du nom du module et du nom de la classe en Python
Vue d'ensemble du traitement du langage naturel et de son prétraitement des données
Comparez la vitesse de lecture / écriture et la capacité de csv, pickle, joblib, parquet dans un environnement python
Consolider un grand nombre de fichiers CSV dans des dossiers avec python (données sans en-tête)
Vérifiez le temps de traitement et le nombre d'appels pour chaque processus avec python (cProfile)
Gérer les données ambiantes en Python
Traitement de texte UTF8 avec python
Jusqu'à ce que vous obteniez des données quotidiennes pour plusieurs années de stock japonais et que vous les sauvegardiez dans un seul CSV (Python)
Afficher les données UTM-30LX en Python
Traitement asynchrone (threading) en python