R: Utilisez le japonais au lieu du japonais dans le script

En R, s'il y a du japonais dans le script, cela cause parfois des inconvénients, nous le traitons donc de la manière suivante.

# R
intToUtf8(c(12371, 12435, 12395, 12385, 12399))
## [1] "Bonjour"

À quel numéro correspond le caractère souhaité

# R
utf8ToInt("Bonjour")
[1] 12371 12435 12395 12385 12399

Je l'ai vérifié une fois et essayé de l'écrire dans le script sans utiliser le japonais.

Vous pouvez également le rechercher en Python.

# python3
[ord(s) for s in "Bonjour"]
## [12371, 12435, 12395, 12385, 12399]

Pour la série python2, u "" est requis.

# python2
[ord(s) for s in u"Bonjour"]
## [12371, 12435, 12395, 12385, 12399]

Postscript (merci: @shiracamus)

Il semble que vous puissiez également spécifier un code uniforme dans R.

"\u3053\u3093\u306b\u3061\u306f"
## [1] "Bonjour"

Le code est-il spécifié en hexadécimal? Il existe de nombreuses façons d'obtenir le code hexadécimal.

En R, ça ressemble à ça.

# R
sprintf("%x", utf8ToInt("Bonjour"))
[1] "3053" "3093" "306b" "3061" "306f"

Vous pouvez utiliser hex en Python.

# python3
[hex(ord(s)) for s in "Bonjour"]
['0x3053', '0x3093', '0x306b', '0x3061', '0x306f']

Postscript

En passant, lors de l'incorporation dans le package R, si vous utilisez une chaîne de caractères au format "\ u ..." dans la définition de fonction, l'avertissement suivant semble apparaître.

plotat.Rd: non-ASCII input and no declared encoding

Il semble qu'il n'est pas recommandé d'utiliser des caractères pleine largeur dans l'aide R.

Recommended Posts

R: Utilisez le japonais au lieu du japonais dans le script

Utilisons usercustomize.py au lieu de sitecustomize.py

Utilisons tomotopy au lieu de gensim

Utilisation du fichier de contraintes ajouté dans pip 7.1

Bonjour tout le monde pas localhost à Django

Mettez Linux dans Chromebook et utilisez R ...

Obtenez le résultat du GeoCoding inversé en japonais à l'aide du SDK Java de GoogleMapsAPI.

Résumé de l'utilisation de MNIST avec Python

Incertitude du code d'unité japonais dans la série Tacotron 2

Créez un tracé de R semblable à un joyplot avec python

Erreur de date de l'adresse déjà utilisée dans Flask

[Explication de la mise en œuvre] Comment utiliser la version japonaise de BERT dans Google Colaboratory (PyTorch)

Utilisez urlparse.urljoin au lieu de os.path.join pour les jointures d'URL Python

Utilisons les données ouvertes de "Mamebus" en Python

Utilisez la date sur l'axe des x du tsplot représenté dans seaborn

Comment utiliser le modèle japonais Spacy avec Google Colaboratory

Je veux utiliser le jeu de données R avec python

EP 7 Utiliser les compréhensions de liste au lieu de carte et de filtre

Utilisation pratique d'ipython

Utilisez config.ini avec Python

Utiliser des dates en Python

Utiliser Mean avec DataFrame

Utiliser Valgrind avec Python

R chez Anaconda (dans Ubuntu 14.04)

Sortie japonaise avec Python

Utiliser le profileur en Python

Localisation japonaise de Pycharm

Le PDF anglais est traduit en japonais

Enquête sur l'utilisation du machine learning dans les services réels

Trier le tableau de chaînes par ordre de longueur et syllabaire japonais

Rendre la fonction de dessin de polices japonaises dans OpenCV en général

Comparaison de la gestion des trames de données en Python (pandas), R, Pig