R: Utilisez le japonais au lieu du japonais dans le script

En R, s'il y a du japonais dans le script, cela cause parfois des inconvénients, nous le traitons donc de la manière suivante.

# R
intToUtf8(c(12371, 12435, 12395, 12385, 12399))
## [1] "Bonjour"

À quel numéro correspond le caractère souhaité

# R
utf8ToInt("Bonjour")
[1] 12371 12435 12395 12385 12399

Je l'ai vérifié une fois et essayé de l'écrire dans le script sans utiliser le japonais.

Vous pouvez également le rechercher en Python.

# python3
[ord(s) for s in "Bonjour"]
## [12371, 12435, 12395, 12385, 12399]

Pour la série python2, u "" est requis.

# python2
[ord(s) for s in u"Bonjour"]
## [12371, 12435, 12395, 12385, 12399]

Postscript (merci: @shiracamus)

Il semble que vous puissiez également spécifier un code uniforme dans R.

"\u3053\u3093\u306b\u3061\u306f"
## [1] "Bonjour"

Le code est-il spécifié en hexadécimal? Il existe de nombreuses façons d'obtenir le code hexadécimal.

En R, ça ressemble à ça.

# R
sprintf("%x", utf8ToInt("Bonjour"))
[1] "3053" "3093" "306b" "3061" "306f"

Vous pouvez utiliser hex en Python.

# python3
[hex(ord(s)) for s in "Bonjour"]
['0x3053', '0x3093', '0x306b', '0x3061', '0x306f']

Postscript

En passant, lors de l'incorporation dans le package R, si vous utilisez une chaîne de caractères au format "\ u ..." dans la définition de fonction, l'avertissement suivant semble apparaître.

plotat.Rd: non-ASCII input and no declared encoding

Il semble qu'il n'est pas recommandé d'utiliser des caractères pleine largeur dans l'aide R.

Recommended Posts

R: Utilisez le japonais au lieu du japonais dans le script
Utilisons usercustomize.py au lieu de sitecustomize.py
Utilisons tomotopy au lieu de gensim
Utilisation du fichier de contraintes ajouté dans pip 7.1
Bonjour tout le monde pas localhost à Django
Mettez Linux dans Chromebook et utilisez R ...
Obtenez le résultat du GeoCoding inversé en japonais à l'aide du SDK Java de GoogleMapsAPI.
Résumé de l'utilisation de MNIST avec Python
Incertitude du code d'unité japonais dans la série Tacotron 2
Créez un tracé de R semblable à un joyplot avec python
Erreur de date de l'adresse déjà utilisée dans Flask
[Explication de la mise en œuvre] Comment utiliser la version japonaise de BERT dans Google Colaboratory (PyTorch)
Utilisez urlparse.urljoin au lieu de os.path.join pour les jointures d'URL Python
Utilisons les données ouvertes de "Mamebus" en Python
Utilisez la date sur l'axe des x du tsplot représenté dans seaborn
Comment utiliser le modèle japonais Spacy avec Google Colaboratory
Je veux utiliser le jeu de données R avec python
EP 7 Utiliser les compréhensions de liste au lieu de carte et de filtre
Utilisation pratique d'ipython
Utilisez config.ini avec Python
Utiliser des dates en Python
Utiliser Mean avec DataFrame
Utiliser Valgrind avec Python
R chez Anaconda (dans Ubuntu 14.04)
Sortie japonaise avec Python
Utiliser le profileur en Python
Localisation japonaise de Pycharm
Le PDF anglais est traduit en japonais
Enquête sur l'utilisation du machine learning dans les services réels
Trier le tableau de chaînes par ordre de longueur et syllabaire japonais
Rendre la fonction de dessin de polices japonaises dans OpenCV en général
Comparaison de la gestion des trames de données en Python (pandas), R, Pig