"[Traitement du langage Knock 100](http: //www.cl.ecei) publié dans Inui / Okazaki Laboratory de l'Université de Tohoku .tohoku.ac.jp / nlp100 /) »est connu comme un ensemble de problèmes pour les étudiants et les adultes qui travaillent qui étudient le traitement du langage.
Je suis donc également étudiant à l'Université de Tohoku, donc bien que ma spécialisation soit différente, j'ai essayé Knock 100 language processing.
Récupère une chaîne dans laquelle les caractères de la chaîne "accentués" sont disposés à l'envers (de la fin au début).
words = "stressed"
print(words[::-1])
[résultat] desserts
Retirez les 1er, 3e, 5e et 7e caractères de la chaîne de caractères "Patatokukashi" et récupérez la chaîne de caractères concaténée.
words = "Patatoku Kashii"
print(words[::2])
[résultat] Voiture Pat
Récupérez la chaîne de caractères "Patatokukashi" en reliant alternativement les caractères "Pattocar" + "Tax" depuis le début.
word1 = "Voiture Pat"
word2 = "Taxi"
for i in range(4):
print(word1[i]+word2[i],end="")
[résultat] Patatoku Kashii
Décomposez la phrase "Maintenant, j'ai besoin d'un verre, alcoolique bien sûr, après les lourdes conférences sur la mécanique quantique."
PI = "Now I need a drink, alcoholic of course, after the heavy lectures involving quantum mechanics."
PI = PI.replace('.','')
PI = PI.replace(',','')
PI = PI.split()
ans = [len(num) for num in PI]
ans
[résultat] [3, 1, 4, 1, 5, 9, 2, 6, 5, 3, 5, 8, 9, 7, 9]
Décomposez la phrase "Salut, il a menti parce que le bore ne pouvait pas oxyder le fluor. Les nouvelles nations pourraient également signer la clause de sécurité de la paix. Arthur King Can." Le 19e mot est le premier caractère, et les autres mots sont les deux premiers caractères, et le tableau associatif (type dictionnaire ou type de carte) de la chaîne de caractères extraite à la position du mot (quel nombre de mots depuis le début) Créer.
element = "Hi He Lied Because Boron Could Not Oxidize Fluorine. New Nations Might Also Sign Peace Security Clause. Arthur King Can."
dict = {}
list = [1,5,6,7,8,9,15,16,19]
for i,j in enumerate(element.split()):
if i+1 in list:
dict[i+1] = j[0]
else:
dict[i+1] = j[0:2]
print(dict)
[résultat] {1: 'H', 2: 'He', 3: 'Li', 4: 'Be', 5: 'B', 6: 'C', 7: 'N', 8: 'O', 9: 'F', 10: 'Ne', 11: 'Na', 12: 'Mi', 13: 'Al', 14: 'Si', 15: 'P', 16: 'S', 17: 'Cl', 18: 'Ar', 19: 'K', 20: 'Ca'}
Créez une fonction qui crée un n-gramme à partir d'une séquence donnée (chaîne, liste, etc.). Utilisez cette fonction pour obtenir le mot bi-gramme et la lettre bi-gramme à partir de la phrase "Je suis un PNL".
def n_gram(target, n):
result = []
for i in range(len(target) - n + 1):
result.append(target[i:i + n])
return result
target = "I am an NLPer"
words_target = target.split()
print("[Mot bi-gram]")
print(n_gram(words_target, 2))
print("[Personnage bi-gram]")
print(n_gram(target, 2))
[résultat] [Word bi-gramme] [['I', 'am'], ['am', 'an'], ['an', 'NLPer']] [Caractère bi-gramme] ['I ', ' a', 'am', 'm ', ' a', 'an', 'n ', ' N', 'NL', 'LP', 'Pe', 'er']
Trouvez l'ensemble des caractères bi-grammes contenus dans "paraparaparadise" et "paragraphe" comme X et Y, respectivement, et trouvez les ensembles somme, produit et différence de X et Y, respectivement. En outre, découvrez si le bi-gram'se'est inclus dans X et Y.
def n_gram(target, n):
result = []
for i in range(0,len(target) - n + 1):
result.append(target[i:i + n])
return result
text_x = "paraparaparadise"
text_y = "paragraph"
set_x = set(n_gram(text_x, 2))
set_y = set(n_gram(text_y, 2))
print("X:",end="")
print(set_x)
print("Y:",end="")
print(set_y)
print("----")
print("[Ensemble de somme]")
# print(set_x | set_y)Mais d'accord
print(set_x.union(set_y))
print("[Ensemble de produits]")
# print(set_x & set_y)Mais d'accord
print(set_x.intersection(set_y))
print("[Ensemble de différences]")
# print(set_x - set_y)Mais d'accord
print(set_x.difference(set_y))
print("----")
print("se in X: ",end="")
print('se' in set_x)
print("se in Y: ",end="")
print('se' in set_y)
[résultat] X:{'ar', 'ap', 'ad', 'di', 'ra', 'pa', 'se', 'is'} Y:{'ar', 'ap', 'ag', 'gr', 'ph', 'ra', 'pa'} ---- [Ensemble de somme] {'ar', 'ap', 'ag', 'ad', 'gr', 'ph', 'di', 'ra', 'pa', 'se', 'is'} [Ensemble de produits] {'pa', 'ar', 'ap', 'ra'} [Ensemble de différences] {'is', 'ad', 'di', 'se'} ---- se in X: True se in Y: False
Implémentez une fonction qui prend les arguments x, y, z et renvoie la chaîne "y at x is z". De plus, définissez x = 12, y = "température", z = 22,4 et vérifiez le résultat de l'exécution.
def createSentence(x,y,z):
print("{}de temps".format(x) + y + "Est{}".format(z))
createSentence(12,"Température",22.4)
[résultat] La température à 12h00 est de 22,4
Implémentez la fonction de chiffrement qui convertit chaque caractère de la chaîne de caractères donnée avec les spécifications suivantes.
- Remplacer par (219 --character code) caractères si minuscules
- Afficher les autres caractères tels quels Utilisez cette fonction pour crypter / décrypter les messages en anglais.
def cipher(s):
result =''
for i in s:
if i.islower():
result += chr(219-ord(i))
else:
result += i
return result
text = "Man is but a reed, the most feeble thing in the nature, but he is a thinking reed. "
cipher(text)
[résultat] 'Mzm rh yfg z ivvw, gsv nlhg uvvyov gsrmt rm gsv mzgfiv, yfg sv rh z gsrmprmt ivvw. '
Créez un programme qui réorganise de manière aléatoire l'ordre des autres caractères, en laissant le premier et le dernier caractère de chaque mot pour la chaîne de mots séparés par des espaces. Cependant, les mots d'une longueur de 4 ou moins ne sont pas réorganisés. Donnez une phrase en anglais appropriée (par exemple, "Je ne pouvais pas croire que je pouvais réellement comprendre ce que je lisais: le pouvoir phénoménal de l'esprit humain.") Et vérifiez le résultat de l'exécution.
import random
def typoglycemia(target):
res = []
for s in target.split():
if len(s) < 5:
res.append(s)
else:
head = s[0]
tail = s[-1]
inner = list(s[1:-1])
random.shuffle(inner)
res.append(head+"".join(inner)+tail)
return " ".join(res)
target = "I couldn't believe that I could actually understand what I was reading : the phenomenal power of the human mind ."
print(typoglycemia(target))
[résultat] I cud'lont bivleee that I colud aaclutly unnsetadrd what I was rindaeg : the phnomeneal pwoer of the human mind .
Veuillez signaler toute erreur. Je le réparerai.