Méthode de correspondance d'expression régulière
Méthode de correspondance d'expression régulière
Remarques sur la correspondance des expressions régulières en Python
- 1 Importez le module d'expression régulière avec ʻimport re`.
- 2 Appelez la fonction
re.compile ()
pour créer un objet Regex (en utilisant une chaîne brute).
Exemple: phone_num_regex = re.compile (r '\ d \ d \ d- \ d \ d \ d- \ d \ d \ d \ d')
- 3 Si vous passez la chaîne de caractères à rechercher à la méthode
search ()
de l'objet Regex, un objet Match sera renvoyé.
Exemple: mo = phone_num_regex.search ('Mon numéro de téléphone est 415-555-4242.')
mo
signifie objet correspondant
- 4 Appelez la méthode
group ()
de l'objet Match pour obtenir la chaîne correspondante.
Exemple: print ('numéro de téléphone trouvé:' + mo.group ())
→ Numéro de téléphone trouvé: 415-555-4242
Abréviation des jeux de caractères courants
Forme raccourcie |
sens |
\d |
0~Numéro 9 |
\D |
0~Autre que le chiffre 9 |
\w |
Lettres, chiffres, souligner(Mot de mot w) |
\W |
Autre que les lettres, les chiffres et le soulignement |
\s |
Espaces, tabulations, sauts de ligne(Des espaces vides) |
\S |
Autre que les espaces, les tabulations et les sauts de ligne |
Résumé des symboles utilisés pour les expressions régulières
+? Correspond à 0 ou 1 occurrence du groupe précédent.
-
- Correspond à 0 occurrences ou plus du groupe précédent.
-
- Correspond à une ou plusieurs occurrences du groupe précédent.
- {n} correspond à n occurrences du groupe précédent.
- {n,} correspond à n occurrences ou plus du groupe précédent.
- {, M} correspond aux occurrences de 0 à m du groupe précédent.
- {n, m} correspond à n ~ m occurrences du groupe précédent.
- {n, m}?, * ?, +? Faire une correspondance non gourmande pour le groupe précédent.
- ^ spam correspond aux chaînes commençant par "spam".
- spam $ correspond aux chaînes se terminant par "spam".
+. Correspond à tout caractère unique autre que le caractère de saut de ligne.
- \ d, \ w, \ s correspondent respectivement aux nombres, aux lettres qui composent les mots et aux lettres vides.
- \ D, \ W, \ S correspondent respectivement à des lettres autres que des chiffres, des lettres qui composent des mots et des lettres vierges.
- [abc] correspond à n'importe quel caractère unique entre crochets.
- [^ abc] correspond à tout caractère unique autre que le caractère entre crochets.