Une expression régulière (regex ou regexp) est un motif de recherche décrivant un ensemble de chaînes de caractères selon une syntaxe précise. Standardisées par la norme POSIX et étendues par Perl, les regex sont utilisées dans tous les langages de programmation pour la validation de formulaires, l'extraction de données, le rechercher-remplacer et le parsing de fichiers. Les caractères spéciaux comme `.` (tout caractère), `*` (zéro ou plus), `+` (un ou plus), `\d` (chiffre) et `[a-z]` (plage) forment le vocabulaire de base de ce langage de motifs.
Qu'est-ce qu'une expression régulière ?
Une expression régulière (regex) est un motif qui décrit un ensemble de chaînes. C'est l'outil standard pour rechercher, valider et transformer du texte en programmation. Les regex sont supportées dans tous les langages majeurs — JavaScript, Python, Java, Go, Rust, PHP — et dans des outils comme grep, sed et la plupart des éditeurs de texte.
Une regex combine des caractères littéraux avec des métacaractères spéciaux. Par exemple, \d3-\d4 correspond à un nombre de 3 chiffres, un tiret et un nombre de 4 chiffres.
Comment fonctionnent les expressions régulières ?
| Motif | Signification |
|---|---|
| . | Tout caractère (sauf retour à la ligne) |
| \d | Chiffre (0-9) |
| \w | Caractère de mot (a-z, A-Z, 0-9, _) |
| \s | Espace blanc (espace, tab, retour à la ligne) |
| ^ | Début de chaîne/ligne |
| $ | Fin de chaîne/ligne |
| * | 0 ou plus |
| + | 1 ou plus |
| ? | 0 ou 1 (optionnel) |
| {n,m} | Entre n et m fois |
| [abc] | Classe de caractères (a, b ou c) |
| (abc) | Groupe de capture |
| a|b | Alternation (a ou b) |
Quels sont les motifs regex les plus utilisés ?
- Email :
^[\w.-]+@[\w.-]+\.\w{2,}$ - URL :
https?://[\w.-]+(?:/[\w./-]*)? - IPv4 :
\b\d{1,3}(?:\.\d{1,3}){3}\b - Date (ISO) :
\d{4}-\d{2}-\d{2}
Si vous travaillez avec des tâches planifiées, notre générateur d'expressions cron peut vous aider à construire visuellement vos planifications crontab. Pour encoder des données, consultez l'encodeur Base64.