Vous êtes ici les classes - Symboles REGEX
Nous revoici à l'école !! Nous n'en sommes pas si loin car il faut raisonner de la même manière que pour une classe d'école qui est un regroupement d'élèves. Mais fort heureusement, les classes REGEX ne regroupe pas des élèves mais des caractères. Nous les appelons classes de caractères mais nous pourrions les appeler également jeu de caractères. Nous allons avec les classes pouvoir dire au moteur REGEX ou au moteur REWRITE les caractères qu'il nous intéresse de prendre dans une phrase, une page web ou encore une suite de chiffre... Pour faire cela, nous allons placer les caractères entre crochet []
1) les classes de caractère Ainsi nommé car elles prennent en compte tous les caractères. Si nous voulions récupérer dans une chaine de caractère le a et le c, nous devrions l'écrire comme ceci : [ac]. Nous pourrions l'utiliser pour chercher des mots. Ainsi, jo[ui]e pourrait correspondre à joie et à joue. Les classes sont très utilisées pour chercher des portions de chaine dans une chaine de caractère. 2) les intervalles Les intervalles servent à prendre tous les caractères contenus entre 2 caractères servant de limites. [..-..] Le - représente le séparateur à l'intérieur de la classe. Si nous voulions tout l'alphabet nous devrions écrire la classe comme ceci : [a-z] 3) les exceptions Les seuls symboles ou métacaractères permis à l'intérieur d'une classe de caractère sont le crochet fermant ], la barre oblique inverse \, l' accent circonflexe ^ et le trait d'union -. Les métacaractères habituels sont des caractères normaux quand ils sont dans une classe de caractère, et n'ont pas besoin d'être échappés par une barre oblique inverse. Si nous voulions rechercher une étoile, la classe suivante devrait nous suffire [*]. Votre regex fonctionnera correctement si vous échapper les métacaractères dans une classe de caractère, mais cela réduira la lisibilité et sera plus gourmand en temps machine. 4) l'accent circonflexe ^ (caret en anglais) L'accent circonflexe est un symbole et sert de négation. Pour inclure l'accent circonflexe comme un simple caractère, placez-le n'importe ou sauf juste après l'ouverture du crochet. [x^] correspond tout simplement à un x ou un accent circonflexe. Pour la négation, placer le juste après le crochet d'ouverture : [^*x] correspond à n'importe quel caractère qui n'est pas une étoile ou un x. 5) Le trait d'union Le trait d'union sert de séparateur pour les intervalles et n'a pas besoin d'être échapper pour redevenir un simple caractère. Si le trait d'union est inclus à droite après le crochet ouvrant ou juste avant le crochet fermant. Les deux [-x] et [x-] corresponde à x ou à un simple trait d'union. 6) les raccourcies Comme nous avons des classes qui sont souvent utilisées, il existe des raccourcis : \d est l'abréviation de [0-9] ou \w correspond à la classe [A-Za-z0-9_].
Classe | Description |
. | signifie que vous pouvez mettre n'importe quel caractère. |
\w | correspond à un mot [_a-zA-Z0-9] |
\W | ne correspond pas à un mot [^_a-zA-Z0-9] |
\d | \d correspond à un chiffre [0-9] |
\D | ne correspond pas a un chiffre [^0-9] |
\s | correspond à un espace (correspond à \t \n \r) |
\S | correspond à ce qui n'est pas un espace (\t \n \r) |
\t | correspond à une tabulation |
\n | correspond à un saut de ligne |
\r | correspond à un retour chariot |
Classe | Description |
[[:alpha:]] | n'importe quelle lettre |
[[:digit:]] | n'importe quel chiffre |
[[:xdigit:]] | caractères hexadécimaux |
[[:alnum:]] | n'importe quelle lettre ou chiffre |
[[:space:]] | n'importe quel espace blanc |
[[:punct:]] | n'importe quel signe de ponctuation |
[[:lower:]] | n'importe quelle lettre en minuscule |
[[:upper:]] | n'importe quelle lettre capitale |
[[:blank:]] | espace ou tabulation |
[[:graph:]] | caractères affichables et imprimables |
[[:cntrl:]] | caractères d'échappement |
[[:print:]] | caractères imprimables exceptés ceux de contrôle |
La librairie est ouverte à tous et elle est accès principalement sur les langages Snippets. Vous trouverez aussi d'autres langages de programmation tel que le CSS, HTML, AJAX, ASP.. Plus de 300 références facilement accessibles. Visiter