Espressioni regolari

La tabella riportata di seguito elenca le espressioni regolari che possono essere impiegate per creare una nuova lingua.

Nome elemento Simbolo espressione regolare convenzionale Esempi e spiegazioni d’uso
Qualsiasi carattere . c.t – indica “cat”, “cot”, ecc.
Carattere da gruppo [] [b-d]ell - indica “bell”, “cell”, “dell”, ecc.

[ty]ell - indica “tell” e “yell”

Carattere non da Gruppo [^] [^y]ell – indica “dell”, “cell”, “tell”, ma esclude “yell”

[^n-s]ell - indica “bell”, “cell”, ma esclude “nell”, “oell”, “pell”, “qell”, “rell” e “sell”

Oppure | c(a|u)t - indica “cat” e “cut”
0 o più corrispondenze * 10* - indica i numeri 1, 10, 100, 1.000, ecc.
una o più corrispondenze + 10+ - consente i numeri 10, 100, 1.000, ecc., ma esclude 1
Lettera o numero [0-9a-zA-Zа-яА-Я] [0-9a-zA-Zа-яА-Я] - consente qualsiasi carattere singolo
[0-9a-zA-Zа-яА-Я]+ - consente qualsiasi parola
Lettera maiuscola latina [A-Z]  
Lettera minuscola latina [a-z]  
Lettera maiuscola cirillica [А-Я]  
Lettera minuscola cirillica [а-я]  
Numero [0-9]  
Spazio \s  
  @ Riservata.

Nota.

  1. Per poter utilizzare un simbolo espressione regolare come carattere normale, è necessario che sia preceduto da una barra rovesciata. Ad esempio, [t-v]x+ indica tx, txx, txx, ecc., ux, uxx, ecc., ma \[t-v\]x+ indica [t-v]x, [t-v]xx, [t-v]xxx, ecc.
  2. Per raggruppare elementi di espressione regolari, servirsi delle parentesi. Ad esempio, (a|b)+|c indica c o qualsiasi combinazione come abbbaaabbb, ababab, ecc. (una parola di lunghezza diversa da zero contenente un numero qualsiasi di a e b in qualsiasi ordine), mentre a|b+|c indica a, c, e b, bb, bbb, ecc.

Esempi

Riconoscimento di una tabella a tre colonne: la prima per la data di nascita, la seconda per il nome e la terza per l’indirizzo di posta elettronica. È possibile creare nuove lingue, dati e indirizzi, oltre che impostare espressioni regolari correlate.

Espressione regolare per le date:

Il numero che indica un giorno può essere composto da una cifra (1, 2, ecc.) o da due cifre (02, 12), ma non può essere uguale a zero (00 oppure 0). L’espressione regolare per il giorno dovrà pertanto avere la seguente struttura: ((|0)[1-9])|([1|2][0-9])|(30)|(31).

L’espressione regolare per il mese dovrà avere la seguente struttura: ((|0)[1-9])|(10)|(11)|(12).

L’espressione regolare per l’anno avere la seguente struttura: ([19][0-9][0-9]|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9]).

Sarà quindi necessario combinare tra loro questi elementi e separare i numeri mediante punti (esempio: 1.03.1999). Il punto è un simbolo di espressione regolare, pertanto deve essere preceduto da una barra rovesciata (\). L’espressione regolare per la data completa dovrà pertanto avere la seguente struttura:

((|0)[1-9])|([1|2][0-9])|(30)|(31)\.((|0)[1-9])|(10)|(11)|(12)\.((19)[0-9][0-9])|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])

Espressione regolare per l’indirizzo di posta elettronica:

[a-zA-Z0-9_\-\.]+\@[a-z0-9\.\-]+

Espressioni regolari