Reguliere expressies

De onderstaande tabel toont de reguliere expressies die kunnen worden gebruikt om een nieuwe taal te definiëren.

Naam van het item Standaardsymbool voor reguliere expressie Gebruiksvoorbeelden en uitleg
Willekeurig teken . k.t – staat voor ‘kat’, ‘kot’ enz.
Teken uit groep [] [b-d]el – staat voor ‘bel’, ‘cel’, ‘del’ enz.
[bw]erk – staat voor ‘berk’ en ‘werk’
Teken niet uit groep [^] [^d]el – staat voor ‘bel’, ‘cel’ enz. maar verbiedt ‘del’
[^d-i]el – staat voor ‘bel’ en ‘cel’ maar verbiedt ‘del’ ‘fel’ ‘gel’ ‘hel’ en ‘iel’
Of | k(a|o)t – staat voor ‘kat’ en ‘kot’
0 of meer overeenkomsten * 10* – staat voor 1, 10, 100, 1000 enz.
1 of meer overeenkomsten + 10+ – staat voor 10, 100, 1000 enz. maar verbiedt 1
Letter of cijfer [0-9a-zA-Zа-яА-Я] [0-9a-zA-Zа-яА-Я]+ – staat elk woord toe
Latijnse hoofdletter [A-Z]  
Latijnse kleine letter [a-z]  
Cyrillische hoofdletter [А-Я]  
Cyrillische kleine letter [а-я]  
Cijfer [0-9]  
Spatie \s  
  @ Gereserveerd.

Opmerking:

  1. Als u een symbool dat binnen reguliere expressies een speciale betekenis heeft, als een normaal teken wilt gebruiken, plaatst u er een backslash voor. Bijvoorbeeld, [t-v]x+ staat voor tx, txx, txx, enz., ux, uxx, enz., maar \[t-v\]x+ staat voor [t-v]x, [t-v]xx, [t-v]xxx, enz.
  2. U kunt elementen uit reguliere expressies groeperen met behulp van haakjes. Bijvoorbeeld, (a|b)+|c staat voor c of om het even welke combinatie zoals abbbaaabbb, ababab, enz. (een woord van om het even welke lengte die niet gelijk is aan nul, en waarin a en b in om het even welke volgorde kunnen voorkomen), terwijl a|b+|c staat voor a, c, en b, bb, bbb, enz.

Voorbeelden

Reguliere expressies voor datums:

Het nummer dat voor een dag staat kan uit één cijfer (1, 2 enz.) of twee cijfers (02, 12) bestaan, maar kan niet nul (0 of 00) zijn. De reguliere expressie voor de dag hoort er dus als volgt uit te zien: ((|0)[1-9])|([1|2][0-9])|(30)|(31).

De reguliere expressie voor de maand hoort er als volgt uit te zien: ((|0)[1-9])|(10)|(11)|(12).

De reguliere expressie voor het jaar hoort er als volgt uit te zien: ([19][0-9][0-9]|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9]).

Alles wat u nog moet doen is dit allemaal te combineren en de nummers onderling door een punt te scheiden (zoals in 1.03.1999). De punt wordt ook voor het vormen van reguliere expressies gebruikt, dus moet u er een backslash (\) voor plaatsen. De reguliere expressie voor de volledige datum hoort er dus als volgt uit te zien:

((|0)[1-9])|([1|2][0-9])|(30)|(31)\.((|0)[1-9])|(10)|(11)|(12)\.((19)[0-9][0-9])|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])

Reguliere expressie voor een e-mailadres:

[a-zA-Z0-9_\-\.]+\@[a-z0-9\.\-]+

Reguliere expressies