Bežné výrazy

V nižšie uvedenej tabuľke sa nachádzajú bežné výrazy, ktoré možno použiť na vytvorenie nového jazyka.

Názov položky Dohodnutý symbol bežného výrazu Príklady použitia a vysvetlenia
Ľubovoľný znak . c.t — označuje slová typu „cat“, „cot“, atď.
Znak zo skupiny [] [b-d]ell — označuje slová ako „bell“, „cell“, „dell“, atď.

[ty]ell — označuje slová ako „tell“ a „yell“.

Znak, ktorý nie je zo skupiny [^] [^y]ell — označuje slová ako „dell“, „cell“, „tell“, ale nepovoľuje „yell“

[^n-s]ell — označuje slová ako „bell“, „cell“, ale nepovoľuje „nell“, „oell“, „pell“, „qell“, „rell“ a „sell“

Alebo | c(a|u)t — označuje slová ako „cat“ a „cut“
0 alebo viac výskytov * 10* — označuje čísla 1, 10, 100, 1000, atď.
1 alebo viac výskytov + 10+ — povoľuje čísla 10, 100, 1000, atď., ale nepovoľuje číslo 1
Písmeno alebo číslica [0-9a-zA-Zа-яА-Я] [0-9a-zA-Zа-яА-Я] — povoľuje ľubovoľný samostatný znak
[0-9a-zA-Zа-яА-Я]+ — povoľuje ľubovoľné slovo
Veľké písmeno latinky [A-Z]  
Malé písmeno latinky [a-z]  
Veľké písmeno cyriliky [А-Я]  
Malé písmeno cyriliky [а-я]  
Číslica [0-9]  
Medzera \s  
  @ Vyhradené.

Poznámka:

  1. Ak chcete použiť symbol bežného výrazu ako normálny znak, napíšte pred ním opačnú lomku. Napríklad [t-v]x+ reprezentuje slová ako tx, txx, txx, atď., ux, uxx, atď., ale \[t-v\]x+ reprezentuje slová ako [t-v]x, [t-v]xx, [t-v]xxx, atď.
  2. Na spojenie elementov bežných výrazov do skupín použite zátvorky. Napríklad, (a|b)+|c reprezentuje písmeno c alebo ľubovoľné kombinácie ako abbbaaabbb, ababab, atď. (slovo ľubovoľnej nenulovej dĺžky, v ktorom môže byť ľubovoľný počet písmen „a“ a „b“ v akomkoľvek poradí), kým a|b+|c reprezentuje a, c, a tiež b, bb, bbb, atď.

Príklady

Rozpoznáva sa tabuľka s tromi stĺpcami: V prvom stĺpci sa nachádza dátum narodenia, v druhom meno a v tretom je e-mailová adresa. Môžete vytvoriť nové jazyky — Dátumy a Adresy a nastaviť pre ne bežné (regulárne) výrazy.

Bežné výrazy pre dátumy:

Číslo označujúce deň môže pozostávať z jednej číslice (1, 2 atď.) alebo z dvoch číslic (napr. 02, 12), ale nemôže to byť nula (00 alebo 0). Bežný výraz pre deň by mal potom vyzerať takto: ((|0)[1-9])|([1|2][0-9])|(30)|(31).

Bežný výraz pre mesiac by mal vyzerať takto: ((|0)[1-9])|(10)|(11)|(12).

Bežný výraz pre rok by mal vyzerať takto: ([19][0-9][0-9]|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9]).

Toto všetko treba dokopy skombinovať a oddeliť čísla bodkami (napr. 1.03.1999). Bodka je symbol bežného výrazu, takže pred ňu musíte vložiť opačnú lomku (\). Bežný výraz pre úplný dátum by mal potom vyzerať takto:

((|0)[1-9])|([1|2][0-9])|(30)|(31)\.((|0)[1-9])|(10)|(11)|(12)\.((19)[0-9][0-9])|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])

Bežný výraz pre e-mailovú adresu:

[a-zA-Z0-9_\-\.]+\@[a-z0-9\.\-]+

Bežné výrazy