Įprastiniai posakiai

Toliau lentelėje pateikiamos įprastinės išraiškos, kurias galima naudoti naujai kalbai sukurti.

Elemento pavadinimas Įprastinis paprastosios išraiškos simbolis Naudojimo pavyzdžiai ir paaiškinimai
Bet koks simbolis . c.t reiškia cat, cot ir t. t.
Simbolis iš grupės [] [b-d]ell reiškia bell, cell, dell ir t. t.

[ty]ell reiškia tell ir yell

Simbolis ne iš grupės [^] [^y]ell reiškia dell, cell, tell, tačiau draudžia yell

[^n-s]ell reiškia bell, cell, tačiau draudžia nell, oell, pell, qell, rell ir sell

Arba | c(a|u)t reiškia cat ir cut
0 arba daugiau atitikmenų * 10* reiškia skaičius 1, 10, 100, 1000, t. t.
1 arba daugiau atitikmenų + 10+ leidžia skaičius 10, 100, 1000 ir t. t., tačiau draudžia 1
Raidė arba skaičius [0-9a-zA-Zа-яА-Я] [0-9a-zA-Zа-яА-Я] — leidžia bet kokį vieną simbolį
[0-9a-zA-Zа-яА-Я] — leidžia bet kokį žodį
Didžioji lotynų abėcėlės raidė  [A-Z]  
Mažoji lotynų abėcėlės raidė  [a-z]  
Didžioji kirilicos raidė [А-Я]  
Mažoji kirilicos raidė [а-я]  
Skaičius [0-9]  
Tarpas \s  
  @ Rezervuotas.

Pastaba:

  1. jei norite naudoti paprastosios išraiškos simbolį kaip normalų simbolį, prieš jį parašykite kairėn pasvirusį brūkšnį. Pavyzdžiui,  [t-v]x+ žymi tx, txx, txx, t. t., ux, uxx, t. t., bet \[t-v\]x+ žymi [t-v]x, [t-v]xx, [t-v]xxx, t. t.
  2. Norėdami sugrupuoti paprastųjų išraiškų elementus, naudokite skliaustus. Pavyzdžiui, (a|b)+|c žymi c arba bet kokias kombinacijas, pvz., abbbaaabbb, ababab ir kt. (nenulinio ilgio žodis, kuriame gali būti bet koks skaičius a ir b raidžių, išdėstytų bet kokia tvarka), tuo tarpu a|b+|c žymi a, c ir b, bb, bbb ir kt.

Pavyzdžiai

Tarkime, atpažįstate trijų stulpelių lentelę: pirmajame yra gimimo data, antrajame – pavardė, o trečiajame – el. pašto adresas. Jūs galite sukurti naujas kalbas Duomenys ir Adresas bei nustatyti joms paprastąsias išraiškas.

Paprastosios išraiškos datoms:

dieną žymintis skaičius gali būti sudarytas iš vieno (1, 2, t.t.) arba dviejų skaitmenų (02, 12), bet jis negali būti nulis (00 arba 0). Paprastoji dienos išraiška turi atrodyti taip: ((|0)[1-9])|([1|2][0-9])|(30)|(31).

Paprastoji mėnesio išraiška turi atrodyti taip: ((|0)[1-9])|(10)|(11)|(12).

Paprastoji metų išraiška turi atrodyti taip: ([19][0-9][0-9]|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9]).

Lieka tik suderinti viską ir atskirti skaičius taškais (pvz.: 1.03.1999). Taškas yra paprastosios išraiškos simbolis, todėl prieš jį būtina dėti kairėn pasvirusį brūkšnį (\). Tada paprastoji išraiška visai datai turėtų atrodyti taip:

((|0)[1-9])|([1|2][0-9])|(30)|(31)\.((|0)[1-9])|(10)|(11)|(12)\.((19)[0-9][0-9])|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])

Paprastoji išraiška el. pašto adresams:

[a-zA-Z0-9_\-\.]+\@[a-z0-9\.\-]+

Įprastiniai posakiai