Алфавіт, який використовується у регулярних виразах

Регулярні вирази, які можна використовувати для створення словника мови користувача.

Назва у списку Умовне позначення у полі Приклад використання
Будь-який символ . (крапка) р.к — допускає слова типу «рік», «рок» тощо.
Символ з групи [] [р-т]ік — допускає слова типу «рік», «сік», «тік» тощо; [кп]іт — допускає слова «кіт» і «піт».
Символ не з групи [^] [^х]ід — допускає слова «дід», «рід», але не допускає слово «хід»; [^р-х]ід — допускає слова «дід», «лід», «від», але не допускає слова «рід», «хід».
Або | к(а|і)т — допускає слова «кат» і «кіт».
0 або більше збігів * 10* — допускає числа 1, 10, 100, 1000 тощо.
1 або більше збігів + 10+ — допускає числа 1, 10, 100, 1000 тощо.
Літера або цифра [0-9a-zA-Zа-яА-Я] [0-9a-zA-Zа-яА-Я] — допускає будь-який одиночний символ; [0-9a-zA-Zа-яА-Я]+ — допускає будь-яке слово
Велика латинська літера [A-Z]  
Маленька латинська літера [a-z]  
Велика кирилична літера [А-Я]  
Маленька кирилична літера [а-я]  
Цифра [0-9]  
Пробіл \s  
  @ Зарезервовано як службове слово.

Примітка:

  1. Щоб використовувати службові символи не як службові, а як повноцінні, ставте перед ними «зворотний слеш» (\), наприклад, [t-v]x+ допускає такі слова, як tx, txx, txxx тощо, ux, uxx тощо, vx, vxx тощо. Вираз \[t-v\]x+ допускає слова [t-v]x, [t-v]xx, [t-v]xxx тощо.
  2. Щоб об’єднати в групу окремі елементи регулярного виразу, можна скористатися дужками. Наприклад, вираз (a|b)+|c допускає літеру c і комбінації літер a та b будь-якої довжини та послідовності (abbbaaabbb, ababab тощо), тоді як вираз a|b+|c допускає лише a, c і b, а також комбінації bb, bbb тощо.

Приклади регулярних виразів

Ви розпізнаєте таблицю, в одній колонці якої написана дата народження, в другій — прізвище, ім’я та по батькові, а в третьому полі — адреса електронної пошти. Ви можете створити нові мови: Data і Address — та задати для них регулярні вирази.

Для дати:

Число місяця може складатися з однієї цифри (наприклад, 1, 2 тощо), з двох цифр (наприклад, 02, 12) та не може бути нульовим (00 або 0). В такому випадку отримуємо ось який регулярний вираз для числа: ((|0)[1-9])|([1|2][0-9])|(30)|(31).

Для місяця регулярний вираз має вигляд: ((|0)[1-9])|(10)|(11)|(12).

Для року: ([19][0-9][0-9])|([0-9][0-9]).

Збираючи все разом і враховуючи, що під час використання службових символів не як службових, а як повноцінних, потрібно ставити перед ними «зворотний слеш» (\), отримаємо:

((|0)[1-9])|([1|2][0-9])|(30)|(31)\. ((|0)[1-9])|(10)|(11)|(12)\.((19)[0-9][0-9])|([0-9][0-9])

Для електронної пошти:

[a-zA-Z0-9_\-\.]+\@[a-z0-9\.\-]+

Алфавіт, який використовується у регулярних виразах