정규식

다음 표는 새 언어를 만들 때 사용할 수 있는 정규식 목록입니다.

항목 이름 일반 정규식 기호 용례 및 설명
모든 문자 . c.t — “cat,” “cot” 등을 나타냅니다.
그룹의 문자 [] [b-d]ell — “bell,” “cell,” “dell” 등을 나타냅니다.

[ty]ell — “tell” 및 “yell”을 나타냅니다.

그룹 이외의 문자 [^] [^y]ell — “dell,” “cell,” “tell”을 나타내지만 “yell”은 금지합니다.

[^n-s]ell — “bell,” “cell”을 나타내지만 “nell,” “oell,” “pell,” “qell,” “rell” 및 “sell”은 금지합니다.

또는 | c(a|u)t — “cat” 및 “cut”을 나타냅니다.
0개 이상 일치 * 10* — 1, 10, 100, 1000 등을 나타냅니다.
1개 이상 일치 + 10+ — 10, 100, 1000 등을 허용하지만 1은 금지합니다.
문자 또는 숫자 [0-9a-zA-Zа-яА-Я] [0-9a-zA-Zа-яА-Я] — 모든 단일 문자를 허용합니다.
[0-9a-zA-Zа-яА-Я]+ — 모든 단어를 허용합니다.
라틴 대문자  [A-Z]  
라틴 소문자  [a-z]  
키릴 대문자 [А-Я]  
키릴 소문자 [а-я]  
숫자 [0-9]  
공백 \s  
  @ 예약됨.

참고:

  1. 정규식 기호를 일반 문자로 사용하려면 백슬래시를 앞에 붙입니다. 예를 들어, [t-v]x+는 tx, txx, txx 등이나 ux, uxx 등을 나타내지만 \[t-v\]x+는 [t-v]x, [t-v]xx, [t-v]xxx 등을 나타냅니다.
  2. 정규식 요소를 그룹화하려면 대괄호를 사용합니다. 예를 들어, (a|b)+|c는 c또는 abbbaaabbb, ababab 등과 같은 모든 조합(a와 b가 순서와 개수에 관계 없이 있을 수 있는 0이 아닌 길이의 단어)을 나타내며, a|b+|c는 a, c 및 b, bb, bbb 등을 나타냅니다.

생일, 이름, 전자 메일 주소 열이 있는 표를 인식하려고 합니다. 새 언어, 데이터 및 주소를 만든 후 이들에 각각 정규식을 설정할 수 있습니다.

날짜에 대한 정규식:

날짜를 나타내는 숫자는 한 자리(1, 2 등) 또는 두 자리(02, 12)로 구성될 수 있지만 0(00 또는 0)이 될 수는 없습니다. 따라서 날짜에 대한 정규식은 ((|0)[1-9])|([1|2][0-9])|(30)|(31)과 같아야 합니다.

월에 대한 정규식은((|0)[1-9])|(10)|(11)|(12)와 같아야 합니다.

연도에 대한 정규식은 ([19][0-9][0-9]|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])와 같아야 합니다.

이제 이들을 하나로 결합하고 마침표(.)를 사용하여 숫자를 구분합니다(예: 1.03.1999). 마침표는 정규식 기호이므로 앞에 백슬래시(\)를 사용해야 합니다. 전체 날짜에 대한 정규식은 다음과 같아야 합니다.

((|0)[1-9])|([1|2][0-9])|(30)|(31)\.((|0)[1-9])|(10)|(11)|(12)\.((19)[0-9][0-9])|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])

전자 메일 주소에 대한 정규식:

[a-zA-Z0-9_\-\.]+\@[a-z0-9\.\-]+

정규식