Page 402 - 완) I MDP 프로젝트 작품 보고서(전체과 1학년)1.6
P. 402
정보통신기기 프로젝트
메타문 기능 설명
자
1개의 문자와 일치한다. 단일행 모드에서는 새줄 문자를 제외
. 문 자
한다.
"["과 "]" 사이의 문자 중 하나를 선택한다. "¦"를 여러 개 쓴
것과 같은 의미이다. 예를 들면 [abc]d는 ad, bd, cd를 뜻한
[ ] 문자 클래스 다. 또한, "-" 기호와 함께 쓰면 범위를 지정할 수 있다.
"[a-z]"는 a부터 z까지 중 하나, "[1-9]"는 1부터 9까지 중의
하나를 의미한다.
문자 클래스 안의 문자를 제외한 나머지를 선택한다. 예를 들
면 [^abc]d는 ad, bd, cd는 포함하지 않고 ed, fd 등을 포함
[^ ] 부정
한다. [^a-z]는 알파벳 소문자로 시작하지 않는 모든 문자를
의미한다.
^ 처음 문자열이나 행의 처음을 의미한다.
$ 끝 문자열이나 행의 끝을 의미한다.
여러 식을 하나로 묶을 수 있다. "abc¦adc"와 "a(b¦d)c"는 같
( ) 하위식
은 의미를 가진다.
일치하는 n번째 일치하는 패턴들 중 n번째를 선택하며, 여기에서 n은 1에서 9
\n
패턴 중 하나가 올 수 있다.
0개 이상의 문자를 포함한다. "a*b"는 "b", "ab", "aab",
* 0회 이상
"aaab"를 포함한다.
{m, m회 이상 n회 "a{1,3}b"는 "ab", "aab", "aaab"를 포함하지만, "b"나
n} 이하 "aaaab"는 포함하지 않는다.
POSIX 확장 문법
메타문 기능 설명
자
? 0 또는 1회 "a?b"는 "b", "ab"를 포함한다.
"a+b"는 "ab", "aab", "aaab"를 포함하지만 "b"는 포함하지
+ 1회 이상
않는다.
여러 식 중에서 하나를 선택한다. 예를 들어, "abc¦adc"는
¦ 선 택
abc와 adc 문자열을 모두 포함한다.
문자 클래스
문자 클래스는 문자열 일치 다음으로 가장 기본적인 정규 표현식 개념이다. 이는 하나의 작은 일련의
문자열들을 더 큰 집합의 문자열들과 일치시키도록 한다. 이를테면, [A-Z]는 알파벳을 대표하며 \d는
임의의 숫자를 의미할 수 있다. 문자 클래스는 POSIX 수준에 적용한다.
[a-Z]와 같은 특정 범위의 문자들을 지정할 때 컴퓨터의 로캘 설정들은 문자 인코딩의 수치적 나열에
따라 내용을 결정한다. 그러한 나열에 따라 수치들을 저장할 수 있으며 그 순서는 abc...zABC...Z,
aAbBcC...zZ와 같이 될 수 있다. 그러므로 POSIX 표준은 문자 클래스를 정의하며 이는 설치된 정규 표
현식 처리기가 인지한다.
정보통신기기과
- 395 -