일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- nodejs
- nunjucks
- ExpressJS
- mysql
- Passport
- typescript
- Switch 사용불가
- sequelize
- react-router-dom
- jest.config.mjs
- Board
- Glob Pattern
- JEST
- Today
- Total
게으른 나르의 코딩
[JavaScript] RegExp 본문
정규 표현식이란
정규 표현식은 일정한 패턴을 가진 문자열의 집합을 표현하기 위해 사용하는 형식 언어다.
문자열을 대상으로 패턴 매칭 기능을 제공한다. 패턴 매칭 기능이란 특정 패턴과 일치하는 문자열을 검색하거나 추출 또는 치환할 수 있는 기능을 말한다.
정규 표현식을 사용하면 반복문과 조건문 없이 패턴을 정의하고 테스트하는 것으로 간단히 체크할 수 있다.
그러나 주석이나 공백을 허용하지 않고 여러 가지 기호를 혼합하여 사용하기 때문에 가독성이 좋진 못하다.
정규 표현식의 생성
정규 표현식 객체를 생성하기 위해서는 정규 표현식 리터럴과 RegExp 생성자 함수를 사용할 수 있다.
일반적으로는 정규 표현식 리터럴을 사용한다. 정규 표현식 리터럴은 패턴과 플래그로 구성된다.
// 정규 표현식 리터럴 문법
/regexp/i
// 맨 앞에 / 기호는 시작 기호이고 / / 사이의 문자 regexp는 패턴 패턴 뒤에 / 는 종료 기호다.
// 종료 기호 뒤에 i는 플래그다.
// 예시
const target = 'Is this all there is?';
const regexp = /is/i;
regexp.test(target); // true
RegExp 메서드
RegExp.prototype.exec
이 메서드는 인수로 전달받은 문자열에 대해 정규 표현식의 패턴을 검색하여 매칭 결과를 배열로 반환한다.
매칭 결과가 없는 경우 null을 반환한다.
exec 메서드는 문자열 내의 모든 패턴을 검색하는 g 플래그를 지정해도 첫 번째 매칭 결과만 반환한다.
RegExp.prototype.test
이 메서드는 인수로 전달받은 문자열에 대해 정규 표현식의 패턴을 검색하여 매칭 결과를 불리언 값으로 반환한다.
String.prototype.match
String 표준 빌트인 객체가 제공하는 match 메서드는 대상 문자열과 인수로 전달받은 정규 표현식과의 매칭 결과를 배열로 반환한다.
즉, 인수가 정규 표현식이다.
g 플래그가 지정되면 모든 매칭 결과를 배열로 반환한다.
플래그
패턴과 함께 정규 표현식을 구성하는 플래그는 정규 표현식의 검색 방식을 설정하기 위해 사용한다.
플래그 | 의미 | 설명 |
i | Ignore case | 대소문자를 구별하지 않고 패턴을 검색한다. |
g | Global | 대상 문자열 내에서 패턴과 일치하는 모든 문자열을 전역 검색한다. |
m | Multi line | 문자열의 행이 바뀌더라도 패턴 검색을 계속한다. |
플래그는 옵션이므로 선택적으로 사용할 수 있으며, 순서와 상관없이 하나 이상의 플래그를 동시에 설정할 수도 있다.
어떠한 플래그를 사용하지도 않은 경우 대소문자를 구별해서 패턴을 검색한다.
매칭 대상이 1개 이상 존재해도 첫 번째 매칭한 대상만 검색하고 종료한다.
패턴
문자열 검색
정규 표현식의 패턴에 문자 또는 문자열을 지정하면 검색 대상 문자열에서 패턴으로 지정한 문자 또는 문자열을 검색한다.
const target = 'Is this all there is?';
const regExp = /is/;
regExp.test(target); // true
임의의 문자열 검색
.은 임의의 문자 한 개를 의미한다. 문자의 내용은 무엇이든 상관없다.
const target = 'Is this all there is?';
const regExp = / ... /g;
target.match(regExp); // ["Is ", "thi", "s a", "ll ", "the", "re ", "is?"]
반복 검색
{m,n}은 앞선 패턴이 최소 m번, 최대 n번 반복되는 문자열을 의미한다. 콤마 뒤에 공백이 있으면 정상 동작하지 않는다.
{n}으로 적을 경우 {n,n} 과 같은 동작을 한다.
{n,}은 최소 n번 이상 반복되는 문자열을 의미한다.
+는 앞선 패턴이 최소 한 번 이상 반복되는 문자열을 의미한다. 즉, {1,}과 같다.
?는 앞선 패턴이 최대 한 번(0번 포함) 이상 반복되는 문자열을 의미한다. 즉, {0,1}과 같다.
OR 검색
|은 or의 의미를 갖는다.
const target = ' A AA B BB Aa Bb';
const regExp = /A|B/g; // 'A' 또는 'B'
const regExp1 = /A+|B+/g; // 'A'가 한개 이상 또는 'B'가 한개 이상
const regExp2 = /[AB]+/g; // 'A'가 한개 이상 또는 'B'가 한개 이상
const regExp3 = /[A-Z]+/g; // 대소문자를 구별한 알파벳 검색
const regExp4 = /[A-Za-z]+/g; // 대소문자를 구별하지 않은 알파벳 검색
const regExp5 = /[0-9]+/g; // 숫자 검색 쉼표가 있을 시 분리
const regExp6 = /[0-9,]+/g; // 숫자 검색 쉼표까지 포함
const regExp7 = /[\d,]+/g; // 숫자 검색 쉼표까지 포함
const regExp8 = /[\D,]+/g; // 숫자가 아닌 값 겁색 쉼표까지 포함
const regExp9 = /[\w,]+/g; // 알파벳,숫자,언더스코어 검색 [A-Za-z0-9_]와 같다.
const regExp10 = /[\W,]+/g; // 알파벳,숫자,언더스코어를 포함하지 않는다.
target.match(regExp); // ["A", "A", "A", "B", "B", "B", "A", "B"]
NOT 검색
[ ... ] 내의 ^은 not의 의미를 갖는다. 예시) [^0-9]는 숫자를 제외한 문자를 의미한다.
시작 위치로 검색
[ ... ] 밖의 ^은 문자열의 시작을 의미한다.
마지막 위치로 검색
$는 문자열의 마지막을 의미한다.
'Languages > JavaScript' 카테고리의 다른 글
[JavaScript] String (0) | 2022.06.13 |
---|---|
[JavaScript] 자주 쓰는 정규 표현식 (0) | 2022.06.10 |
[JavaScript] Date (0) | 2022.06.10 |
[JavaScript] Math (0) | 2022.06.10 |
[JavaScript] Number (0) | 2022.06.09 |