반응형
Jake Seo
제이크서 위키 블로그
Jake Seo
전체 방문자
오늘
어제
  • 분류 전체보기 (715)
    • 일상, 일기 (0)
    • 백준 문제풀이 (1)
    • 릿코드 문제풀이 (2)
    • 알고리즘 이론 (10)
      • 기본 이론 (2)
      • 배열과 문자열 (8)
    • 데이터베이스 (15)
      • Planet Scale (1)
      • MSSQL (9)
      • 디비 기본 개념 (1)
      • SQLite 직접 만들어보기 (4)
    • 보안 (7)
    • 설계 (1)
    • 네트워크 (17)
      • HTTP (9)
      • OSI Layers (5)
    • 회고 (31)
      • 연간 회고 (2)
      • 주간 회고 (29)
    • 인프라 (52)
      • 도커 (12)
      • AWS (9)
      • 용어 (21)
      • 웹 성능 (1)
      • 대규모 서비스를 지탱하는 기술 (9)
    • 깃 (7)
    • 빌드 도구 (7)
      • 메이븐 (6)
      • 그레이들 (0)
    • Java (135)
      • 이펙티브 자바 (73)
      • 자바 API (4)
      • 자바 잡지식 (30)
      • 자바 디자인 패턴 (21)
      • 톰캣 (Tomcat) (7)
    • 프레임워크 (64)
      • next.js (14)
      • 스프링 프레임워크 (28)
      • 토비의 스프링 (6)
      • 스프링 부트 (3)
      • JPA (Java Persistence API) (5)
      • Nest.js (8)
    • 프론트엔드 (48)
      • 다크모드 (1)
      • 노드 패키지 관리 매니저 (3)
      • CSS (19)
      • Web API (11)
      • tailwind-css (1)
      • React (5)
      • React 새 공식문서 요약 (1)
      • HTML (Markup Language) (5)
    • 자바스크립트 (108)
      • 모던 자바스크립트 (31)
      • 개념 (31)
      • 정규표현식 (5)
      • 코드 스니펫 (1)
      • 라이브러리 (6)
      • 인터뷰 (24)
      • 웹개발자를 위한 자바스크립트의 모든 것 (6)
      • 팁 (2)
    • Typescript (49)
    • 리눅스와 유닉스 (10)
    • Computer Science (1)
      • Compiler (1)
    • IDE (3)
      • VSCODE (1)
      • IntelliJ (2)
    • 세미나 & 컨퍼런스 (1)
    • 용어 (개발용어) (16)
      • 함수형 프로그래밍 용어들 (1)
    • ORM (2)
      • Prisma (2)
    • NODEJS (2)
    • cypress (1)
    • 리액트 네이티브 (React Native) (31)
    • 러스트 (Rust) (15)
    • 코틀린 (Kotlin) (4)
      • 자바에서 코틀린으로 (4)
    • 정규표현식 (3)
    • 구글 애널리틱스 (GA) (1)
    • SEO (2)
    • UML (2)
    • 맛탐험 (2)
    • 리팩토링 (1)
    • 서평 (2)
    • 소프트웨어 공학 (18)
      • 테스팅 (16)
      • 개발 프로세스 (1)
    • 교육학 (1)
    • 삶의 지혜, 통찰 (1)
    • Chat GPT (2)
    • 쉘스크립트 (1)
    • 컴파일 (2)
    • Dart (12)
    • 코드팩토리의 플러터 프로그래밍 (4)
    • 플러터 (17)
    • 안드로이드 스튜디오 (1)
    • 윈도우즈 (1)
    • 잡다한 백엔드 지식 (1)
    • 디자인 패턴 (1)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • 외래키 제약조건
  • 느린 쿼리
  • item7
  • 싱글톤
  • Pre-rendering
  • 서버리스 컴퓨팅
  • item8
  • Java
  • 자바스크립트 인터뷰
  • 자바스크립트 면접
  • next js app
  • 프로그래머의 뇌
  • 메이븐 페이즈
  • 토비의 스프링
  • MSSQL
  • 참조 해제
  • item9
  • Javadoc 자바독 자바주석 주석 Comment
  • 메이븐 라이프사이클
  • rust
  • 자바 검증
  • 빈 검증
  • 스프링 검증
  • 이펙티브자바
  • 자바
  • 플라이웨이트패턴
  • try-with-resources
  • pnpm
  • 이펙티브 자바
  • Next.js
  • 메이븐 골
  • 슬로우 쿼리
  • 디자인패턴
  • serverless computing
  • NEXT JS
  • 작업기억공간
  • 이펙티브 자바 item9
  • bean Validation
  • 추상 팩터리 패턴
  • 도커공식문서
  • 싱글턴
  • 객체복사
  • 자바 디자인패턴
  • 팩터리 메서드 패턴
  • 알고리즘
  • 싱글톤 패턴
  • prerendering
  • 자바스크립트
  • 러스트
  • 자료구조

최근 댓글

최근 글

티스토리

hELLO · Designed By 정상우.
Jake Seo

제이크서 위키 블로그

정규표현식 Lookaround (Lookahead, Lookbehind) 알아보기
정규표현식

정규표현식 Lookaround (Lookahead, Lookbehind) 알아보기

2022. 12. 28. 22:30

Regex Lookaround match 란?

일치하는 텍스트를 매칭하고 싶을 때가 아니라, 일치하는 텍스트의 앞, 뒤를 매칭하고 싶을 때 사용하는 정규표현식이다.

  • 전방 탐색 (Positive Lookingahead) (?=)
  • 후방 탐색 (Positive Lookingbehind) (?<=)
  • 부정형 전방 탐색 (Negative Lookahead) (?!)
  • 부정형 후방 탐색 (Negative Lookbehind) (?<!)

소비 개념 알아보기

정규표현식에서 일치하는 영역을 반환하는 동작을 소비(consume) 라고 표현한다. 보통 Regex Lookaround match 는 소비(consume) 를 원하지 않을 때 사용한다.

예제

<html>
  <title>제목</title>
</html>

<title></title> 태그 안에 있는 내용만 얻고 싶다면?

Regex Lookaround 를 이용하지 않는다면?

  • 하위표현식을 이용해 데이터를 자른다. 정규표현식에서 () 와 같이 괄호로 나누면 그룹별로 데이터를 뽑기 좋다.
  • 혹은 <title>.*</title> 매칭 후 replace() 를 이용해 <title></title> 부분은 제거해준다.

그런데 우리는 Regex Lookaround 를 이용할 것이다.

전방 탐색(Lookahead) 이용해보기

.*(?=<title>)
  • ?= 기호를 이용해 전방 탐색을 이용할 수 있다.
    • 특정 기호를 제외하고 그 기호의 앞 글자들을 매칭시키는데 유용하다.

<title> 을 제외한 앞부분이 매칭되었다.

후방 탐색(Lookbehind) 이용해보기

(?<=<title>).*
  • ?<= 기호를 이용해 후방 탐색을 이용할 수 있다.
    • 특정 기호를 제외하고 그 기호의 뒤 글자들을 매칭시키는데 유용하다.

<title> 을 제외한 뒷부분이 매칭되었다.

몇몇 브라우저에서는 후방탐색 자체를 지원 안하니 주의해야 한다.

사파리는 후방탐색을 지원하지 않는다.

전방 탐색과 후방 탐색 함께 이용하기

(?<=<title>).*(?=<\/title>)

드디어 문제를 해결했다.

  • 전방탐색과 후방탐색은 같은 정규표현식 내에서 얼마든지 계속 사용 가능하다.

<title> 뒷부분이면서, </title> 의 앞부분을 매칭한다.

부정형 후방탐색 이용하기

I paid $30 for 100 apples,
50 oranges, and 60 pears.
I saved $5 on this order.

여기서 숫자를 뽑고 싶지만, $ 뒤에 있는 숫자는 제외하고 싶다면?

\b(?<!\$)\d+\b

위와 같이 부정형 후방 탐색을 이용할 수 있다.

 

레퍼런스

https://junstar92.tistory.com/373#:~:text=%EC%A0%84%EB%B0%A9%ED%83%90%EC%83%89(lookahead)%20%ED%8C%A8%ED%84%B4%EC%9D%80,%EA%B0%80%20%EC%98%A4%EB%8A%94%20%ED%95%98%EC%9C%84%ED%91%9C%ED%98%84%EC%8B%9D%EC%9E%85%EB%8B%88%EB%8B%A4.

반응형
저작자표시 비영리 (새창열림)

'정규표현식' 카테고리의 다른 글

전방 탐색과 후방 탐색 (Regex Lookaround match) 이란?  (0) 2023.04.04
정규표현식 ? (물음표) 기호 사용법 (non-greedy matching, lazy-quantifier)  (0) 2023.04.02
    '정규표현식' 카테고리의 다른 글
    • 전방 탐색과 후방 탐색 (Regex Lookaround match) 이란?
    • 정규표현식 ? (물음표) 기호 사용법 (non-greedy matching, lazy-quantifier)
    Jake Seo
    Jake Seo
    ✔ 잘 보셨다면 광고 한번 클릭해주시면 큰 힘이 됩니다. ✔ 댓글로 틀린 부분을 지적해주시면 기분 나빠하지 않고 수정합니다. ✔ 많은 퇴고를 거친 글이 좋은 글이 된다고 생각합니다. ✔ 간결하고 명료하게 사람들을 이해 시키는 것을 목표로 합니다.

    티스토리툴바