반응형
Jake Seo
제이크서 위키 블로그
Jake Seo
전체 방문자
오늘
어제
  • 분류 전체보기 (715)
    • 일상, 일기 (0)
    • 백준 문제풀이 (1)
    • 릿코드 문제풀이 (2)
    • 알고리즘 이론 (10)
      • 기본 이론 (2)
      • 배열과 문자열 (8)
    • 데이터베이스 (15)
      • Planet Scale (1)
      • MSSQL (9)
      • 디비 기본 개념 (1)
      • SQLite 직접 만들어보기 (4)
    • 보안 (7)
    • 설계 (1)
    • 네트워크 (17)
      • HTTP (9)
      • OSI Layers (5)
    • 회고 (31)
      • 연간 회고 (2)
      • 주간 회고 (29)
    • 인프라 (52)
      • 도커 (12)
      • AWS (9)
      • 용어 (21)
      • 웹 성능 (1)
      • 대규모 서비스를 지탱하는 기술 (9)
    • 깃 (7)
    • 빌드 도구 (7)
      • 메이븐 (6)
      • 그레이들 (0)
    • Java (135)
      • 이펙티브 자바 (73)
      • 자바 API (4)
      • 자바 잡지식 (30)
      • 자바 디자인 패턴 (21)
      • 톰캣 (Tomcat) (7)
    • 프레임워크 (64)
      • next.js (14)
      • 스프링 프레임워크 (28)
      • 토비의 스프링 (6)
      • 스프링 부트 (3)
      • JPA (Java Persistence API) (5)
      • Nest.js (8)
    • 프론트엔드 (48)
      • 다크모드 (1)
      • 노드 패키지 관리 매니저 (3)
      • CSS (19)
      • Web API (11)
      • tailwind-css (1)
      • React (5)
      • React 새 공식문서 요약 (1)
      • HTML (Markup Language) (5)
    • 자바스크립트 (108)
      • 모던 자바스크립트 (31)
      • 개념 (31)
      • 정규표현식 (5)
      • 코드 스니펫 (1)
      • 라이브러리 (6)
      • 인터뷰 (24)
      • 웹개발자를 위한 자바스크립트의 모든 것 (6)
      • 팁 (2)
    • Typescript (49)
    • 리눅스와 유닉스 (10)
    • Computer Science (1)
      • Compiler (1)
    • IDE (3)
      • VSCODE (1)
      • IntelliJ (2)
    • 세미나 & 컨퍼런스 (1)
    • 용어 (개발용어) (16)
      • 함수형 프로그래밍 용어들 (1)
    • ORM (2)
      • Prisma (2)
    • NODEJS (2)
    • cypress (1)
    • 리액트 네이티브 (React Native) (31)
    • 러스트 (Rust) (15)
    • 코틀린 (Kotlin) (4)
      • 자바에서 코틀린으로 (4)
    • 정규표현식 (3)
    • 구글 애널리틱스 (GA) (1)
    • SEO (2)
    • UML (2)
    • 맛탐험 (2)
    • 리팩토링 (1)
    • 서평 (2)
    • 소프트웨어 공학 (18)
      • 테스팅 (16)
      • 개발 프로세스 (1)
    • 교육학 (1)
    • 삶의 지혜, 통찰 (1)
    • Chat GPT (2)
    • 쉘스크립트 (1)
    • 컴파일 (2)
    • Dart (12)
    • 코드팩토리의 플러터 프로그래밍 (4)
    • 플러터 (17)
    • 안드로이드 스튜디오 (1)
    • 윈도우즈 (1)
    • 잡다한 백엔드 지식 (1)
    • 디자인 패턴 (1)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • 도커공식문서
  • 메이븐 골
  • 느린 쿼리
  • 객체복사
  • try-with-resources
  • prerendering
  • item7
  • 자바 검증
  • 토비의 스프링
  • 디자인패턴
  • 이펙티브 자바
  • 자료구조
  • 자바스크립트 면접
  • item8
  • 이펙티브자바
  • 스프링 검증
  • 프로그래머의 뇌
  • Pre-rendering
  • item9
  • pnpm
  • 자바스크립트 인터뷰
  • 메이븐 라이프사이클
  • serverless computing
  • rust
  • 싱글톤
  • 자바
  • 슬로우 쿼리
  • 참조 해제
  • 싱글턴
  • 메이븐 페이즈
  • 추상 팩터리 패턴
  • Java
  • NEXT JS
  • 팩터리 메서드 패턴
  • bean Validation
  • 작업기억공간
  • 빈 검증
  • 싱글톤 패턴
  • 자바스크립트
  • Javadoc 자바독 자바주석 주석 Comment
  • 외래키 제약조건
  • Next.js
  • 알고리즘
  • next js app
  • 서버리스 컴퓨팅
  • 자바 디자인패턴
  • MSSQL
  • 이펙티브 자바 item9
  • 플라이웨이트패턴
  • 러스트

최근 댓글

최근 글

티스토리

hELLO · Designed By 정상우.
Jake Seo

제이크서 위키 블로그

Abstract Syntax Tree (AST) 란 무엇인가?
Computer Science/Compiler

Abstract Syntax Tree (AST) 란 무엇인가?

2022. 6. 12. 15:28

Abstract Syntax Tree

개요

  • AST 는 Abstract Syntax Tree 혹은 단순히 Syntax Tree 라고 불린다.
  • 프로그래밍 언어로 작성된 소스 코드의 추상 구문 구조의 트리이다.
  • 추상적이라는 이유는 실제 구문에서 나타나는 모든 세세한 정보를 표현하지 않는다는 것을 의미한다.
    • 이를테면 코드에서 이해를 돕기 위한 그룹핑을 위한 괄호까지 명시적으로 분리된 노드로 표현될 필요는 없다.
    • 비슷하게, if-condition-then 구문은 3개의 브랜치를 가진 단일 노드로 표현될 수 있다. (위의 예제 그림에서 condition, assign (if-body), assign (else-body) 을 살펴볼 수 있다.)
    • 이렇게 세세한 정보까진 표현하지 않는다는 것이 Concrete Syntax Trees 와 구분된다.
  • AST 가 만들어진 이후에는 Contextual Analysis 와 같은 과정을 통해 추가적인 정보가 AST 에 추가된다.
  • AST 는 프로그램 분석, 프로그램 변환 시스템에서 사용된다.

자바스크립트 예제로 알아보기

예제는 astexplorer.net 에서 체험해볼 수 있다.

간단한 예제 코드

function consolelog() {
  console.log("hi");
}

위의 함수를 AST 형태로 변형해보자.

AST Tree

차례대로 해석해보면,

  • 프로그램이 있다.
    • 내부에 body 가 있다.
      • body 내부에는 함수 정의가 있다.
        • 정의된 함수의 ID 는 consolelog 이다.
        • 이 함수는 expression 이 아니다.
        • 이 함수는 generator 가 아니다.
        • 이 함수는 async 가 아니다.
        • 파라미터가 없다.
        • Body 에는 BlockStatement 가 있다.

위와 같은 정보를 내포하고 있다.

JSON 형태로 살펴보기

{
  "type": "Program",
  "start": 0,
  "end": 36,
  "body": [
    {
      "type": "FunctionDeclaration",
      "start": 0,
      "end": 36,
      "id": {
        "type": "Identifier",
        "start": 9,
        "end": 10,
        "name": "a"
      },
      "expression": false,
      "generator": false,
      "async": false,
      "params": [],
      "body": {
        "type": "BlockStatement",
        "start": 13,
        "end": 36,
        "body": [
          {
            "type": "ExpressionStatement",
            "start": 17,
            "end": 34,
            "expression": {
              "type": "CallExpression",
              "start": 17,
              "end": 33,
              "callee": {
                "type": "MemberExpression",
                "start": 17,
                "end": 28,
                "object": {
                  "type": "Identifier",
                  "start": 17,
                  "end": 24,
                  "name": "console"
                },
                "property": {
                  "type": "Identifier",
                  "start": 25,
                  "end": 28,
                  "name": "log"
                },
                "computed": false,
                "optional": false
              },
              "arguments": [
                {
                  "type": "Literal",
                  "start": 29,
                  "end": 32,
                  "value": "a",
                  "raw": "\"a\""
                }
              ],
              "optional": false
            }
          }
        ]
      }
    }
  ],
  "sourceType": "module"
}

컴퓨터가 소스코드를 이해하려면?

컴파일러는 우리가 작성한 소스코드에서 위와 같은 계층 구조로 된 정보를 추출해낸다. 이를 추상적인 Tree 로 만든 것을 Abstract Syntax Tree 라고 한다. 사실 AST 를 만드는 과정 이전에도 고수준의 컴퓨터 코드를 컴퓨터가 이해하는 바이트 코드로 변환하는 단계 등이 더 있다.

AST 를 생성하는데는 렉시컬 분석과 신택스 분석이 중요하다.

렉시컬 분석 (Lexical Analysis)

코드의 문자를 읽어 정해진 규칙에 따라 이들을 토큰으로 만들어 합친다. 이 과정에서 공백, 주석등은 삭제한다. 렉시컬 분석기는 소스 코드를 글자 단위로 읽으며 공백, 연산자 기호, 특수 기호 등을 만나면 해당 단어가 끝났다고 인지하고 하나의 토큰으로 만든다.

신택스 분석 (Syntax Analysis)

결과로 나온 토큰 목록을 트리 구조로 만들고 구조적, 언어적으로 문제가 있다면 에러를 내뱉는다. 트리 구조를 만들며 불필요한 토큰 (중복된 괄호 등) 은 생략한다. 결과로 Abstract Syntax Tree 가 만들어진다.

소스코드와의 차이

  • AST 는 모든 요소에 대한 properties 와 annotation 과 같은 정보를 통해 수정되거나 향상될 수 있다.
    • 이러한 수정은 소스코드에서는 프로그램의 변경을 의미하기 때문에 불가능하다.
    • fixme: ??? 이 부분은 위키피디아에 나와있지만, 무슨 얘기인지 사실 잘 이해가 되지 않는다.
  • 소스코드와 다르게 구분자(괄호, 세미콜론)를 가지고 있지 않다.
    • 위에서 배웠듯 렉시컬 분석에서 이러한 정보를 삭제했다.
  • 프로그램에 대해 유용한 추가적인 정보를 내포한다.
    • 소스 코드에서 각 요소가 어디쯤 위치해있는지 position 정보를 알고 있다.
    • 컴파일러는 이를 통해 코드가 어디쯤에서 잘못되었는지에 대한 유용한 에러메세지를 알려줄 수 있다.

레퍼런스

  • https://ko.wikipedia.org/wiki/%EC%B6%94%EC%83%81_%EA%B5%AC%EB%AC%B8_%ED%8A%B8%EB%A6%AC
  • https://en.wikipedia.org/wiki/Abstract_syntax_tree
  • https://yceffort.kr/2021/05/ast-for-javascript
    • 이 레퍼런스를 강추한다.
  • https://astexplorer.net/
반응형
저작자표시 비영리 (새창열림)
    Jake Seo
    Jake Seo
    ✔ 잘 보셨다면 광고 한번 클릭해주시면 큰 힘이 됩니다. ✔ 댓글로 틀린 부분을 지적해주시면 기분 나빠하지 않고 수정합니다. ✔ 많은 퇴고를 거친 글이 좋은 글이 된다고 생각합니다. ✔ 간결하고 명료하게 사람들을 이해 시키는 것을 목표로 합니다.

    티스토리툴바