본문 내용으로 건더뛰기

KDI 경제교육·정보센터

ENG
  • 경제배움
  • Economic

    Information

    and Education

    Center

최신자료
경제 텍스트 데이터를 활용한 키워드 분석방안 연구
한국은행
2022.05.30
한국은행은 『경제 텍스트 데이터를 활용한 키워드 분석방안 연구』을 발표하였다.

- 일상생활에서 쉽게 접할 수 있는 빅데이터 중의 하나로서 뉴스 데이터는 국내외 경제의 빠른 변화를 반영한 신속한 경제동향 분석과 경제정책 수립·점검을 위해서 매우 유용하게 활용되고 있음.

- 본 연구는 국내 경제뉴스 기사에 포함된 텍스트를 통합·연계하여 경제심리지수에 영향을 미치는 보다 정확한 키워드 및 토픽 정보를 추출하여, 대표적인 경제 분야의 통계값인 경제심리지수(ESI)와의 관련성을 추적하고자 하는 필요성에서 출발함.

- 먼저 클러스터링 분석을 통하여 경제 관련 뉴스 기사의 범위를 정하였으며, 토픽모델의 품질을 향상시키기 위하여 경제뉴스 텍스트에 적합한 형태소 분석도구를 선정하여 불용어 제거 및 복합어 추출을 수행. 나열식 키워드 집합으로서의 토픽모델의 해석 가능성을 높이기 위해서 키워드 간 시맨틱 유사도를 산출하여 토픽그래프를 생성하는 시스템 구축.

- 토픽모델 내 키워드들간의 시맨틱 유사도의 신뢰도를 높이기 위해서 전체 뉴스 데이터를 Word2Vec 및 Node2Vec으로 비지도 학습한 임베딩 공간을 생성함. 또한 토픽그래프 내에 소단위 개념으로 정의될 수 있는 완전그래프 부분을 추출할 수 있는 기능을 개발함.

<목차>
Ⅰ. 서론
Ⅱ. 경제 텍스트마이닝을 위한 전처리
1. 클러스터링 기반 뉴스 카테고리 선정
2. 불용어 처리
3. 경제뉴스 텍스트 형태소 분석
Ⅲ. 경제 텍스트 키워드 분석
1. 토픽모델링 분석
2. 토픽그래프 분석
Ⅳ. 결론 및 시사점
부 록
1. 텍스트웨어하우스 구축