3.22.181.211
3.22.181.211
close menu
KCI 등재
담화정보 주석기법에 의한 학술논문 자동요약
Resume automatique de textes scientifiques par une methode d`annotation discursive
앙뚜완블레 ( Antoine Blais ) , 박시현 ( Shi Hyeon Pak ) , 서정연 ( Jung Yeon Suh ) , 서종석 ( Jong Seok Soh )
불어불문학연구 77권 79-120(42pages)
UCI I410-ECN-0102-2012-510-000165624

자동요약 분야는 텍스트의 요약을 자동적으로 추출하여 제공해 준다는 의미에서 많은 관심을 받고 있는 분야이다. 텍스트의 중요한 정보들을 요약의 형태로 제공한다는 것은 무엇보다 사용자들에게 시간을 절약하게 해주기에 자동요약은 정보 탐색분야에서 주요한 위치를 점유하고 있다. 이미 많은 방법들이 효율적인 텍스트 요약을 목표로 선을 보였는데, 본 논문에서 우리는 자동담화주석에 입각하여 텍스트의 요약문을 추출하는 접근방법을 소개한다. 텍스트의 담화주석(annotation discursive)은 엑스콤(EXCOM)이라 불리는 플랫폼에서 자동적으로 실행된다. 엑스콤은 언어적 지식을 기반으로 실행되며 맥락탐색기법을 토대로 만들어진 시스템이다. 맥락탐색기법은 형태통사적인 분석이나 통사적인 분석 없이 텍스트의 표층에 나타난 언어 표지들을 식별하도록 고안된 방법이다. 본 연구는 맥락탐색기법을 토대로 특히 학술논문 분야의 텍스트 처리를 목표로 한다. 본고에서는 여러 담화 범주들이 의미카드라는 개념을 통해 제시되며 텍스트에서 이들을 식별할 수 있게 하는 여러 표지들과 주석 규칙들이 제안된다. 텍스트의 담화 주석은 텍스트가 담고 있는 정보 범주를 드러나게 해주는 역할을 한다. 요약문을 구성하는 방법은 주어진 텍스트에 하나의 요약 전략을 적용하는 데 있는데, 이 전략은 가장 관여적이라 판단되는 범주들에 속한 모든 텍스트 절분들을 추출하여 요약문을 구축하는 것이다. 본고에서 우리는 인간이나 다른 전산 시스템으로 구현된 결과를 엑스콤으로 얻은 결과와 비교 평가한다. 본 연구는 일차적으로 프랑스어 텍스트를 대상으로 삼았으나, 사용된 언어적 지식과 담화 범주들은 다른 언어들에도 적용할 수 있다고 판단된다. 본 연구의 향후 목표는 다국어 주석 시스템을 구축하는 것이며 특히 그 우선 대상이 한글 문서의 정보추출 가능성을 살펴보는 것으로, 몇 가지 적용결과를 소개한다.

[자료제공 : 네이버학술정보]
×