인간이 다루어야 할 정보가 기하급수적으로 증가하는 문제를 다루기 위해 전산언어학 및 자연어처리 커뮤니티에서는 문서 요약의 자동화 기법이 연구되고 있다. 1950년대부터 시작된 자동 문서 요약 연구는 여러 유형의 문서를 다루면서 단일/다중 문서 요약, 질의 관련 다중 문서 요약 등의 다양한 태스크에 적용하기 위한 추출 및 추상 방식 요약 기법을 시도해 왔다. 이 논문은 추출 방식을 중심으로 텍스트 자동 요약 기술의 현황을 제시하고 요약 평가 방법과 대규모 자동 요약 대회에 대한 개괄 및 향후 과제에 대해 기술한다.
Information that human should read grows exponentially. To deal with this problem, computational linguistics and natural language processing communities have attempted to automate summarizing text. Since its start in 1950`s, automated text summarization has handled single-/multi-document summarization using extracting and abstracting techniques, and nowadays specialized its tasks to query-focused multi-document summarization. This paper gives the current state of automatic text summarization techniques focusing on robust, practical extraction-based methods, and describes evaluation methodologies and large-scale summarization evaluation conferences. Finally, future issues are discussed.