18.226.169.94
18.226.169.94
close menu
KCI 등재
한국어 언어 자원 분석의 표준 -형태 분석을 중심으로-
A Study on Standard of Language Resource Annotation in Korean
김한샘 ( Han-saem Kim )
배달말 58권 1-31(31pages)
UCI I410-ECN-0102-2017-710-000309608

자연언어처리 분야에서 표준은 서로 다른 주체가 생성한 언어 자원을 공유하기 위한 상호호환성을 보장하기 위해 필요하다. 새로운 언어 자원을 구축하는 기준이 되기도 하지만 기구축된 언어 자원을 재사용하거나 병합하는데에도 표준은 중요한 역할을 하게 된다. 공개된 언어 자원이 누구에게나 익숙하고 접근 가능한 표준적인 형식으로 되어 있다면 연구의 재연성이 보장되고 개인과 기관, 대학 등에서 산발적으로 구축한 언어 자원이 연구의신뢰도를 높일 만한 수준의 규모로 재구성될 수 있다.형태 주석과 관련한 국제 표준은 ‘Morpho-syntactic annotation framework’이고 ‘Word segmentation of written text’은 동북아 언어의 단어 분할 단위 설정을 위해 따로 만든 국제 표준이다. 한국정보통신기술협회에서 관리하는 국내 표준은 최근 21세기 세종계획의 형태 분석 지침을 바탕으로 갱신되었는데 내적 일관성과 언어 단위의 적용 면에서 개선이 필요하다. 국제 표준을 현지화하기 위해서는 한국어 기준 표준 모형, 가이드라인이 개발되어야 하고, 언어 자원에 표준을 일관되게 적용하기 위해서는 지침의 기계가독화 노력이 필요하다.

they also play essential roles to reuse or combine the existing language resources. If the disclosed language resource follows the accessible standard form familiar to everyone, the resuscitation of researches is secured, and the language resources sporadically established by individuals, institutes, and colleges can be recomposed in the level of increasing the reliability of researches. The international standard related to morpho-annotation is the ‘morphosyntactic annotation framework’ while the international standard related to lexical annotation is the ‘lexical markup framework’. The ‘word segmentation of written text’ is the standard applying to morpho/lexical cases including multi-lexical expressions. However, the reality of the natural language process of Korean does not have the international interoperability through the application of standards. To apply the standard information description system to the characteristics of Korean language, it should be modified by reflecting the characteristics of Korean language, and also the stereotyped models based on proper standards should be developed. It is still in the stage of simply translating the international standards into Korean ones. In the future, however, it would be necessary to develop the standard model based on Korean language to actually localize the international standards, and also guidelines to concretely apply it to Korean language resources.

1. 머리말
2. 한국어의 표준과 언어 정보 처리
3. 형태 주석의 국제 표준
4. 한국어 형태 분석의 표준
5. 맺음말
[자료제공 : 네이버학술정보]
×