3.144.172.115
3.144.172.115
close menu
KCI 등재
한국어 학습자 말뭉치 주석의 요건과 실제 - 형태 분석 말뭉치 구축을 중심으로 -
Factors and Practice of Korean Learner Corpus Annotation
김한샘 ( Kim Han-saem )
배달말 61권 149-173(25pages)
UCI I410-ECN-0102-2018-700-003743444

이 논문은 학습자 말뭉치 주석의 요건에 대해 살펴보고, 실제로 한국어 학습자 말뭉치를 형태 주석하는 데에 기준이 되는 지침을 소개하는 것을 목적으로 한다. 말뭉치 주석은 유의미성, 정확성, 일관성, 복원성, 효율성, 용이성 등의 요건을 충족시켜야 한다. 학습자 말뭉치를 주석할 때는 학습자 오류가 포함되어 있는 학습자 중간언어의 특성 때문에 정확성과 일관성을 갖추기가 힘들다. 이에 작업자 간 불일치를 해소하기 위한 상세한 지침과 각 태그에 대응하는 주석 대상의 목록이 필수적이다. 국립국어원에서 구축 중인 한국어 학습자 형태 분석 말뭉치는 모어 화자 말뭉치와의 호환성을 위해 21세기 세종계획의 형태 주석 말뭉치 지침을 기본으로 한다. 학습자 말뭉치의 형태 주석은 다음 단계의 오류 주석과 긴밀하게 관련을 맺고 있기 때문에 오형태, 누락, 첨가, 대치 등 학습자 오류의 양상을 고려한 세부 지침이 추가되어 적용된다.

This paper examines the requirements of learner corpus annotation and aims to introduce guidelines that are the basis for annotating of Korean learner corpus in practice. Corpus annotations must meet the requirements of meaningfulness, accuracy, consistency, resilience, efficiency, and simplicity. When annotators attach tags for learner corpus, it is difficult to achieve accuracy and consistency due to the nature of the learner interlanguage that contains learner errors. Therefore, detailed guidelines for resolving the inconsistency between workers and a list of annotation objects corresponding to each tag are essential. The Korean learner corpus built by the National Institute of the Korean Language is based on the corpus annotation guideline of the 21st century Sejong Project for compatibility with the mother language corpus. Since the morphological annotation of the learner corpus is closely related to the error annotation of the next step, detailed guidelines are added to take into account the aspect of learner errors such as omission, addition, and replacement.

[자료제공 : 네이버학술정보]
×