18.222.22.244
18.222.22.244
close menu
KCI 등재
한국어 말뭉치 구축의 현황 - 연세 말뭉치를 중심으로 -
A Research on Status of the construction of Korean corpus - Focused on the Yonsei corpus -
김한샘 ( Kim Han-saem )
반교어문연구 45권 11-34(24pages)
UCI I410-ECN-0102-2018-800-000370197

연세 말뭉치는 양적인 확장과 질적인 완성도 제고라는 두 가지 방향성을 가지고 꾸준히 구축되어 왔으며 말뭉치의 품질을 높이기 위한 연구가 병행되고 있다. 말뭉치는 원 자료의 매체가 무엇이냐에 따라 문어 말뭉치, 구어 말뭉치, 다면 자료 말뭉치로 나눌 수 있으며 시간의 흐름에 따른 변화 포착이 목적인지 여부에 따라 공시적 언어 자원과 통시적 언어 자원으로 나눌 수 있고, 언어 자원 생산자의 거주 지역, 성별, 사회적 계층에 따라 다른 성격의 언어 자원이 생성되며 텍스트 자체의 특성을 결정짓는 장르에 따라서도 분류할 수 있다. 연세 말뭉치는 원시 말뭉치, 형태소 주석 말뭉치, 어휘 주석 말뭉치, 다의어 주석 말뭉치, 몸짓 주석 말뭉치 등 주석 단계별로 다양한 말뭉치를 포함하며 시기적으로는 현대 한국어 형성기라 볼 수 있는 1800년대 후반 이후의 텍스트를 골고루 포함하고 있다. 연세 말뭉치는 말뭉치의 원자료 매체가 문자 언어, 음성 언어, 발화 영상, SNS로 다양하며 활용 분야도 사전 편찬, 언어 연구, 언어 교육, 학제적 연구 등으로 다양하다.

The Yonsei corpus has been constructed steadily with two directions : quantitative expansion and quality improvement, and research is conducted to improve the quality of corpus. A corpus can be divided into an octopus corpus, a spoken corpus, and a polyhedron corpus depending on what the medium of the original data is, and it can be divided into a temporal language resource and a communicative language resource depending on whether the purpose is to capture change with time, Language resources of different characteristics are generated according to the residence area, sex, and social class of the language resource producer, and the language resource can be classified according to the genre which determines the characteristics of the text itself. The Yonsei corpus includes various corpus of Chinese corpus such as primitive corpus, morpheme annotation corpus, vocabulary annotation corpus, vernacular annotation corpus, gesture annotation corpus, and evenly includes texts from late 1800s is. The Yonsei corpus varies in the source language of the corpus as the text language, the spoken language, the spoken language, and SNS, and the fields of application vary in dictionary compilation, language research, language education, and interdisciplinary research.

1. 머리말
2. 말뭉치 구축 현황
3. 말뭉치의 주석
4. 맺음말
[자료제공 : 네이버학술정보]
×