초록보기
우리나라는 예로부터 중국과 정치, 외교, 경제적인 면에 있어 매우 긴밀한 관계에 있었으며, 이로 인해 다양한 조선시대 중국어 역학서가 편찬되었다. 이러한 중국어 역학서는 근대 어휘, 어음, 문화의 특징과 변화상을 알 수 있는 매우 중요한 자료로 학계에서 많은 연구가 되어왔으나 우리나라는 서적을 중심으로 하는 연구 방법과 환경에서 벗어나지 못하고 있으며, 고문헌에 대한 디지털화 작업이 매우 초보적인 단계에 머물러 있다. <국립중앙도서관>이나 <규장각 원문검색서비스>에서는 대부분 원문 이미지만을 제공하며, <한국어 역사 자료 말뭉치>는 디지털 텍스트를 제공하지만, 원문에 대한 전체 정보를 제공하지는 않으며, < 조선시대 외국어 학습서 DB >에서는 언해문이 디지털 텍스트로 정리되어 있고, 특정 단어를 기준으로 검색이 가능하나 사용성이 떨어진다. 이에, 본 연구는 『老乞大諺解』, 『朴通事諺解』, 『譯語類解』, 『伍倫全備諺解』, 『譯語類解補』, 『朴通事新釋諺解』, 『重刊老乞大諺解』, 『華音啓蒙諺解』, 『華語類抄』 등 9개의 중국어 역학서를 대상으로 어음, 어휘 시맨틱 데이터를 구축하였다. 어음 데이터는 원문의 입력을 거쳐 좌음, 우음 등의 정보, 『廣韻』, 현대 중국어 병음을 데이터로 구축하였으며, 어휘 데이터는 ‘명칭 및 호칭’, ‘장소명’, ‘지명’, ‘복식’, ‘음식’, ‘주거’, ‘식물’, ‘동물’, ‘매매’, ‘서명’의 10개 주제와 관련된 어휘를 추출하여 엑셀 시트에 해당 어휘, 주제, 뜻을 정리하고 어휘와 원문, 어휘와 번역문을 연결하는 데이터를 구축하였고, RDB(Relational Database) 적재를 위한 TSV(Tab Separated Values) 형식과 온라인 서비스를 위한 XML(eXtensible Markup Language) 형식으로 변환하였다. 이는 조선시대 중국어 역학서를 이용하여 고도화된 정보를 제공하는 최초의 종합 데이터베이스로, 향후 국내 문헌을 기반으로 한 다양한 분야의 디지털화를 진작시키는데 기여할 것이다.