글로버메뉴 바로가기 본문 바로가기 하단메뉴 바로가기

논문검색은 역시 페이퍼서치

> 중국학연구회 > 중국학연구 > 95권 0호

감성분석과 딥러닝을 적용한 재중동포 서신 빅데이터 분석

Applying Sentiment Analysis and Deep Learning to Correspondence Big Data from Koreans Living in China

김현희 ( Kim Hyon Hee ) , 조진남 ( Jo Jinnam )

- 발행기관 : 중국학연구회

- 발행년도 : 2021

- 간행물 : 중국학연구, 95권 0호

- 페이지 : pp.201-230 ( 총 30 페이지 )


학술발표대회집, 워크숍 자료집 중 1,2 페이지 논문은 ‘요약’만 제공되는 경우가 있으니,

구매 전에 간행물명, 페이지 수 확인 부탁 드립니다.

7,000
논문제목
초록(한국어)
본 논문은 빅데이터 분석 기술을 재중 동포 서신 빅데이터에 적용하여 인공지능 기반의 인문학 연구를 위한 새로운 방법을 제시하였다. 연구에 사용된 서신 빅데이터는 1974년도에서 2008년도까지 진행된 KBS 한민족 방송 가족 찾기 프로그램으로 발송된 재중 동포 서신 약 8만 여 통이다. 서신의 주 내용은 고향에 있는 가족을 찾는 내용이지만, 본 연구에서 초점을 둔 것은 중국과의 공식 수교가 단절되었던 시기에 재중 동포의 삶과 문화를 서신으로부터 찾아내는 것이다. 이를 위해 8만 여통의 서신을 데이터베이스로 구축하여 운영하고 있으며, 감성 분석, 딥러닝, 그리고 설명가능 인공지능 기술을 적용하여 서신 내용을 분석하였다. 감성 분석은 서신에 등장한 형용사만 추출하여 긍정 형용사와 부정 형용사로 나눈 다음, 텍스트의 내용이 긍정적인 내용인지 부정적인 내용인지 판별한다. 긍정 및 부정 형용사를 점수화하기 위해서 공개된 한국어 감성사전에 본 서신에서 사용된 형용사들을 추가하여 처리하였고, 정규화하여 점수를 산출하였다. 한국, 중국, 그리고 일본을 언급한 서신 내용에 대해 감성 분석을 시기별로 분석한 결과 한국에 대한 긍정 점수가 가장 높고 지속적으로 증가함을 알 수 있었다. 부정 점수의 경우는 일본이 초기에는 가장 높았으나 후반부로 갈수록 급격히 하락하였으며, 이는 한중 수교 이후 재중 동포의 관심이 한국으로 집중되었기 때문이라고 할 수 있다. 서신의 내용을 분석하기 위해서 딥러닝을 적용하여 서신을 주제별로 학습시키고 자동 분류를 하도록 하였으며, 설명가능 인공지능 기술인 로컬 대리 분석을 적용하여 주제를 분류하는데 중요한 역할을 한 주요 단어들을 제시하였다. 정치 분야에서는 한중수교, 문화혁명 등이, 그리고 경제 분야에서는 무역, 사업 등이 주요 키워드로 등장하였다. 본 연구는 빅데이터 분석 기술이 인문학 연구에서도 성공적으로 활용될 수 있다는 것을 보여준다.
초록(외국어)
In this paper, we presented a new approach to do research in the humanities based on artificial intelligence. A correspondence database was built using letters from ethnic Koreans living in China sent to Korea Broadcasting System (KBS) for finding separated families. Sentiment of Koreans living in China related to Korea, China, and Japan is analyzed according to the time period. Korea has the highest positive score, and Japan has the lowest positive score. The positive scores of South Korea and China increase, but Japan’s positive score decreases according to the time periods. Deep learning and explainable artificial intelligence are applied to the correspondence database to analyze content of letters,. In the subject of politics, Korea-China diplomatic relation and Cultural revolution are extracted, and in the subject of economy, business and trade are extracted. This research shows that the technology of the big data analysis are successfully applied to humanities studies.

논문정보
  • - 주제 : 어문학분야 > 언어학
  • - 발행기관 : 중국학연구회
  • - 간행물 : 중국학연구, 95권 0호
  • - 발행년도 : 2021
  • - 페이지 : pp.201-230 ( 총 30 페이지 )
  • - UCI(KEPA) :
저널정보
  • - 주제 : 어문학분야 > 언어학
  • - 성격 : 학술지
  • - 간기 : 계간
  • - 국내 등재 : KCI 등재
  • - 해외 등재 : -
  • - ISSN : 1229-3458
  • - 수록범위 : 1984–2021
  • - 수록 논문수 : 1493