본 연구는 비정형 빅데이터 분석 방법 중 하나인 텍스트 마이닝과 계층적 군집분석을 통해 19대 대통령 선거기간 동안 언론보도가 문재인과 안철수 두 후보를 중심으로 강조한 키워드를 통해 주요하게 드러난 의제들을 살펴보고, 이들 의제들이 5개 유권자 투표 결정 요인(후보자, 정당, 이슈, 정책, 유권자)중 어떤 속성을 띠고 있는지 살펴보았다. 연구 결과, 1∼3주차는 헌법재판소의 박근혜 대통령 탄핵 인용 결정 관련 의제들과 대선주자들의 대권 출마공식 선언, 범보수 진영의 후보 단일화 등이, 4∼6주차는 각 당의 경선 관련 의제와 문재인 안철수 후보의 양자 대결 구도, 후보자간 검증 공방 관련 의제 등이, 7∼9주차는 공식 선거운동 돌입과 함께 TV토론회에서의 후보자간 공방과 네거티브 검증 관련 의제, 사전투표, 가짜뉴스 의제 등이 주요 선거 의제로 나타났다. 다음으로 선거 의제들의 속성을 살펴본 결과, 후보자 및 후보자 가족에 대한 검증, 후보자의 언행, 과거 행적 등 후보자 요인 속성 의제가 두드러진 것을 발견했다. 선거 이슈 속성 의제는 박근혜 대통령 파면, 최순실 게이트, 사드, 반문 연대, 후보 단일화, 가짜 뉴스를 중심으로 나타났으며, 정당 요인 속성 의제는 각 당 경선과 정당인들의 발언 논란 관련 의제, 유권자 요인 속성 의제는 호남홀대론 공방 의제 등이 있었다.
This study analyzed the two major candidate-related agenda appearing at news media during the 19th presidential election. For the analysis, the authors attempted to extract keywords from news by using text mining and hierarchical cluster analysis. There were two major research findings. The first research result showed that the keywords appearing at news would prime the following agendas: president Park Geun-hye’s impeachment, major candidates’ running for presidency, and anti-Moon alliance for the first three weeks; primary election, two-way race between Moon Jae-in and Ahn Chul-su, and candidates’ qualification checking for the second three weeks; negative campagin and fake news concerning candidates for the last three weeks. The second one indicated that the keywords related to a candidate and candidates’ family would be most primed; keywords about election issues such as impeachment, arrangement of THAAD(Terminal High Altitude Area Defense), anti-Moon alliance, and fake news would be next primed. Compared to the above keywords, political party and voters-related keywords would not be important.