3.135.183.1
3.135.183.1
close menu
KCI 등재
영화의 흥행 성과와 리뷰 감정어휘와의 관계 분석
Relationship Analysis between the Box Office Performance and Sentimental Words in Movie Review
문성민(주저자) ( Seong Min Mun ) , 하효지(공동저자) ( Hyo Ji Ha ) , 이경원(교신저자) ( Kyung Won Lee )
UCI I410-ECN-0102-2016-600-000411857

본 연구는 영화 리뷰 값이 1000개 이상인 673개의 영화를 대상으로 영화 장르별로 관객들이 느끼는 감정 어휘의 분포를 탐색하고 영화 흥행도와 감정 어휘의 관계를 파악하는데 목적이 있다. 분석을 위해 네이버 영화 리뷰를 크롤링하고 감정 어휘 사전을 활용하여 7개의 대표 감정 어휘, 영화 티켓 판매액, 영화 관람 관객 수, 상영 스크린 수, 한 스크린 당 영화 관람 관객 수, 영화의 장르, 영화의 영문 이름으로 구성된 데이터를 생성하였다. 연구 목적을 위한 분석은 상관관계 분석 방법과 Parallel coordinates 시각화 분석 방법을 사용하였다. 연구 결과로는 첫째, 장르에 따른 영화 흥행도를 분석하여 영화 흥행도가 가장 높은 장르는 코미디이고 가장 낮은 장르는 호러라는 결과를 확인하였다. 둘째, 모든 장르에서 ``Happy``와 ``Surprise``의 값이 높게 나오지만 다른 장르들에 비해 판타지 장르의 영화는 지루한 감정이 많이 느껴지고, SF장르의 영화는 화나는 감정이 많이 느껴진다는 결과를 확인 하였다. 셋째, 모든 장르의 감정 어휘 별 상관관계를 분석하여 Disgust``의 값이 높아질 때 ``Anger``의 값도 높아지고, ``Happy``의 값이 높아질 때 ``Surprise``의 값은 낮아진다라는 결과를 확인하였다. 넷째, 영화 흥행도에 따른 감정 어휘를 분석하여 영화 흥행도와 ``Happy``는 선형 관계이지만 영화 흥행도와 ``Fear``는 비선형 관계인 것을 확인 하였다.

This study aims to understand distribution of the sentimental words on each genre and find relationship between box office performance and sentimental words in movie review using 673 movies that have more than 1,000 reviews. For the analysis, crawling movie reviews and made data was composed movie genre, movie name, sales, attendance, screen, normal attendance, 7 sentimental words. For analysis results, we used correlation analysis and Parallel coordinates. As a results, First, the highest box office value of the genre is comedy and the lowest box office value of the genre is horror through analyze box office on each genre. Secondly, Movie genre of fantasy feel a lot of boring emotion and Movie genre of SF feel a lot of anger emotion even if ``Happy`` and ``Surprise`` have highest sentiment value on every genre. Third, We found ``Anger`` increase sentimental value when ``Disgust`` increase sentimental value and ``Surprise`` decrease sentimental value when ``Happy`` increase sentimental value through analyze correlation relationship between sentimental words using total data. Fourth, We found ``Happy`` have linear relationship between box office and ``Fear`` have non-linear relationship between box office through analyze sentimental words according to box office performance.

[자료제공 : 네이버학술정보]
×