글로버메뉴 바로가기 본문 바로가기 하단메뉴 바로가기

논문검색은 역시 페이퍼서치

> 인기논문 > 이슈논문

이슈논문 사회적으로 이슈가 되고 있는 주제와 관련된 논문을 추천해 드립니다.

이달의 핵심 키워드

딥러닝 언어모델과 중국어 문법 ―BERT를 활용한 방향보어의 예측 모형을 중심으로

강병규 ( Kang Byeongkwu )
한국중국어문학회|중국문학  106권 0호, 2021 pp. 29-57 (총 29pages)
6,900
초록보기
In this study, we investigated how accurately the BERT model can predict Chinese directional complement. In addition, we analyzed which words the BERT model uses as an important clue in the Chinese directional complement inference process. According to the results of this study, it can be seen that the BERT model shows excellent performance in inferring distributional features and grammatical relationships based on transfer learning. Results of experiments with five Chinese directional complements show that the accuracy rate of predictions is quite high. In addition, as a result of analysis using the masked language model, it was found that the BERT model appropriately uses important clues to determine Chinese directional complement in context. We believe that this study is not only meaningful in the field of NLP, but also provides insight into Chinese grammar research or language education. If this methodology is properly utilized, it will be possible to establish an application system for Chinese grammar research and education. In Neural network models, sufficient language data learning allows us to predict which language expressions are more natural to use. Proper use of these advantages will give us insight into Chinese grammatical functions. This Chinese grammar prediction system will also help Chinese learners improve their skills by showing them what expressions are grammatically correct.

감성분석과 딥러닝을 적용한 재중동포 서신 빅데이터 분석

김현희 ( Kim Hyon Hee ) , 조진남 ( Jo Jinnam )
중국학연구회|중국학연구  95권 0호, 2021 pp. 201-230 (총 30pages)
7,000
초록보기
본 논문은 빅데이터 분석 기술을 재중 동포 서신 빅데이터에 적용하여 인공지능 기반의 인문학 연구를 위한 새로운 방법을 제시하였다. 연구에 사용된 서신 빅데이터는 1974년도에서 2008년도까지 진행된 KBS 한민족 방송 가족 찾기 프로그램으로 발송된 재중 동포 서신 약 8만 여 통이다. 서신의 주 내용은 고향에 있는 가족을 찾는 내용이지만, 본 연구에서 초점을 둔 것은 중국과의 공식 수교가 단절되었던 시기에 재중 동포의 삶과 문화를 서신으로부터 찾아내는 것이다. 이를 위해 8만 여통의 서신을 데이터베이스로 구축하여 운영하고 있으며, 감성 분석, 딥러닝, 그리고 설명가능 인공지능 기술을 적용하여 서신 내용을 분석하였다. 감성 분석은 서신에 등장한 형용사만 추출하여 긍정 형용사와 부정 형용사로 나눈 다음, 텍스트의 내용이 긍정적인 내용인지 부정적인 내용인지 판별한다. 긍정 및 부정 형용사를 점수화하기 위해서 공개된 한국어 감성사전에 본 서신에서 사용된 형용사들을 추가하여 처리하였고, 정규화하여 점수를 산출하였다. 한국, 중국, 그리고 일본을 언급한 서신 내용에 대해 감성 분석을 시기별로 분석한 결과 한국에 대한 긍정 점수가 가장 높고 지속적으로 증가함을 알 수 있었다. 부정 점수의 경우는 일본이 초기에는 가장 높았으나 후반부로 갈수록 급격히 하락하였으며, 이는 한중 수교 이후 재중 동포의 관심이 한국으로 집중되었기 때문이라고 할 수 있다. 서신의 내용을 분석하기 위해서 딥러닝을 적용하여 서신을 주제별로 학습시키고 자동 분류를 하도록 하였으며, 설명가능 인공지능 기술인 로컬 대리 분석을 적용하여 주제를 분류하는데 중요한 역할을 한 주요 단어들을 제시하였다. 정치 분야에서는 한중수교, 문화혁명 등이, 그리고 경제 분야에서는 무역, 사업 등이 주요 키워드로 등장하였다. 본 연구는 빅데이터 분석 기술이 인문학 연구에서도 성공적으로 활용될 수 있다는 것을 보여준다.

해수 이용 LNG 재기화 공정의 딥러닝과 AutoML을 이용한 동적모델링

신용범 ( Yongbeom Shin ) , 유상우 ( Sangwoo Yoo ) , 곽동호 ( Dongho Kwak ) , 이나경 ( Nagyeong Lee ) , 신동일 ( Dongil Shin )
한국화학공학회|화학공학  59권 2호, 2021 pp. 209-218 (총 10pages)
4,500
초록보기
ORV의 열교환 효율 향상 및 운전 최적화를 위한, first principle 기반 모델링 연구들이 수행되어왔지만, ORV의 열전달 계수는 시간, 위치에 따라 불규칙한 시스템으로, 복잡한 모델링 과정을 거친다. 본 연구는 복잡한 시스템에 대한 데이터 기반 모델링의 실효성을 확인하고자, LNG 재기화 공정의 실제 운전데이터를 이용해, ORV의 해수 유량, 해수 온도, LNG 유량 변화에 따른 토출 NG 온도 및 토출 해수 온도의 동적 변화 예측이 가능한, FNN, LSTM 및 AutoML 기반 모델링을 진행하였다. 예측 정확도는 MSE 기준 LSTM > AutoML > FNN 순으로 좋은 성능을 보였다. 기계학습 모델의 자동설계 방법인 AutoML의 성능은 개발된 FNN보다 뛰어났으며, 모델 개발 전체소요시간은 복잡한 모델인 LSTM 대비 1/15로 크게 차이를 보여 AutoML의 활용 가능성을 보였다. LSTM과 AutoML을 이용한 토출 NG 및 토출 해수 온도의 예측은 0.5 K 미만의 오차를 보였다. 예측모델을 활용해, 겨울철 ORV를 이용해 처리 가능한 LNG 기화량의 실시간 최적화를 수행하여, 기존 대비 최대 23.5%의 LNG를 추가 처리 가능함을 확인하였고, 개발된 동적 예측모델 기반의 ORV 최적 운전 가이드라인을 제시하였다.

무인항공기 영상과 딥러닝 기반의 의미론적 분할 기법을 활용한 야적퇴비 탐지 연구

김나경 ( Na-kyeong Kim ) , 박미소 ( Mi-so Park ) , 정민지 ( Min-ji Jeong ) , 황도현 ( Do-hyun Hwang ) , 윤홍주 ( Hong-joo Yoon )
5,200
초록보기
야적퇴비는 대표적인 축산계 비점오염원으로 강우로 인해 수계로 유입될 경우 야적퇴비에 포함된 인과 질소 등의 영양염류가 하천 수질에 악영향을 미칠 수 있다. 이에 본 논문에서는 무인항공기 영상과 딥러닝 기반의 의미론적 분할 기법을 활용한 야적퇴비 탐지 방법을 제안한다. 연구지역에서 취득한 39개의 정사영상을 토대로 Data Augmentation을 통해 약 30,000개의 데이터를 확보하였다. 취득한 데이터를 U-net을 기반으로 개발된 의미론적 분할 알고리즘에 적용시킨 후 OpenCV의 필터링 기법을 적용하여 정확도를 평가하였다. 정확도 평가 결과 화소정확도는 99.97, 정밀도는 83.80%, 재현율은 60.95%, F1- Score는 70.57%의 정확도를 보였다. 정밀도에 비해 재현율이 떨어지는 것은 정성적으로 보았을 때 전체 이미지에서 가장자리에 작은 비율로 야적퇴비 픽셀이 존재하는 경우 과소추정되었기 때문이다. 향후 추가적인 데이터셋과 RGB 밴드 이외의 추가 밴드를 조합한다면 모델 정확도를 향상시킬 수 있을 것으로 판단된다.

오토인코더를 이용한 딥러닝 기반 추천시스템 모형의 비교 연구

이효진 ( Hyo Jin Lee ) , 정윤서 ( Yoonsuh Jung )
한국통계학회|응용통계연구  34권 3호, 2021 pp. 315-331 (총 17pages)
5,700
초록보기
추천 시스템은 고객의 데이터를 이용하여 개인 맞춤화된 상품을 추천한다. 추천 시스템은 협업 필터링, 콘텐츠 기반 필터링 그리고 이 두 가지를 합친 하이브리드 방법의 세 가지로 크게 나누어진다. 이 연구에서는 딥러닝 방법론에 기초한 오토인코더를 이용한 추천 시스템에 대한 소개와 그 모형들의 비교 연구를 진행한다. 오토인코더는 데이터 행렬에 0이 많은 경우의 문제를 효과적으로 다룰 수 있는 딥러닝 기반의 비지도학습 모형이다. 이 연구에서는 세 개의 실제 데이터를 이용하여 다섯 가지 종류의 오토인코더 기반 모형들을 비교한다. 처음의 세 개 모형은 협업 필터링에 속한 모형이고 나머지 두 개의 모형은 하이브리드 모형이다. 실제 데이터는 고객의 평점 데이터이고, 대부분의 평점이 없어서 희박성 비율이 높다는 특징이 있다.

딥러닝 사물 인식 알고리즘(YOLOv3)을 이용한 미세조류 인식 연구

박정수 ( Jungsu Park ) , 백지원 ( Jiwon Baek ) , 유광태 ( Kwangtae You ) , 남승원 ( Seung Won Nam ) , 김종락 ( Jongrack Kim )
5,100
초록보기
Algal bloom is an important issue in maintaining the safety of the drinking water supply system. Fast detection and classification of algae images are essential for the management of algal blooms. Conventional visual identification using a microscope is a labor-intensive and time-consuming method that often requires several hours to several days in order to obtain analysis results from field water samples. In recent decades, various deep learning algorithms have been developed and widely used in object detection studies. YOLO is a state-of-the-art deep learning algorithm. In this study the third version of the YOLO algorithm, namely, YOLOv3, was used to develop an algae image detection model. YOLOv3 is one of the most representative one-stage object detection algorithms with faster inference time, which is an important benefit of YOLO. A total of 1,114 algae images for 30 genera collected by microscope were used to develop the YOLOv3 algae image detection model. The algae images were divided into four groups with five, 10, 20, and 30 genera for training and testing the model. The mean average precision (mAP) was 81, 70, 52, and 41 for data sets with five, 10, 20, and 30 genera, respectively. The precision was higher than 0.8 for all four image groups. These results show the practical applicability of the deep learning algorithm, YOLOv3, for algae image detection.

딥러닝 언어모델의 한국어 학습자 말뭉치 원어민성 판단 결과 분석 연구

이진 ( Lee Jin ) , 정진경 ( Jung Jinkyung ) , 김한샘 ( Kim Hansaem )
6,300
초록보기
The present study aims to analyze how deep learning judges nativelikeness in the corpus of native Korean speakers and Korean learners. To this end, a deep learning model that classifies sentences of native Korean speakers and Korean learners was built, and the criteria for determining nativelikeness between deep learning and humans were compared and analyzed in terms of error analysis. As a result of the analysis, the accuracy of the deep learning model built in this study was found to be 91%, which means that 91 sentences out of 100 sentences were accurately classified whether they were written by the native speaker or by the learner. In addition, since the error annotation result of the learner corpus is a projected result of human judgment of nativelikeness, the similarities and differences of the criteria for determining nativelikeness were described in detail by comparing it with the test data verification result of deep learning. The results of this study will be an important basis for clarifying what the nativelikeness of native Korean speakers is and for objectively judging the nativelikeness of the language produced by Korean learners.(Yonsei University)

딥러닝과 LDA 모델링을 통한 AI 분야 장기특허 예측

하태현 ( Taehyun Ha ) , 이재민 ( Jae-min Lee ) , 이창환 ( Chang-hoan Lee ) , 고병열 ( Byoung-youl Coh )
6,400
초록보기
본 논문에서는 최근 10년간 등록된 인공지능과 기계학습 분야 특허들을 대상으로 향후 20년간 특허 권리가 유지될 장기특허를 판별, 예측하고 이들의 내용을 LDA 모델링으로 분석하여 인공지능 분야의 기술정책 방향을 제시한다. 딥러닝 모델을 통해 약 16만 건의 미국 특허청 등록 특허의 장기특허 여부를 학습하였으며, 학습된 모델을 3,281개의 인공지능과 기계학습 분야 특허들에 적용하여 장기특허로 예측되는 2,004개의 특허를 판별하였다. 도출된 2004개의 장기특허에 대한 LDA 모델링을 수행하였으며, 장기전략적으로 중요해질 6개의 주요 토픽들을 확인하였다. 또한, 기술통계치와 통계 분석을 통해 인공지능분야 내 장기특허와 단기특허 간 차이점에 대해 알아보았으며, LDA 토픽 모델링을 통해 도출된 결과와 함께, 향후 인공지능 분야에서 고려되어야 할 정책적 함의들에 대해 종합적으로 논의하였다.

레그테크 기반의 자본시장 규제 해석 온톨로지 및 딥러닝 기술 개발을 위한 제언

최승욱 ( Choi Seung Uk ) , 권오병 ( Kwon Oh Byung )
6,000
초록보기
Purpose Based on the development of artificial intelligence and big data technologies, the RegTech has been emerged to reduce regulatory costs and to enable efficient supervision by regulatory bodies. The word RegTech is a combination of regulation and technology, which means using the technological methods to facilitate the implementation of regulations and to make efficient surveillance and supervision of regulations. The purpose of this study is to describe the recent adoption of RegTech and to provide basic examples of applying RegTech to capital market regulations. Design/methodology/approach English-based ontology and deep learning technologies are quite developed in practice, and it will not be difficult to expand it to European or Latin American languages that are grammatically similar to English. However, it is not easy to use it in most Asian languages such as Korean, which have different grammatical rules. In addition, in the early stages of adoption, companies, financial institutions and regulators will not be familiar with this machine-based reporting system. There is a need to establish an ecosystem which facilitates the adoption of RegTech by consulting and supporting the stakeholders. In this paper, we provide a simple example that shows a procedure of applying RegTech to recognize and interpret Korean language-based capital market regulations. Specifically, we present the process of converting sentences in regulations into a meta-language through the morpheme analyses. We next conduct deep learning analyses to determine whether a regulatory sentence exists in each regulatory paragraph. Findings This study illustrates the applicability of RegTech-based ontology and deep learning technologies in Korean-based capital market regulations.

텍스트 마이닝과 딥러닝을 활용한 암호화폐 가격 예측 : 한국과 미국시장 비교

원종관 ( Jonggwan Won ) , 홍태호 ( Taeho Hong )
5,700
초록보기
본 연구에서는 한국과 미국의 대표적인 거래소인 빗썸과 코인베이스의 비트코인 가격을 ARIMA와 순환 신경망(Recurrent Neural Network)을 이용해 예측하고, 이후 각 국가의 뉴스 기사를 이용해 분리 학습에 기반한 separated RNN 모형을 제안한다. separated RNN 모형은 학습 데이터를 가격의 추세 변화 점을 기준으로 분리해 학습시킨 후, 추세 변화점 별 뉴스 데이터를 활용해 용어 기반 사전을 구축한다. 이후 용어 기반 사전과 평가 데이터 기간의 뉴스 데이터를 이용해 예측할 데이터의 가격 추세 변화 점을 찾아낸 후, 매칭되는 모형을 적용해 예측 결과를 산출한다. 2017년 5월 22일부터 2020년 9월 16일까지의 가격 데이터를 사용해 분석한 결과, 제안된 separated RNN을 이용해 예측한 결과가 한국과 미국의 비트코인 가격 예측 모두에서 순환 신경망(RNN)을 이용해 예측한 결과보다 높은 예측 성과를 보였다. 본 연구는 시계열 예측 기법의 한계를 뉴스 데이터를 이용한 추세 변화 점 탐색을 통해 극복할 수 있고, 성과 향상을 위한 추후 다양한 시계열 예측 기법 및 추세 변화 점 탐색을 위한 다양한 텍스트 마이닝 기법을 적용해볼 필요가 있음을 시사한다.