3.16.76.43
3.16.76.43
close menu
KCI 등재
온라인 멀티미디어 코퍼스 구축 -일본 텔레비전 대담방송을 자료로-
The building of an Online Multimedia Corpus: Based on Japanese Television Talk Show Programs
손영석 ( Son, Young-suk )
일어일문학연구 113권 45-66(22pages)
UCI I410-ECN-0102-2021-800-000843370

コンピュータで処理可能な言語実例の集合を意味するコーパスは、ある言語項目が、いつどのような場面で使われたかなど、その使用実態を調べられることから、言語研究及び教育において有用な手段になりうる。しかし、日本語の話しことばに関しては、利用できるオンラインコーパスが極めて少ないのが現状である。こうした中、本研究では、「対談番組コーパス」のデータを資料に、オンライン版マルチメディア·コーパスを作成した。コーパス作成に用いたのは、106回分の対談番組の動画ファイルと、各番組で発話された音声を書き起こした40時間分の文字化テキストファイル、孫栄奭(2017, 2018)で自作した日本語と韓国語の字幕ファイルである。そして、オンライン版マルチメディア·コーパスの作成により、特別なコンピュータ·リテラシーがなくとも、ウェブ上でコーパスにアクセスし、調べたい単語や文法表現などをキーワードとして、話しことばを検索したり、検索結果を共有できるようになった。特に、言語項目=キーワードを検索して前後の文脈が、KWIC形式に選択·配列され、この状態で、任意の用例上でキー操作を行うと、それ以降の用例の映像·音声が自動的に連続して再生される「映像KWIC」という機能の実現により、ウェブ上でも、ことばのみならず、その発話場面の映像·音声が観察できるようになったという点において、本研究の意義は大きい。ただし、コーパスの規模など改善すべきところも多く、今後は、その改善とともに、反転授業などの日本語教育、日本語話者の言語行動に関する共同研究などにコーパスを積極的に活用したい。

Corpus, a collection of data on the language used in day-to-day life that can be processed through computers, is highly useful in linguistics and education. It can examine how a language is used during natural communication. In the case of spoken Japanese, however, online public corpora that can be utilized for research and education are quite rare. To address such an issue, based on “talk show corpus” data, the current study aims to build an “online multimedia corpus” where spoken Japanese can be found. The study used data from video files of 106 episodes of talk show programs, written text files of voice recordings from each episode, which is 40 hours recording in total, and Japanese-Korean subtitle files produced by Son, Young Suk (2017, 2018). As a result of building the online multimedia corpus, one can easily access the Internet to get information on spoken Japanese and share one’s findings without time or location constraints. A person does not even need advanced computer skills to access this. The contexts of front and rear are arranged in KWIC(Keyword in Context) format, so by using “language entry=keyword” to search, the relevant videos are automatically and continuously played. The implementation of this function, “video KWIC,” is significant, as it allows users to not only study spoken Japanese but also observe how it was spoken in videos.

1. 들어가며
2. 「대담방송 코퍼스」의 개요
3. 코퍼스 공개 방침
4. 온라인 멀티미디어 코퍼스
5. 마치며
参考文献
[자료제공 : 네이버학술정보]
×