Komiyama Fumi
National Institute of Japanese Literature. Librarian
Yamamoto Kazuaki
National Institute of Japanese Literature. Professor
Matsubara Noriko
National Institute of Japanese Literature. Specially appointed Associate Professor

国文学研究資料館の新プロジェクト: データ駆動による課題解決型人文学の創成

国文学研究資料館は、2024年から10年プロジェクトとなる「データ駆動による課題解決型人文学の創成 : データ基盤の構築・活用による次世代型人文学研究の開拓」を開始した。

同プロジェクトでは、これまで「歴史的典籍NW事業」で収集した古典籍画像30万点に加え、国外の古典籍所蔵機関との連携を拡げ、さらに15万点を収集するとともに、本文のテキスト化やAIの活用による古典籍の文字認識技術の確立を目指す。

これらの成果は、「国書データベース」を通じた公開予定であり、そのための機能拡充もすすめる。集積したデータをもとに、異分野の研究者とともにデータ駆動型研究等を推進していく。

本発表では、この新プロジェクトの概要と、国書データベースのデータ拡充(本文テキストデータの作成等)について紹介する。

Model Building in the Humanities through Data-Driven Problem Solving: A New Project by the National Institute of Japanese Literature (NIJL)

The National Institute of Japanese Literature NIJL has started a new project, "Model Building in the Humanities through Data-Driven Problem Solving", in 2024.

NIJL had digitized 300,000 pre-modern Japanese texts under the "NIJL-NW project". In the new project, 150,000 digitized pre-modern works will be added in collaboration with various institutions, including those overseas. In addition, we are going to try extracting full-text of digital images from pre-modern works.

We will also improve the functionality of the "Union Catalogue Database of Japanese Texts (国書データベース)" and enrich its content. Based on this database, we will promote the "Data-driven research" and other projects.

In this presentation, we will introduce an overview of our new project and further efforts regarding this database (e.g., text data creation by OCR).