150萬字形一次下載! 東亞最大規模文字資料庫免費下載

中研院建置東亞規模最大的「歷史文字資料庫統合檢索系統」。(圖/中研院提供)

記者崔至雲臺北報導

中央研究院歷史語言研究所數位文化中心自2019年起開發「簡牘字典史語所藏居延漢簡資料庫」,今年進一步與日本大學機構合作建置東亞規模最大的「歷史文字資料庫統合檢索系統」,於今(13日)正式啓用。目前整合的5個資料庫約有150萬件高解析度文字圖像均依創用CC條款釋出,且可免費下載,進行加值利用。中研院指出,「歷史文字資料庫統合檢索系統」由史語所、數位文化中心與奈良文化財研究所、東京大學史料編纂所、國文學研究資料館、國立國語研究所、京都大學人文科學研究所等日本學研機構合作建置。整合了源自中國與日本的簡牘與紙本文書典籍抄本刻本紀元前至19世紀的文字圖像數位資源

數位文化中心執行秘書陳淑君表示,此次與日本學研機構共同確立了文字圖像數位資源共享流通體制,並議定一致的國際圖像互通架構規範,以供多方共同遵循,如此一來,便可從彼此的資料庫中檢索出指定的單字圖像。計劃主持人、中研院史語所劉欣寧研究員表示,此檢索系統是文字圖像典藏機構間首次創新合作模式,這次系統的公開上線只是起點,未來將持續號召其他典藏機構加入,並嘗試深化技術。期許在文字圖像資源共享的理念下,突破時空的限制,重現東亞漢字文化圈源流與歷史脈絡