字節(jié)跳動與北大合作搭建古籍“智能化數(shù)字圖書館”
3月18日消息,據(jù)字節(jié)跳動消息,日前,字節(jié)跳動向北大教育基金會提供捐贈,全面支持“北京大學(xué)-字節(jié)跳動數(shù)字人文開放實驗室”的工作,研發(fā)古籍?dāng)?shù)字化平臺,搭建一座古籍“智能化數(shù)字圖書館”。
雙方將攜手合作,優(yōu)勢互補,通過古籍?dāng)?shù)字化,保護、整理珍貴的中華文化資源,并推動這些資源向公眾開放。
據(jù)了解,我國現(xiàn)存古籍約20萬種。據(jù)不完全統(tǒng)計,其中已經(jīng)數(shù)字化掃描影像的有8萬種,而以文本方式存儲,能進行歸類、檢索的僅有3-4萬種。因此,大量中國典籍瑰寶在網(wǎng)上找不到,更無法通過關(guān)鍵詞進行檢索。
基于此,北京大學(xué)-字節(jié)跳動數(shù)字人文開放實驗室推動搭建開放、共享、高質(zhì)量的古籍?dāng)?shù)字化平臺。
據(jù)介紹,該平臺將分成兩部分:面向讀者的數(shù)字化古籍閱讀工具、開放的古籍?dāng)?shù)字化智能整理平臺。
字節(jié)跳動表示,北京大學(xué)-字節(jié)跳動數(shù)字人文開放實驗室將調(diào)動國內(nèi)外的相關(guān)力量,在三年內(nèi)完成一萬種精選古籍的智能化整理工作,基本覆蓋儒家、道家和佛學(xué)的核心典籍目錄,為讀者提供開放的古籍“數(shù)字圖書館”。另外,通過文本數(shù)字化,這些古籍將能夠進行全文檢索,不再需要一頁頁從頭看起。
如用戶有收藏的古籍,平臺能夠幫用戶把紙頁變成可查找的電腦文本。通過智能平臺的文字識別、校對工具,學(xué)者和愛好者可以在線上平臺一站式完成古籍的整理工作。
另外,平臺還將在迅速數(shù)字化大量古籍的基礎(chǔ)上,對重點文本進行精校,滿足專家學(xué)者對常用資料的準確度要求。
值得一提的是,2021年6月17日,字節(jié)跳動聯(lián)合中國文物保護基金會,在國家圖書館成立古籍保護專項基金,初期啟動資金人民幣1000萬元,用于修復(fù)《永樂大典》“湖”字冊等105冊(件)珍貴古籍、培養(yǎng)100名修復(fù)人才等項目。
如今,當(dāng)初進行修復(fù)的古籍也將逐步通過平臺進行數(shù)字化。
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn