字節(jié)跳動(dòng)與北大合作搭建古籍“智能化數(shù)字圖書館”
3月18日消息,據(jù)字節(jié)跳動(dòng)消息,日前,字節(jié)跳動(dòng)向北大教育基金會(huì)提供捐贈(zèng),全面支持“北京大學(xué)-字節(jié)跳動(dòng)數(shù)字人文開放實(shí)驗(yàn)室”的工作,研發(fā)古籍?dāng)?shù)字化平臺(tái),搭建一座古籍“智能化數(shù)字圖書館”。
雙方將攜手合作,優(yōu)勢(shì)互補(bǔ),通過(guò)古籍?dāng)?shù)字化,保護(hù)、整理珍貴的中華文化資源,并推動(dòng)這些資源向公眾開放。
據(jù)了解,我國(guó)現(xiàn)存古籍約20萬(wàn)種。據(jù)不完全統(tǒng)計(jì),其中已經(jīng)數(shù)字化掃描影像的有8萬(wàn)種,而以文本方式存儲(chǔ),能進(jìn)行歸類、檢索的僅有3-4萬(wàn)種。因此,大量中國(guó)典籍瑰寶在網(wǎng)上找不到,更無(wú)法通過(guò)關(guān)鍵詞進(jìn)行檢索。
基于此,北京大學(xué)-字節(jié)跳動(dòng)數(shù)字人文開放實(shí)驗(yàn)室推動(dòng)搭建開放、共享、高質(zhì)量的古籍?dāng)?shù)字化平臺(tái)。
據(jù)介紹,該平臺(tái)將分成兩部分:面向讀者的數(shù)字化古籍閱讀工具、開放的古籍?dāng)?shù)字化智能整理平臺(tái)。
字節(jié)跳動(dòng)表示,北京大學(xué)-字節(jié)跳動(dòng)數(shù)字人文開放實(shí)驗(yàn)室將調(diào)動(dòng)國(guó)內(nèi)外的相關(guān)力量,在三年內(nèi)完成一萬(wàn)種精選古籍的智能化整理工作,基本覆蓋儒家、道家和佛學(xué)的核心典籍目錄,為讀者提供開放的古籍“數(shù)字圖書館”。另外,通過(guò)文本數(shù)字化,這些古籍將能夠進(jìn)行全文檢索,不再需要一頁(yè)頁(yè)從頭看起。
如用戶有收藏的古籍,平臺(tái)能夠幫用戶把紙頁(yè)變成可查找的電腦文本。通過(guò)智能平臺(tái)的文字識(shí)別、校對(duì)工具,學(xué)者和愛(ài)好者可以在線上平臺(tái)一站式完成古籍的整理工作。
另外,平臺(tái)還將在迅速數(shù)字化大量古籍的基礎(chǔ)上,對(duì)重點(diǎn)文本進(jìn)行精校,滿足專家學(xué)者對(duì)常用資料的準(zhǔn)確度要求。
值得一提的是,2021年6月17日,字節(jié)跳動(dòng)聯(lián)合中國(guó)文物保護(hù)基金會(huì),在國(guó)家圖書館成立古籍保護(hù)專項(xiàng)基金,初期啟動(dòng)資金人民幣1000萬(wàn)元,用于修復(fù)《永樂(lè)大典》“湖”字冊(cè)等105冊(cè)(件)珍貴古籍、培養(yǎng)100名修復(fù)人才等項(xiàng)目。
如今,當(dāng)初進(jìn)行修復(fù)的古籍也將逐步通過(guò)平臺(tái)進(jìn)行數(shù)字化。
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn