字節(jié)跳動(dòng)與北大合作搭建古籍“智能化數(shù)字圖書館”

林月
2022-03-18 09:53

3月18日消息,據(jù)字節(jié)跳動(dòng)消息,日前,字節(jié)跳動(dòng)向北大教育基金會(huì)提供捐贈(zèng),全面支持“北京大學(xué)-字節(jié)跳動(dòng)數(shù)字人文開放實(shí)驗(yàn)室”的工作,研發(fā)古籍?dāng)?shù)字化平臺(tái),搭建一座古籍“智能化數(shù)字圖書館”。

雙方將攜手合作,優(yōu)勢(shì)互補(bǔ),通過(guò)古籍?dāng)?shù)字化,保護(hù)、整理珍貴的中華文化資源,并推動(dòng)這些資源向公眾開放。

format-jpg

據(jù)了解,我國(guó)現(xiàn)存古籍約20萬(wàn)種。據(jù)不完全統(tǒng)計(jì),其中已經(jīng)數(shù)字化掃描影像的有8萬(wàn)種,而以文本方式存儲(chǔ),能進(jìn)行歸類、檢索的僅有3-4萬(wàn)種。因此,大量中國(guó)典籍瑰寶在網(wǎng)上找不到,更無(wú)法通過(guò)關(guān)鍵詞進(jìn)行檢索。

基于此,北京大學(xué)-字節(jié)跳動(dòng)數(shù)字人文開放實(shí)驗(yàn)室推動(dòng)搭建開放、共享、高質(zhì)量的古籍?dāng)?shù)字化平臺(tái)。

format-jpg

據(jù)介紹,該平臺(tái)將分成兩部分:面向讀者的數(shù)字化古籍閱讀工具、開放的古籍?dāng)?shù)字化智能整理平臺(tái)。

字節(jié)跳動(dòng)表示,北京大學(xué)-字節(jié)跳動(dòng)數(shù)字人文開放實(shí)驗(yàn)室將調(diào)動(dòng)國(guó)內(nèi)外的相關(guān)力量,在三年內(nèi)完成一萬(wàn)種精選古籍的智能化整理工作,基本覆蓋儒家、道家和佛學(xué)的核心典籍目錄,為讀者提供開放的古籍“數(shù)字圖書館”。另外,通過(guò)文本數(shù)字化,這些古籍將能夠進(jìn)行全文檢索,不再需要一頁(yè)頁(yè)從頭看起。

如用戶有收藏的古籍,平臺(tái)能夠幫用戶把紙頁(yè)變成可查找的電腦文本。通過(guò)智能平臺(tái)的文字識(shí)別、校對(duì)工具,學(xué)者和愛(ài)好者可以在線上平臺(tái)一站式完成古籍的整理工作。

另外,平臺(tái)還將在迅速數(shù)字化大量古籍的基礎(chǔ)上,對(duì)重點(diǎn)文本進(jìn)行精校,滿足專家學(xué)者對(duì)常用資料的準(zhǔn)確度要求。

format-jpg

值得一提的是,2021年6月17日,字節(jié)跳動(dòng)聯(lián)合中國(guó)文物保護(hù)基金會(huì),在國(guó)家圖書館成立古籍保護(hù)專項(xiàng)基金,初期啟動(dòng)資金人民幣1000萬(wàn)元,用于修復(fù)《永樂(lè)大典》“湖”字冊(cè)等105冊(cè)(件)珍貴古籍、培養(yǎng)100名修復(fù)人才等項(xiàng)目。

如今,當(dāng)初進(jìn)行修復(fù)的古籍也將逐步通過(guò)平臺(tái)進(jìn)行數(shù)字化。

1、該內(nèi)容為作者獨(dú)立觀點(diǎn),不代表電商報(bào)觀點(diǎn)或立場(chǎng),文章為作者本人上傳,版權(quán)歸原作者所有,未經(jīng)允許不得轉(zhuǎn)載。
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn
相關(guān)閱讀
3月18日消息,近日,字節(jié)跳動(dòng)向北大教育基金提供捐贈(zèng),全面支持“北京大學(xué)-字節(jié)跳動(dòng)數(shù)字人文開放實(shí)驗(yàn)室”的工作,研發(fā)古籍數(shù)字化平臺(tái),搭建一座古籍智能化數(shù)字圖書館”。字節(jié)跳動(dòng)和北大將合作搭建開放、共享、高質(zhì)量的古籍數(shù)字化平臺(tái),在保護(hù)整理中華文化資源的同時(shí),推動(dòng)這些資源向大眾開放。該平臺(tái)可以是讀者的數(shù)字化古籍閱讀工具,也可以是學(xué)者、愛(ài)好者的一站式古籍數(shù)字化智能整理平臺(tái)
10月11日消息,由“北京大學(xué)字節(jié)跳動(dòng)數(shù)字人文開放實(shí)驗(yàn)室”研發(fā)的古籍數(shù)字化平臺(tái)“識(shí)典古籍”測(cè)試版正式上線。上述實(shí)驗(yàn)室系今年3月北京大學(xué)字節(jié)跳動(dòng)合作成立,將人工智能技術(shù)應(yīng)用于古籍資源的智能化整理?!白R(shí)典古籍平臺(tái)上線,即是雙方合作的最新進(jìn)展。同時(shí),“識(shí)典古籍”書目將持續(xù)更新,后續(xù)將上線手機(jī)移動(dòng)版。
由“北京大學(xué)字節(jié)跳動(dòng)數(shù)字人文開放實(shí)驗(yàn)室”研發(fā)的古籍數(shù)字化平臺(tái)“識(shí)典古籍”測(cè)試版正式上線。
12月10日消息,北京字節(jié)跳動(dòng)公益基金會(huì)宣布向北京大學(xué)教育基金會(huì)捐贈(zèng)人民幣2500萬(wàn)元,支持北京大學(xué)開展《儒藏》編纂與研究工作,并通過(guò)“識(shí)典古籍”智能整理平臺(tái),支持《儒藏》數(shù)字化工程,相關(guān)成果也將在“識(shí)典古籍”面向公眾永久性開放。
2月24日消息,在字節(jié)跳動(dòng)北京大學(xué)的合作之下,識(shí)典古籍官網(wǎng)現(xiàn)已上線了685部古籍,包括雙方參與設(shè)計(jì)與研發(fā)的《永樂(lè)大典》高清影像數(shù)據(jù)庫(kù),用戶可以登錄官網(wǎng)或者在今日頭條古籍頻道查看已上線古籍。據(jù)了解,古籍數(shù)字化業(yè)務(wù)的研發(fā)復(fù)雜度很高,例如古籍的格式里,大字是正文,小字是注解,單獨(dú)一列的大字是標(biāo)題。為了把這些復(fù)雜的結(jié)構(gòu)區(qū)分開,字節(jié)方面定義了一套古籍的元數(shù)據(jù)協(xié)議。
11月26日,字節(jié)跳動(dòng)宣布,中國(guó)文物保護(hù)基金會(huì)字節(jié)跳動(dòng)古籍保護(hù)專項(xiàng)基金定向資助修復(fù)書目已經(jīng)確定,共有105冊(cè)(件)古籍入選。
字節(jié)跳動(dòng)公益宣布,字節(jié)跳動(dòng)古籍保護(hù)專項(xiàng)基金資助修復(fù)的104冊(cè)件古籍已全部完成修復(fù)。
8月21日消息,中國(guó)文物保護(hù)基金會(huì)、國(guó)家圖書館 、字節(jié)跳動(dòng)公益正式啟動(dòng)第二期古籍保護(hù)與利用公益項(xiàng)目。字節(jié)跳動(dòng)將繼續(xù)提供捐贈(zèng),支持國(guó)家圖書館、陜西省圖書館等多家圖書館開展珍貴古籍修復(fù)。
三方將通過(guò)此次為期3年的合作,開展故宮古籍搶救性保護(hù)及資源轉(zhuǎn)化利用。
    亚洲无码高清自拍偷拍自慰av网站,免费高清无码黄色网,欧美一级片免费在线观看,午夜毛片在线观看