阿里巴巴聯(lián)合四川大學(xué)等發(fā)布古籍?dāng)?shù)字化平臺(tái)
5月18日消息,近期阿里巴巴聯(lián)合四川大學(xué)、美國加州大學(xué)伯克利分校、中國國家圖書館、浙江圖書館等單位,合作開展“漢典重光”古籍?dāng)?shù)字化公益項(xiàng)目,借助達(dá)摩院技術(shù),將流散在外的中國古籍以數(shù)字化方式回歸,并向公眾進(jìn)行開放。
今天下午,一批珍藏于加州大學(xué)伯克利分校的中文古籍善本,以數(shù)字化方式回歸故土,落地漢典重光古籍平臺(tái)。
借助阿里達(dá)摩院的技術(shù),首批20萬頁古籍已完成數(shù)字化,并沉淀為覆蓋3萬多字的古籍字典,公眾可通過漢典重光平臺(tái)翻閱、檢索古籍。據(jù)悉,達(dá)摩院AI對(duì)20萬頁古籍的識(shí)別準(zhǔn)確率達(dá)到97.5%。
阿里巴巴達(dá)摩院院長張建鋒表示,守護(hù)中華傳世典籍,是科技工作者和文化工作者共同的使命。阿里計(jì)劃將這套技術(shù)工具連同古籍?dāng)?shù)字化平臺(tái)一并捐贈(zèng),交由權(quán)威公共機(jī)構(gòu)長期運(yùn)營,同時(shí),阿里仍將在古籍?dāng)?shù)字化工作上持續(xù)投入人力物力。
上個(gè)月,阿里達(dá)摩院發(fā)布超大規(guī)模語言模型PLUG,該模型參數(shù)規(guī)模達(dá)270億,是目前全球規(guī)模最大的中文純文本預(yù)訓(xùn)練語言模型。
據(jù)介紹,PLUG集良好的語言理解與創(chuàng)造性文本生成能力于一身,在小說仿寫、詩歌生成、智能問答等長文本生成領(lǐng)域表現(xiàn)突出,其目標(biāo)是通過超大模型的能力,大幅提升中文自然語言技術(shù)在各類任務(wù)中的表現(xiàn),取得超越人類表現(xiàn)的性能。
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn
