阿里達(dá)摩院公開“圖像中的文本識(shí)別方法、裝置”專利

云合
2022-03-18 11:50

3月18日消息,天眼查資料顯示,阿里巴巴達(dá)摩院(杭州)科技有限公司3月18日公開一項(xiàng)“圖像中的文本識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)”專利,申請(qǐng)公布號(hào)為CN114202647A,申請(qǐng)日期為2022年2月16日。

format-jpg

該專利摘要顯示,本公開涉及一種圖像中的文本識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。本公開通過獲取目標(biāo)圖像,并確定該目標(biāo)圖像中包含至少一行文本的子圖像。進(jìn)一步,將所述子圖像、以及所述至少一行文本中的每個(gè)字符輸入多模態(tài)模型,由于子圖像含有較為直觀且準(zhǔn)確的信息,從而使得多模態(tài)模型的輸入中增加了原始視覺信息,使得多模態(tài)模型可以根據(jù)子圖像對(duì)文本標(biāo)注任務(wù)進(jìn)行增強(qiáng)和指導(dǎo),從而使得多模態(tài)模型可以確定出每個(gè)字符較為準(zhǔn)確的標(biāo)簽。

進(jìn)一步,根據(jù)每個(gè)字符的標(biāo)簽可以對(duì)該至少一行文本進(jìn)行準(zhǔn)確的斷句,尤其是對(duì)有歧義的文本行的斷句處理效果較好,避免將圖像中的多段文本識(shí)別為一段文本,以及避免后續(xù)的文本理解或處理出錯(cuò)。

format-jpg

format-jpg

近日,阿里巴巴達(dá)摩院(杭州)科技有限公司還公開“測(cè)試器件以及采用測(cè)試器件進(jìn)行測(cè)試的測(cè)試方法”、“主題詞確定方法、設(shè)備及存儲(chǔ)介質(zhì)”、“文本識(shí)別方法、圖像矯正方法、電子設(shè)備和存儲(chǔ)介質(zhì)”等多項(xiàng)專利。

天眼查資料顯示,阿里巴巴達(dá)摩院(杭州)科技有限公司成立于2017年11月7日,法定代表人為周明,注冊(cè)資本1000萬人民幣,經(jīng)營范圍包括:技術(shù)服務(wù)、技術(shù)開發(fā)、技術(shù)咨詢、技術(shù)交流、技術(shù)轉(zhuǎn)讓、技術(shù)推廣;軟件開發(fā);專業(yè)設(shè)計(jì)服務(wù);翻譯服務(wù)(除依法須經(jīng)批準(zhǔn)的項(xiàng)目外,憑營業(yè)執(zhí)照依法自主開展經(jīng)營活動(dòng))。

format-jpg

股權(quán)穿透圖顯示,阿里巴巴達(dá)摩院(杭州)科技有限公司由阿里巴巴(中國)有限公司全資持股,認(rèn)繳金額1000萬人民幣。

format-jpg

1、該內(nèi)容為作者獨(dú)立觀點(diǎn),不代表電商報(bào)觀點(diǎn)或立場,文章為作者本人上傳,版權(quán)歸原作者所有,未經(jīng)允許不得轉(zhuǎn)載。
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn
相關(guān)閱讀
3月30日消息,天眼查信息顯示,阿里巴巴達(dá)摩院 科技有限公司日前公開一項(xiàng)“障礙物檢測(cè)系統(tǒng)、避方法、電子設(shè)備及存儲(chǔ)介質(zhì)”專利,申請(qǐng)公布號(hào)為CN114255400A,申請(qǐng)日期為2021年12月14日。該障礙檢測(cè)系統(tǒng)包括圖像采集裝置、紅外測(cè)距傳感器和控制器。該系統(tǒng)可以準(zhǔn)確地檢測(cè)障礙物,以方便實(shí)現(xiàn)避。
阿里巴巴達(dá)摩院1月25日公開一項(xiàng)“圖像分類方法、計(jì)算機(jī)終端及存儲(chǔ)介質(zhì)”專利。
阿里巴巴達(dá)摩院公開一項(xiàng)“圖像生成方法、設(shè)備及存儲(chǔ)介質(zhì)”專利。
阿里巴巴達(dá)摩院(杭州)科技有限公司公開一項(xiàng)“圖像分割模型訓(xùn)練、圖像分割方法及裝置”專利。
阿里巴巴達(dá)摩院公開一項(xiàng)“文本識(shí)別方法、圖像矯正方法、電子設(shè)備和存儲(chǔ)介質(zhì)”專利
此次免費(fèi)開放100件AI專利許可,覆蓋了圖像技術(shù)、視頻技術(shù)、3D視覺等諸多AI技術(shù)領(lǐng)域。
阿里巴巴達(dá)摩院(杭州)科技有限公司公開一項(xiàng)“圖片處理方法、裝置、電子設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)”專利。
6月13日消息,天眼查APP顯示,近日,阿里巴巴達(dá)摩院 科技有限公司“聲紋特征提取方法、說話人識(shí)別方法、模型訓(xùn)練方法及裝置”專利公開。專利摘要顯示,主要技術(shù)方案包括:獲取包含語音音頻;提取音頻頻譜特征輸入聲紋提取模型。本申請(qǐng)能夠提升聲紋特征提取準(zhǔn)確性。
    亚洲无码高清自拍偷拍自慰av网站,免费高清无码黄色网,欧美一级片免费在线观看,午夜毛片在线观看