阿里達摩院公開“視頻文本識別方法、裝置”專利
3月25日消息,天眼查資料顯示,阿里巴巴達摩院(杭州)科技有限公司3月25日公開一項“視頻文本識別方法、裝置、電子設(shè)備及可讀存儲介質(zhì)”專利,申請公布號為CN114241471A,申請日期為2022年2月23日。
該專利摘要顯示,本公開實施例提出了一種視頻文本識別方法、裝置、電子設(shè)備及可讀存儲介質(zhì)。該方法包括:獲取待識別視頻的軌跡信息;軌跡信息包括待識別視頻中至少一個視頻幀的同一文本檢測區(qū)域?qū)?yīng)的第一文本識別結(jié)果;對每個軌跡信息,根據(jù)識別置信度最高的第一文本識別內(nèi)容,對識別置信度低于第一置信度閾值的第一文本識別內(nèi)容進行第一糾錯處理,得到至少一個視頻幀的第二文本識別結(jié)果;根據(jù)第二文本識別結(jié)果,經(jīng)過第一糾錯處理后的識別置信度不符合第二置信度閾值的第一文本識別內(nèi)容進行第二糾錯處理,得到第二文本識別內(nèi)容;根據(jù)第二文本識別內(nèi)容和經(jīng)過第一糾錯處理后的識別置信度符合所述置信度閾值的第一文本識別內(nèi)容,確定待識別視頻的文本識別結(jié)果。
3月25日,阿里巴巴達摩院(杭州)科技有限公司還公開“實時語音翻譯方法、裝置、設(shè)備及存儲介質(zhì)”、“目標檢測方法、裝置、設(shè)備及存儲介質(zhì)”、“視頻處理方法及裝置”等多項專利。
天眼查資料顯示,阿里巴巴達摩院(杭州)科技有限公司成立于2017年11月7日,法定代表人為周明,注冊資本1000萬人民幣,經(jīng)營范圍包括:技術(shù)服務(wù)、技術(shù)開發(fā)、技術(shù)咨詢、技術(shù)交流、技術(shù)轉(zhuǎn)讓、技術(shù)推廣;軟件開發(fā);專業(yè)設(shè)計服務(wù);翻譯服務(wù)(除依法須經(jīng)批準的項目外,憑營業(yè)執(zhí)照依法自主開展經(jīng)營活動)。
股權(quán)穿透圖顯示,阿里巴巴達摩院(杭州)科技有限公司由阿里巴巴(中國)有限公司全資持股,認繳金額1000萬人民幣。
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責任由作者本人承擔。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn
