阿里達摩院公開“標點符號識別模型構(gòu)建方法和裝置”專利
2月17日消息,天眼查資料顯示,阿里巴巴達摩院(杭州)科技有限公司2月15日公開一項“標點符號識別模型構(gòu)建方法和裝置”專利,申請公布號為CN114049885A,申請日期為2022年1月12日。
該專利摘要顯示,本申請公開了標點符號識別模型構(gòu)建方法、裝置及設(shè)備。
其中,所述方法包括:獲取第一文本集和第一語音數(shù)據(jù)集,及第二語音數(shù)據(jù)與第二文本之間的對應(yīng)關(guān)系集;根據(jù)第一文本集,學習得到所述模型包括的文本處理模塊的網(wǎng)絡(luò)參數(shù);根據(jù)第一語音數(shù)據(jù)集,學習得到所述模型包括的語音處理模塊的第一網(wǎng)絡(luò)參數(shù);根據(jù)對應(yīng)關(guān)系集,對基于第一網(wǎng)絡(luò)參數(shù)的語音處理模塊進行訓練,得到語音處理模塊的第二網(wǎng)絡(luò)參數(shù)。
采用這種處理方式,使得模型在通用領(lǐng)域具有較為一致的識別準確率,同時還從覆蓋較少領(lǐng)域的少量平行數(shù)據(jù)中更好地學習語音處理模塊,引入了聲學信息后就可以更好地利用說話人本身的用意,得到更符合口語的標點符號。
2月15日,阿里巴巴達摩院(杭州)科技有限公司還公開“一種直播交互方法、裝置、電子設(shè)備及計算機程序產(chǎn)品”、“逆文本標準化方法和裝置”、“樣本數(shù)據(jù)確定及對話意圖識別方法、存儲介質(zhì)及程序產(chǎn)品”等多項專利。
天眼查資料顯示,阿里巴巴達摩院(杭州)科技有限公司成立于2017年11月7日,法定代表人為周明,注冊資本1000萬人民幣,經(jīng)營范圍包括:技術(shù)服務(wù)、技術(shù)開發(fā)、技術(shù)咨詢、技術(shù)交流、技術(shù)轉(zhuǎn)讓、技術(shù)推廣;軟件開發(fā);專業(yè)設(shè)計服務(wù);翻譯服務(wù)(除依法須經(jīng)批準的項目外,憑營業(yè)執(zhí)照依法自主開展經(jīng)營活動)。
股權(quán)穿透圖顯示,阿里巴巴達摩院(杭州)科技有限公司由阿里巴巴(中國)有限公司全資持股,認繳金額1000萬人民幣。
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責任由作者本人承擔。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn