- 阿里巴巴多模態(tài)對(duì)話專利公布 可豐富人機(jī)對(duì)話方式阿里巴巴達(dá)摩院(杭州)科技有限公司日前公開(kāi)一項(xiàng)“多模態(tài)對(duì)話方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)”專利。2023-03-25 17:28:15
- 阿里巴巴多模態(tài)對(duì)話專利公布 可豐富人機(jī)對(duì)話方式3月25日消息,天眼查資料顯示,3月24日,阿里巴巴達(dá)摩院 科技有限公司申請(qǐng)的“多模態(tài)對(duì)話方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)”專利公布。該申請(qǐng)使得用戶可以通過(guò)多種模態(tài)信息對(duì)同一問(wèn)題和該問(wèn)題針對(duì)的目標(biāo)對(duì)象進(jìn)行描述,使得人機(jī)對(duì)話系統(tǒng)可以從多個(gè)模態(tài)理解同一問(wèn)題,并生成一個(gè)或多個(gè)回復(fù)信息,如果是多個(gè)回復(fù)信息,則多個(gè)回復(fù)信息的模態(tài)不同,從而實(shí)現(xiàn)了多模態(tài)對(duì)話,使得用戶和人機(jī)對(duì)話系統(tǒng)之間的對(duì)話方式靈活多樣,提高了用戶體驗(yàn)。2023-03-25 17:02:20
- 滴滴公開(kāi)“基于多模態(tài)數(shù)據(jù)的駕駛預(yù)警方法、設(shè)備”專利滴滴關(guān)聯(lián)公司北京嘀嘀無(wú)限科技發(fā)展有限公司7月2日公開(kāi)一項(xiàng)“基于多模態(tài)數(shù)據(jù)的駕駛預(yù)警方法、設(shè)備、介質(zhì)及程序產(chǎn)品”專利。2021-07-02 11:56:02
- 螞蟻集團(tuán)推出20億參數(shù)多模態(tài)遙感基礎(chǔ)模型SkySense螞蟻集團(tuán)多模態(tài)研究成果已應(yīng)用于支付寶五福節(jié)AI大規(guī)模互動(dòng)、螞蟻醫(yī)療數(shù)字人等場(chǎng)景。2024-02-28 12:05:55
- 螞蟻集團(tuán)推出多模態(tài)遙感模型SkySense2月28日消息,螞蟻集團(tuán)推出20億參數(shù)多模態(tài)遙感基礎(chǔ)模型SkySense。官方數(shù)據(jù)顯示,SkySense在17項(xiàng)測(cè)試場(chǎng)景中指標(biāo)均超過(guò)國(guó)際同類產(chǎn)品。SkySense可用于地貌、農(nóng)作物觀測(cè)和解譯等,輔助農(nóng)業(yè)生產(chǎn)和經(jīng)營(yíng)。目前該成果已應(yīng)用于支付寶五福節(jié)AI大規(guī)?;?dòng)、螞蟻醫(yī)療數(shù)字人等場(chǎng)景。2024-02-28 09:55:34
- 字節(jié)跳動(dòng)開(kāi)源多模態(tài)AI Agent—UI-TARS-1.54月23日消息,字節(jié)跳動(dòng)開(kāi)源了多模態(tài)AI Agent UI-TARS的最新1.5版本。與上一代相比,1.5版本在計(jì)算機(jī)使用、瀏覽器使用和手機(jī)使用等基準(zhǔn)測(cè)試中均表現(xiàn)非常出色。2025-04-23 10:21:12
- 京東云:長(zhǎng)期布局多模態(tài)領(lǐng)域,自研知識(shí)大模型生成商品文案覆蓋超3000個(gè)品類3月17日消息,談到近日大熱的GPT-4,京東云相關(guān)負(fù)責(zé)人告訴澎湃新聞編輯,相較于GPT-3.5及ChatGPT主要處理文本數(shù)據(jù),GPT-4是一個(gè)大型的多模態(tài)模型,提高了大模型的多模態(tài)處理能力。從算法層面,GPT-4使用對(duì)抗性測(cè)試和基于ChatGPT的經(jīng)驗(yàn)教訓(xùn)對(duì)GPT-4進(jìn)行迭代優(yōu)化。京東方面表示,京東云長(zhǎng)期布局多模態(tài)領(lǐng)域。在文本生成領(lǐng)域,一直以來(lái)是通過(guò)圖片信息+文本信息生成的營(yíng)銷文案。2023-03-17 16:56:36
- 阿里聯(lián)合清華大學(xué)發(fā)布中文多模態(tài)預(yù)訓(xùn)練AI模型M63月3日消息,阿里巴巴與清華大學(xué)聯(lián)合發(fā)布中文多模態(tài)預(yù)訓(xùn)練AI模型M6。據(jù)介紹,預(yù)訓(xùn)練語(yǔ)言模型是讓AI具備認(rèn)知能力的關(guān)鍵技術(shù),此次發(fā)布的M6模型參數(shù)規(guī)模達(dá)到1000億,其理解和生成能力超越傳統(tǒng)AI?!峨娚虉?bào)》獲悉,日前,阿里巴巴還與智源研究院、清華大學(xué)等聯(lián)合研究團(tuán)隊(duì)發(fā)布面向認(rèn)知的超大規(guī)模新型預(yù)訓(xùn)練模型“文匯”。該模型能提升AI的理解能力,還可基于常識(shí)實(shí)現(xiàn)AI創(chuàng)作,未來(lái)將應(yīng)用于文本理解、人機(jī)交互、視覺(jué)問(wèn)答等場(chǎng)景。2021-03-03 10:06:52
- 360孫浩:結(jié)合物聯(lián)網(wǎng)的多模態(tài)大模型將是下一個(gè)風(fēng)口針對(duì)360智慧生活的相關(guān)話題,360視覺(jué)云業(yè)務(wù)線總經(jīng)理孫浩發(fā)表了自己的觀點(diǎn)。2023-06-05 11:43:53
- 余承東:華為P60引入多模態(tài)大模型技術(shù) 可實(shí)現(xiàn)智慧搜圖3月23日消息,華為任余承東介紹,華為帶來(lái)全新智慧搜圖功能,基于多模態(tài)大模型技術(shù),在手機(jī)端側(cè)對(duì)模型進(jìn)行小型化處理,在業(yè)界率先實(shí)現(xiàn)了首創(chuàng)的、精準(zhǔn)的自然語(yǔ)言手機(jī)圖庫(kù)搜索體驗(yàn)。智慧搜圖功能將于2023年5月陸續(xù)上線,支持搭載HarmonyOS 3.1及以上版本的手機(jī)或平板電腦。2023-03-23 17:46:55
- 騰訊AI聊天專利可多模態(tài)回復(fù)消息4月7日消息,天眼查App顯示,4月7日,騰訊科技 有限公司申請(qǐng)的“一種智能互動(dòng)方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)”專利獲授權(quán)。本申請(qǐng)可以在對(duì)話過(guò)程中,用文本搭配多模態(tài)內(nèi)容等來(lái)回復(fù)用戶,豐富了虛擬用戶與用戶的對(duì)話形式,極大地增加了聊天的趣味性和對(duì)用戶的吸引力。2023-04-07 15:44:35
- 阿里云開(kāi)源通義千問(wèn)多模態(tài)大模型Qwen-VL8月25日消息,阿里云今日推出大規(guī)模視覺(jué)語(yǔ)言模型Qwen-VL,并對(duì)其直接開(kāi)源。Qwen-VL以通義千問(wèn)70億參數(shù)模型Qwen-7B為基座語(yǔ)言模型研發(fā),支持圖文輸入。相較于此前的VL模型,Qwen-VL除了具備基本的圖文識(shí)別、描述、問(wèn)答及對(duì)話能力之外,還新增了視覺(jué)定位、圖像中文字理解等能力,可用于知識(shí)問(wèn)答、圖像標(biāo)題生成、圖像問(wèn)答、文檔問(wèn)答、細(xì)粒度視覺(jué)定位等場(chǎng)景。2023-08-25 11:47:09
- 釘釘AI助理升級(jí) 加入多模態(tài)、工作流等能力3月28日消息,釘釘AI助理升級(jí),上線圖片理解、文檔速讀、工作流等產(chǎn)品能力,率先探索多模態(tài)、長(zhǎng)文本與RPA技術(shù)在AI應(yīng)用的落地?;诎⒗锿x千問(wèn)大模型,升級(jí)后的釘釘 AI 助理?yè)碛懈鼜?qiáng)的視覺(jué)推理能力和長(zhǎng)文本速讀能力,甚至可以通過(guò)多輪交互進(jìn)一步做智能問(wèn)答。2024-03-28 14:17:58
- 字節(jié)跳動(dòng)將上線全新多模態(tài)視頻生成模型2月7日消息,字節(jié)跳動(dòng)旗下一站式AI創(chuàng)作平臺(tái)即夢(mèng)AI將上線多模態(tài)視頻生成模型OmniHuman,僅需一張圖片與一段音頻便可生成一條AI視頻,該模型為字節(jié)自研閉源模型。即夢(mèng)AI相關(guān)負(fù)責(zé)人透露,該模型未來(lái)會(huì)進(jìn)行小范圍內(nèi)測(cè),官方也會(huì)對(duì)這一功能設(shè)置嚴(yán)格的安全審核機(jī)制,并對(duì)輸出的視頻標(biāo)注水印以作提醒。2025-02-07 18:00:20
- 李彥宏:DeepSeek不是萬(wàn)能的,多模態(tài)才是未來(lái)基礎(chǔ)模型的標(biāo)配李彥宏稱,DeepSeek只能處理單一的文本,還不能理解聲音、圖片、視頻等多媒體內(nèi)容。2025-04-26 11:43:49
- 李彥宏:DeepSeek不是萬(wàn)能的,多模態(tài)才是未來(lái)基礎(chǔ)模型的標(biāo)配4月26日消息,Create2025百度AI開(kāi)發(fā)者大會(huì)日前在武漢舉辦,百度創(chuàng)始人李彥宏發(fā)表了題為《模型的世界 應(yīng)用的天下》的演講。談到DeepSeek,李彥宏稱,百度各個(gè)業(yè)務(wù)線第一時(shí)間接入了DeepSeek,但DeepSeek也不是萬(wàn)能的,它只能處理單一的文本,還不能理解聲音、圖片、視頻等多媒體內(nèi)容,同時(shí)幻覺(jué)率比較高,很多場(chǎng)合不能放心使用?!八畲蟮膯?wèn)題是慢和貴,中國(guó)市場(chǎng)上絕大多數(shù)大模型API的價(jià)格都更低,而且反應(yīng)速度更快?!?/span>2025-04-26 11:44:46
- 騰訊混元宣布開(kāi)源首個(gè)多模態(tài)統(tǒng)一CoT獎(jiǎng)勵(lì)模型5月14日消息,騰訊混元近日與上海AI Lab、復(fù)旦大學(xué)、上海創(chuàng)智學(xué)院聯(lián)合提出全新研究工作UnifiedReward-Think,構(gòu)建出首個(gè)具備長(zhǎng)鏈?zhǔn)酵评砟芰Φ慕y(tǒng)一多模態(tài)獎(jiǎng)勵(lì)模型,首次讓獎(jiǎng)勵(lì)模型在各視覺(jué)任務(wù)上真正“學(xué)會(huì)思考”,實(shí)現(xiàn)對(duì)復(fù)雜視覺(jué)生成與理解任務(wù)的準(zhǔn)確評(píng)估、跨任務(wù)泛化與推理可解釋性的大幅提升。目前,該項(xiàng)目已全面開(kāi)源,包括模型、數(shù)據(jù)集、訓(xùn)練腳本與評(píng)測(cè)工具。2025-05-14 09:31:26
- 京東言犀攜手NLPCC 2022舉辦多模態(tài)商品摘要挑戰(zhàn)賽京東言犀開(kāi)放了京東真實(shí)場(chǎng)景的脫敏數(shù)據(jù),攜手NLPCC 2022舉辦多模態(tài)商品摘要挑戰(zhàn)賽。2022-03-22 10:19:48
- 天貓精靈發(fā)布首款大模型多感知學(xué)習(xí)機(jī)Z2010月18日消息,阿里旗下天貓精靈推出真智能大屏護(hù)眼學(xué)習(xí)機(jī)Z20。據(jù)介紹,該款產(chǎn)品兼具大模型和多模態(tài)AI感知能力,還具有個(gè)性化對(duì)話、學(xué)科輔導(dǎo)等特性。產(chǎn)品團(tuán)隊(duì)介紹,隨著生成式AI基礎(chǔ)模型成熟后,其與通義大模型團(tuán)隊(duì)聯(lián)合進(jìn)行雙語(yǔ)大模型的繼續(xù)訓(xùn)練和微調(diào),模型在口語(yǔ)化、語(yǔ)言分級(jí)、情景生成上有進(jìn)一步提升;近期,相關(guān)能力會(huì)先通過(guò)專項(xiàng)應(yīng)用對(duì)Z20用戶公測(cè)。該產(chǎn)品已進(jìn)入2023雙11預(yù)售階段,售價(jià)2799元起。2023-10-18 17:35:50
- 齊心集團(tuán):公司目前暫未投入多模態(tài)技術(shù)研發(fā)12月13日消息,齊心集團(tuán)近日在互動(dòng)平臺(tái)表示:公司目前暫未投入多模態(tài)技術(shù)研發(fā),公司十分注重前沿技術(shù)的發(fā)展及應(yīng)用,將密切關(guān)注新技術(shù)、新趨勢(shì)的發(fā)展。2023-12-13 09:37:19