阿里達(dá)摩院推出AI框架HQTrack 可實(shí)現(xiàn)視頻高質(zhì)量跟蹤
7月31日消息,據(jù)GitHub頁面顯示,阿里達(dá)摩院近日宣布與大連理工大學(xué)合作,推出一款名為HQTrack的AI框架。
該框架主要由視頻多目標(biāo)分割器(VMOS)和掩模優(yōu)化器(MR)組成,旨在“實(shí)現(xiàn)對(duì)視頻中任何目標(biāo)的高質(zhì)量跟蹤”。研究團(tuán)隊(duì)表示,HQTrack基于開源框架DeAOT、HQ-SAM,在此之上進(jìn)行了一定改進(jìn),實(shí)現(xiàn)了“在視頻中分割各目標(biāo)”的可能性。
截自微博
同時(shí),研究團(tuán)隊(duì)使用Intern-T作為特征提取器,提高框架對(duì)不同類型物體的區(qū)分能力,同時(shí)加入了一個(gè)門控傳播模塊(GPM),以便于框架在復(fù)雜環(huán)境中感知更多微小物體,生成高質(zhì)量的即時(shí)目標(biāo)遮罩。
據(jù)悉,在VOTS2023競賽中,HQTrack以0.615的質(zhì)量得分獲得第二名,研究團(tuán)隊(duì)表示,該 AI 框架可以應(yīng)用于人臉識(shí)別、智能駕駛、監(jiān)控追蹤等領(lǐng)域,并有望在未來商業(yè)應(yīng)用中落地。
圖源:HQTrack的GitHub頁面
值得一提的是,阿里云近日在國內(nèi)率先推出針對(duì)Llama2全系列版本的訓(xùn)練和部署方案。官方表示,歡迎所有開發(fā)者來阿里云上打造專屬大模型。
近日,Llama2大語言模型宣布開源,覆蓋70億、130億及700億參數(shù)版本。Llama2可免費(fèi)用于研究場景和月活7億用戶以下的商業(yè)場景,為企業(yè)和開發(fā)者提供了大模型研究的新工具。然而,對(duì)Llama2的再訓(xùn)練和部署仍存在較高門檻,尤其是針對(duì)效果更勝一籌的大尺寸版本。
截自阿里云官網(wǎng)
為方便開發(fā)者群體,阿里云機(jī)器學(xué)習(xí)平臺(tái)PAI在國內(nèi)率先對(duì)Llama2系列模型進(jìn)行深度適配,推出了輕量級(jí)微調(diào)、全參數(shù)微調(diào)、推理服務(wù)等場景的最佳實(shí)踐方案,助力開發(fā)者快速基于Llama2進(jìn)行再訓(xùn)練,搭建自己的專屬大模型。
阿里云牽頭發(fā)起的AI模型社區(qū)魔搭ModelScope,第一時(shí)間上架了Llama2系列模型。開發(fā)者可在魔搭社區(qū)Llama2模型頁面點(diǎn)擊“Notebook快速開發(fā)”,一鍵拉起阿里云機(jī)器學(xué)習(xí)平臺(tái)PAI,對(duì)模型進(jìn)行云上開發(fā)和部署;在其他平臺(tái)下載的Llama2模型,也可使用阿里云PAI進(jìn)行開發(fā)。
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn
