快手自研大模型“快意”亮相
8月21日消息,在多個知名大模型排行榜上,一個新面孔KwaiYii-13B近日表現(xiàn)亮眼,并一舉躍居CMMLU中文向排名首位。據(jù)悉,這是來自快手AI團(tuán)隊從零到一獨立自研的大模型——“快意”(KwaiYii)。
截自微博
根據(jù)其GitHub主頁介紹,“快意”是由快手AI團(tuán)隊研發(fā)的大規(guī)模語言模型,而本次引發(fā)關(guān)注的正是其新版本KwaiYii-13B。該模型在多個Benchmark上都處于領(lǐng)先水平,證明了其在自然語言處理任務(wù)中的出色性能。
其中,KwaiYi-13B-Base預(yù)訓(xùn)練模型具備優(yōu)異的通用技術(shù)底座能力,在MMLU、CMMLU、C-Eval、HumanEval等Benchmark上目前處于同等模型規(guī)模的領(lǐng)先水平,顯示了快意大模型在中文和英文上都具備非常強(qiáng)悍的能力。
圖源:極客公園公眾號
而KwaiYii-13B-Chat對話模型具備出色的語言理解和生成能力,支持內(nèi)容創(chuàng)作、信息咨詢、數(shù)學(xué)邏輯、代碼編寫、多輪對話等廣泛任務(wù),人工評估結(jié)果表明KwaiYi-13B-Chat超過主流的開源模型,并在內(nèi)容創(chuàng)作、信息咨詢和數(shù)學(xué)解題上接近ChatGPT(3.5)同等水平。
據(jù)了解,目前“快意”已經(jīng)開啟內(nèi)測,并為業(yè)務(wù)團(tuán)隊提供了標(biāo)準(zhǔn)API和定制化項目合作方案,以便在各種業(yè)務(wù)場景中進(jìn)行測試和驗證。
KwaiYii-13B-Chat在人工評測上的效果,圖源:極客公園公眾號
2022年至今,快手AI團(tuán)隊已發(fā)表130多篇頂會論文,覆蓋機(jī)器學(xué)習(xí)、自然語言處理、圖像識別、語音識別、搜推廣等多項研究領(lǐng)域,包含 ICCV/CVPR(21)、ACM MM(9)、KDD(9)、SIGIR(9)等頂級會議。
7月8日,快手宣布正在內(nèi)測智能問答產(chǎn)品,在搜索場景中為用戶帶來智能問答和文本創(chuàng)作等新功能。8月8日,“快手AI對話”開啟小范圍測試,以搜索場景為入口,為用戶提供更多元、便捷的搜索形態(tài),大為降低用戶的搜索使用門檻。據(jù)悉,這兩個新產(chǎn)品功能均基于“快意”大模型研發(fā)。
快手App已內(nèi)測AI對話功能,圖源:極客公園公眾號
8月18日,“快手AI對話”功能已經(jīng)在快手APP安卓版本開放內(nèi)測,這也是短視頻直播行業(yè)首個基于大語言模型落地的智能問答產(chǎn)品,在搜索場景中為用戶帶來智能問答和文本創(chuàng)作等新功能。參與測試的用戶點擊快手搜索首頁右上角AI圖標(biāo)即可進(jìn)入產(chǎn)品首頁,選擇輸入內(nèi)容對話或點擊引導(dǎo)問題便可開啟對話,或者觸發(fā)“搜索智能問答”卡片,通過底部入口可以啟用該功能。
據(jù)稱,快手AI團(tuán)隊將持續(xù)迭代“快意”大模型,一方面將繼續(xù)優(yōu)化模型性能并研發(fā)多模態(tài)能力,另一方面也在推進(jìn)更多C端與B端業(yè)務(wù)場景下的落地。
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn