阿里通義開源音頻語言模型Qwen2-Audio
2024-08-13 11:17:32
分享
8月13日消息,阿里通義大模型繼續(xù)開源,Qwen2系列開源家族新增音頻語言模型Qwen2-Audio。Qwen2-Audio可以不需文本輸入,直接進(jìn)行語音問答,理解并分析用戶輸入的音頻信號(hào),包括人聲、自然音、音樂等。該模型在多個(gè)權(quán)威測(cè)評(píng)中都顯著超越先前的最佳模型。通義團(tuán)隊(duì)還同步推出了一套全新的音頻理解模型測(cè)評(píng)基準(zhǔn),相關(guān)論文已入選本周正在舉辦的國際頂會(huì)ACL 2024。
更加詳細(xì)情況,請(qǐng)關(guān)注本站最新動(dòng)態(tài)。