騰訊云正式發(fā)布向量數(shù)據(jù)庫 提供10億級向量檢索能力
7月5日消息,騰訊云日前正式發(fā)布面向大模型訓練的向量數(shù)據(jù)庫(Tencent Cloud VectorDB)。
據(jù)了解,該數(shù)據(jù)庫能夠被廣泛應用于大模型的訓練、推理和知識庫補充等場景,是國內首個從接入層、計算層、到存儲層提供全生命周期AI化的向量數(shù)據(jù)庫。
向量數(shù)據(jù)庫專門用于存儲和查詢向量數(shù)據(jù)。騰訊云向量數(shù)據(jù)庫最高支持10億級向量檢索規(guī)模,延遲控制在毫秒級,相比傳統(tǒng)單機插件式數(shù)據(jù)庫檢索規(guī)模提升10倍,同時具備百萬級每秒查詢(QPS)的峰值能力。
(圖源:騰訊云官微,下同)
據(jù)統(tǒng)計,將騰訊云向量數(shù)據(jù)庫用于大模型預訓練數(shù)據(jù)的分類、去重和清洗相比傳統(tǒng)方式可以實現(xiàn)10倍效率的提升,如果將向量數(shù)據(jù)庫作為外部知識庫用于模型推理,則可以將成本降低2-4個數(shù)量級。
騰訊云重新定義了AI Native的開發(fā)范式,提供了接入層、計算層、存儲層的全面AI化解決方案,使用戶在使用向量數(shù)據(jù)庫的全生命周期,都能應用到AI能力。
在接入層,騰訊云向量數(shù)據(jù)庫支持自然語言文本的輸入,同時采用“標量+向量”的查詢方式,支持全內存索引,最高支持每秒百萬的查詢量(QPS);在計算層,AI Native開發(fā)范式能實現(xiàn)全量數(shù)據(jù)AI計算,一站式解決企業(yè)在搭建私域知識庫時的文本切分(segment)、向量化(embedding)等難題;在存儲層,騰訊云向量數(shù)據(jù)庫支持數(shù)據(jù)智能存儲分布,助力企業(yè)存儲成本降低50%。
企業(yè)原先接入一個大模型需要花1個月左右時間,使用騰訊云向量數(shù)據(jù)庫后,3天時間即可完成,極大降低了企業(yè)的接入成本。
騰訊云數(shù)據(jù)庫副總經理羅云指出,向量數(shù)據(jù)庫已經在QQ瀏覽器、騰訊視頻、騰訊游戲、QQ音樂、搜狗輸入法等30+業(yè)務場景中應用,并自研了分布式向量數(shù)據(jù)庫核心引擎Olama,原名ElasticFaiss。
數(shù)據(jù)顯示,使用騰訊云向量數(shù)據(jù)庫后,QQ音樂人均聽歌時長提升3.2%、騰訊視頻有效曝光人均時長提升1.74%、QQ瀏覽器成本降低37.9%。
羅云表示,未來,“向量數(shù)據(jù)庫+大模型+數(shù)據(jù)”將產生“飛輪效應”,共同助力企業(yè)步入AI Native(AI原生)時代。
2、電商號平臺僅提供信息存儲服務,如發(fā)現(xiàn)文章、圖片等侵權行為,侵權責任由作者本人承擔。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn
