京東言犀攜手NLPCC 2022舉辦多模態(tài)商品摘要挑戰(zhàn)賽
3月22日消息,據(jù)京東云消息,近年來AI技術(shù)取得了巨大的進(jìn)步,尤其是在自然語言處理的文本生成領(lǐng)域,具有十分廣泛的產(chǎn)業(yè)化應(yīng)用前景,不僅可以基于文本,還可以基于圖片等多模態(tài)信息生成文案。
京東已在自身業(yè)務(wù)中大規(guī)模應(yīng)用了文本生成技術(shù),可以在短時間內(nèi)為用戶撰寫商品摘要文案,并根據(jù)用戶喜好推薦給用戶“種草”。
京東言犀基于領(lǐng)域預(yù)訓(xùn)練K-PLUG的商品文案生成模型已經(jīng)覆蓋了京東的3000+個三級品類,人工審核通過率90%以上,累計生成文案30億字,應(yīng)用于京東發(fā)現(xiàn)好貨頻道、搭配購、AI直播帶貨等,累計帶來超過3億元GMV。此外,言犀還擁有寫詩、寫春聯(lián)、書法創(chuàng)作等多種AI能力。
據(jù)了解,商品摘要文案的挑戰(zhàn)主要來源于三個方面,首先,信息的來源豐富,包含標(biāo)題、商品規(guī)格、產(chǎn)品海報等信息;其次,需要處理多模態(tài)和結(jié)構(gòu)化的信息,包含文字和圖像各類信息,以及商品規(guī)格參數(shù)等結(jié)構(gòu)化信息;再次,AI系統(tǒng)必須要足夠智能,能夠充分挖掘商品的賣點(diǎn)信息,并在合適的時間,千人千面的推薦給恰當(dāng)?shù)挠脩簟?/p>
基于此,京東言犀開放了京東真實場景的脫敏數(shù)據(jù),攜手NLPCC 2022舉辦多模態(tài)商品摘要挑戰(zhàn)賽。該任務(wù)旨在為一個指定商品生成一段凝練的文本摘要,給定的輸入包括商品詳細(xì)文本描述、商品知識圖譜和商品圖片。
該任務(wù)的數(shù)據(jù)集來自于京東脫敏數(shù)據(jù),每個樣本包含商品文本描述、商品知識圖譜、商品圖片、商品摘要。數(shù)據(jù)集分為箱包、家電、服飾三個子集。
賽事組織方將提供基線模型:K-PLUG模型及其擴(kuò)展的多模態(tài)版本,為廣大參賽者提供參考(K-PLUG模型是電商領(lǐng)域的預(yù)訓(xùn)練語言模型)。測評方法包括自動測評ROUGE、人工測評。人工測評指標(biāo)含忠實度、可讀性、非冗余性、重要性。
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn