字節(jié)發(fā)布文生圖開放模型SDXL-Lightning
2月23日消息,據(jù)界面新聞報(bào)道,字節(jié)發(fā)布文生圖開放模型SDXL-Lightning。AI開源社區(qū)Hugging Face的最新榜單上,SDXL-Lightning躋身模型趨勢(shì)榜,同時(shí)也成為Hugging Face Spaces上的熱門模型。
與SDXL-Lightning一同上榜的,是谷歌新近推出的“最強(qiáng)開放大模型”Gemma系列,以及Stability AI的新一代文生圖模型Stable Cascade。
截自界面新聞
在圖像生成領(lǐng)域,先進(jìn)模型的生成技術(shù)依賴于擴(kuò)散過程,就是把噪聲逐步轉(zhuǎn)化為圖像樣本的迭代。這個(gè)過程通常需要20到40次調(diào)用神經(jīng)網(wǎng)絡(luò),不僅會(huì)耗費(fèi)巨大的計(jì)算資源,生成速度也比較慢。生成一張高質(zhì)量圖像,大約需要5秒。
據(jù)知情人士透露,字節(jié)跳動(dòng)的SDXL-Lightning通過漸進(jìn)式對(duì)抗蒸餾的技術(shù),實(shí)現(xiàn)前所未有的生成速度。該模型能夠在2步或4步內(nèi)生成極高質(zhì)量和分辨率的圖像,將生成速度加快十倍,是1024分辨率下速度最快的文生圖模型,計(jì)算成本則降低為十分之一。
字節(jié)跳動(dòng)智能創(chuàng)作團(tuán)隊(duì)對(duì)回應(yīng)稱,開源開放的浪潮已成為推動(dòng)人工智能迅猛發(fā)展的關(guān)鍵力量,SDXL-Lightning模型基于已有繁榮生態(tài)的文生圖開放模型SDXL,設(shè)計(jì)之初就考慮到與開放模型社區(qū)的兼容。SDXL-Lightning可以作為增速插件無縫整合到卡通、動(dòng)漫等多樣風(fēng)格的SDXL模型中,并支持當(dāng)前流行的控制插件ControlNet、生成軟件 ComfyUI,方便開發(fā)者、研究人員和創(chuàng)意從業(yè)者結(jié)合使用這些工具,助力整個(gè)行業(yè)的創(chuàng)新和協(xié)作。
圖源:66秒未來科技公眾號(hào)
值得一提的是,近日有消息稱,在Sora引爆文生視頻賽道之前,國內(nèi)的字節(jié)跳動(dòng)也推出了一款顛覆性視頻模型——Boximator。與Gen-2、Pink1.0等模型不同的是,Boximator可以通過文本精準(zhǔn)控制生成視頻中人物或物體的動(dòng)作。
對(duì)此,字節(jié)跳動(dòng)相關(guān)人士回應(yīng)稱,Boximator是視頻生成領(lǐng)域控制對(duì)象運(yùn)動(dòng)的技術(shù)方法研究項(xiàng)目,目前還無法作為完善的產(chǎn)品落地,距離國外領(lǐng)先的視頻生成模型在畫面質(zhì)量、保真率、視頻時(shí)長等方面還有很大差距。
截自微博
此外,據(jù)Tech星球2月18日?qǐng)?bào)道,目前抖音集團(tuán)多部門加大AI技術(shù)研發(fā),并調(diào)集多位高管跟進(jìn),現(xiàn)在已有多款A(yù)I產(chǎn)品開啟內(nèi)測(cè)。
其中,F(xiàn)low部門是抖音在AI技術(shù)研究和產(chǎn)品研發(fā)的排頭兵,進(jìn)展最快。該部門已經(jīng)推出了豆包(Cici)、扣子(Coze)等AI產(chǎn)品外,另有AI角色互動(dòng)APP“話爐”、AI產(chǎn)品“PicPic”正在內(nèi)測(cè)和研發(fā)階段。
除了Flow,抖音集團(tuán)的其他重要業(yè)務(wù)部門也正在加碼AI產(chǎn)品服務(wù),包括抖音電商、抖音生活服務(wù)、火山引擎、巨量引擎、稀土掘金、今日頭條、大力教育、剪映等。
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn