亚洲无码高清自拍偷拍自慰av网站,免费高清无码黄色网,欧美一级片免费在线观看,午夜毛片在线观看

字節(jié)發(fā)布文生圖開放模型SDXL-Lightning

柏納
2024-02-23 20:46

2月23日消息,據(jù)界面新聞報(bào)道,字節(jié)發(fā)布文生圖開放模型SDXL-Lightning。AI開源社區(qū)Hugging Face的最新榜單上,SDXL-Lightning躋身模型趨勢(shì)榜,同時(shí)也成為Hugging Face Spaces上的熱門模型。

與SDXL-Lightning一同上榜的,是谷歌新近推出的“最強(qiáng)開放大模型”Gemma系列,以及Stability AI的新一代文生圖模型Stable Cascade。

format-jpg

截自界面新聞

在圖像生成領(lǐng)域,先進(jìn)模型的生成技術(shù)依賴于擴(kuò)散過程,就是把噪聲逐步轉(zhuǎn)化為圖像樣本的迭代。這個(gè)過程通常需要20到40次調(diào)用神經(jīng)網(wǎng)絡(luò),不僅會(huì)耗費(fèi)巨大的計(jì)算資源,生成速度也比較慢。生成一張高質(zhì)量圖像,大約需要5秒。

據(jù)知情人士透露,字節(jié)跳動(dòng)的SDXL-Lightning通過漸進(jìn)式對(duì)抗蒸餾的技術(shù),實(shí)現(xiàn)前所未有的生成速度。該模型能夠在2步或4步內(nèi)生成極高質(zhì)量和分辨率的圖像,將生成速度加快十倍,是1024分辨率下速度最快的文生圖模型,計(jì)算成本則降低為十分之一。

字節(jié)跳動(dòng)智能創(chuàng)作團(tuán)隊(duì)對(duì)回應(yīng)稱,開源開放的浪潮已成為推動(dòng)人工智能迅猛發(fā)展的關(guān)鍵力量,SDXL-Lightning模型基于已有繁榮生態(tài)的文生圖開放模型SDXL,設(shè)計(jì)之初就考慮到與開放模型社區(qū)的兼容。SDXL-Lightning可以作為增速插件無縫整合到卡通、動(dòng)漫等多樣風(fēng)格的SDXL模型中,并支持當(dāng)前流行的控制插件ControlNet、生成軟件 ComfyUI,方便開發(fā)者、研究人員和創(chuàng)意從業(yè)者結(jié)合使用這些工具,助力整個(gè)行業(yè)的創(chuàng)新和協(xié)作。

format-jpg

圖源:66秒未來科技公眾號(hào)

值得一提的是,近日有消息稱,在Sora引爆文生視頻賽道之前,國內(nèi)的字節(jié)跳動(dòng)也推出了一款顛覆性視頻模型——Boximator。與Gen-2、Pink1.0等模型不同的是,Boximator可以通過文本精準(zhǔn)控制生成視頻中人物或物體的動(dòng)作。

對(duì)此,字節(jié)跳動(dòng)相關(guān)人士回應(yīng)稱,Boximator是視頻生成領(lǐng)域控制對(duì)象運(yùn)動(dòng)的技術(shù)方法研究項(xiàng)目,目前還無法作為完善的產(chǎn)品落地,距離國外領(lǐng)先的視頻生成模型在畫面質(zhì)量、保真率、視頻時(shí)長等方面還有很大差距。

format-jpg

截自微博

此外,據(jù)Tech星球2月18日?qǐng)?bào)道,目前抖音集團(tuán)多部門加大AI技術(shù)研發(fā),并調(diào)集多位高管跟進(jìn),現(xiàn)在已有多款A(yù)I產(chǎn)品開啟內(nèi)測(cè)。

其中,F(xiàn)low部門是抖音在AI技術(shù)研究和產(chǎn)品研發(fā)的排頭兵,進(jìn)展最快。該部門已經(jīng)推出了豆包(Cici)、扣子(Coze)等AI產(chǎn)品外,另有AI角色互動(dòng)APP“話爐”、AI產(chǎn)品“PicPic”正在內(nèi)測(cè)和研發(fā)階段。

除了Flow,抖音集團(tuán)的其他重要業(yè)務(wù)部門也正在加碼AI產(chǎn)品服務(wù),包括抖音電商、抖音生活服務(wù)、火山引擎、巨量引擎、稀土掘金、今日頭條、大力教育、剪映等。

1、該內(nèi)容為作者獨(dú)立觀點(diǎn),不代表電商派觀點(diǎn)或立場(chǎng),文章為作者本人上傳,版權(quán)歸原作者所有,未經(jīng)允許不得轉(zhuǎn)載。
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn
相關(guān)閱讀
5月15日消息,在今日的2024春季火山引擎FORCE原動(dòng)力大會(huì),字節(jié)跳動(dòng)正式發(fā)布自研大模型“豆包大模型”,該大模型包含豆包通用模型、語音合成模型模型等一共9個(gè)模型,已在字節(jié)跳動(dòng)內(nèi)部50多個(gè)業(yè)務(wù)和場(chǎng)景進(jìn)行過應(yīng)用。
4月17日消息,在火山引擎FORCE LINK AI創(chuàng)新巡展,火山引擎總裁譚待公布豆包1.5深度思考模型,該模型將正式面向企業(yè)提供服務(wù)。譚待表示,豆包1.5深度思考模型能夠結(jié)合視覺理解提供更多功能,例如根據(jù)照片分析地貌,或在旅行時(shí)輔助點(diǎn)餐、完成企業(yè)項(xiàng)目管理流程圖。此外,豆包模型3.0升級(jí),帶來包括更美觀的文字排版,更精細(xì)的圖片生成能力,以及2k圖片直出能力。
5月15日消息,火山引擎主辦的FORCE原動(dòng)力大會(huì)在京舉行。會(huì)上發(fā)布的數(shù)據(jù)顯示,截至目前,字節(jié)跳動(dòng)旗下大模型豆包App目前總下載量已經(jīng)突破1億,雙端月活躍用戶突破2600萬,智能體創(chuàng)建總數(shù)800萬。會(huì)上,字節(jié)豆包大模型正式開啟對(duì)外服務(wù),據(jù)悉,豆包大模型包含豆包通用模型Pro、豆包通用模型liti、豆包·角色扮演模型、豆包·語音合成模型、豆包·聲音復(fù)刻模型、豆包·語音識(shí)別模型、豆包·模型、豆包·Function Call模型
1月22日消息,字節(jié)跳動(dòng)發(fā)布豆包大模型1.5Pro版本。目前,Doubao-1.5-pro已在豆包APP灰度上線,開發(fā)者也可在火山引擎直接調(diào)用API。據(jù)介紹,該模型具有低訓(xùn)練/推理成本,高效模型結(jié)構(gòu),全面提升了多模態(tài)能力、推理能力。在知識(shí)、代碼、推理、中文等多項(xiàng)公開測(cè)評(píng)基準(zhǔn)成績?nèi)蝾I(lǐng)先。同時(shí),在模型訓(xùn)練過程中,Doubao-1.5-pro未使用任何其他模型生成的數(shù)據(jù)。
12月18日消息,在火山引擎Force大會(huì)字節(jié)跳動(dòng)正式發(fā)布豆包視覺理解模型,為企業(yè)提供極具性價(jià)比的多模態(tài)大模型能力。豆包視覺理解模型千tokens輸入價(jià)格僅為3厘,一元錢就可處理284張720P的圖片,比行業(yè)價(jià)格便宜85%,以更低成本推動(dòng)AI技術(shù)普惠和應(yīng)用發(fā)展。繼大語言模型價(jià)格以厘計(jì)算之后,視覺理解模型也宣告進(jìn)入“厘時(shí)代”。
火山引擎總裁譚待表示,“國內(nèi)大模型領(lǐng)域的數(shù)十家企業(yè),超過七成已經(jīng)在火山引擎云”。
3月3日消息,字節(jié)跳動(dòng)發(fā)布AI編程工具Trae國內(nèi)版,模型搭載doubao-1.5-pro,支持切換滿血版DeepSeek R1&V3。據(jù)了解,這是國內(nèi)首個(gè)AI原生集成開發(fā)環(huán)境工具(AI IDE),能充分釋放AI的潛力,幫助各階段開發(fā)者與AI流暢協(xié)作,更快、更高質(zhì)量地完成編程工作,提升開發(fā)效率。用戶可通過Trae中國官網(wǎng)下載體驗(yàn)。