DeepSeek、阿里接連打出王炸,AI行業(yè)徹底變天了
敢開源才是真的OpenAI!
一、阿里云開源最強(qiáng)視頻大模型
本周,AI領(lǐng)域的開源風(fēng)暴正在愈演愈烈,很快也許就會席卷到我們每一個人。
2月24日周一,DeepSeek宣布啟動“開源周”,計劃連續(xù)在五天內(nèi)每天開源一個重磅項目。
在此背景下,阿里云悄然發(fā)力,就在昨夜突然宣布開源自家最強(qiáng)視頻大模型——萬相2.1(Wan)。

圖源:阿里云技術(shù)人員開源當(dāng)晚直播
作為開源老兵,阿里云再次通過開源的方式展現(xiàn)自己的無私以及對自家大模型技術(shù)實力的自信。
在AI技術(shù)飛速發(fā)展的當(dāng)下,開源已經(jīng)成為推動技術(shù)進(jìn)步和生態(tài)建設(shè)的重要力量。
此次阿里開源萬相2.1,采用的是Apache 2.0協(xié)議,該協(xié)議為全球開發(fā)者提供了極大的自由度,無論是商業(yè)應(yīng)用還是學(xué)術(shù)研究,都能在合規(guī)的前提下自由使用該模型。
而對開源的萬相2.1本身而言,其不僅支持文生視頻和圖生視頻任務(wù),還提供了14B和1.3B兩個參數(shù)規(guī)格的全部推理代碼和權(quán)重。
這意味著無論是追求極致效果的專業(yè)人士,還是希望快速部署的普通用戶,都能找到適合自己的解決方案。
目前,全球開發(fā)者已經(jīng)可以在GitHub(https://github.com/Wan-Video/Wan2.1)、HuggingFace(https://huggingface.co/spaces/Wan-AI/Wan2.1)和魔搭社區(qū)(https://modelscope.cn/studios/Wan-AI/Wan-2.1)上下載體驗這一模型。
所以,號稱阿里云最強(qiáng)的萬相2.1到底強(qiáng)大在哪?
首先,從數(shù)據(jù)來看,14B版本的萬相2.1在指令遵循、復(fù)雜運(yùn)動生成、物理建模和文字視頻生成等方面表現(xiàn)都十分出色。
在權(quán)威評測集VBench中,以總分86.22%的成績大幅超越Sora、Luma、Pika等國內(nèi)外知名模型,系該領(lǐng)域的佼佼者。

圖源:鞭牛士
而1.3B版本則在性能和效率之間找到了完美的平衡,不僅超過了更大尺寸的開源模型,甚至與一些閉源模型的表現(xiàn)不相上下。
更令咱們普通人感到驚喜的是,萬相2.1對設(shè)備兼容十分友好,支持消費(fèi)級GPU。
據(jù)了解,13億參數(shù)模型僅需8.2GB顯存就能生成480P視頻,可兼容幾乎所有消費(fèi)級GPU。
這意味著普通用戶也能在消費(fèi)級顯卡上輕松運(yùn)行該模型,極大地降低了使用門檻。
據(jù)媒體評測,該模型在RTX 4090顯卡上生成5秒480P視頻(未使用量化等優(yōu)化技術(shù))大約需要4分鐘。
此外,萬相2.1同時支持文生視頻、圖生視頻、視頻編輯、文生圖、視頻生音頻和視覺文本生成。
并且,萬相2.1還是首個能夠生成中英文文本的視頻模型,無需外部插件就能在視頻中生成想要的文字。

圖源:阿里云官方演示
多家媒體對萬相2.1及其生成視頻能力給予了高度評價:萬相2.1不僅能夠生成高質(zhì)量的視頻,還能在視頻中融入復(fù)雜的運(yùn)動和物理效果。
例如,在官方公開的一個Demo,墨水在紅色宣紙上暈染開來,最終形成一個“?!弊郑P畫邊緣自然模糊,東方韻味十足。

圖源:阿里云官方演示
昨天,阿里旗下的AIGC通義千問也發(fā)布了全新的“Thinking (QwQ)”深度思考模型,支持深度思考和聯(lián)網(wǎng)搜索。
據(jù)悉,該模型基于QWEN2.5-MAX,而官方版QWQ-MAX即將發(fā)布,并將同樣采用Apache 2.0許可協(xié)議開源。
由此可見,即使DeepSeek的爆火給整個行業(yè)帶來了不小的壓力,阿里云仍然擁有著更進(jìn)一步的信心和膽量。
萬相2.1等模型的開源,將為開發(fā)者帶來更多的可能性,也為AI視頻生成領(lǐng)域的發(fā)展注入新的活力。
二、DeepSeek震撼全網(wǎng)的開源周
當(dāng)阿里云以開源的姿態(tài)向世界展示其強(qiáng)大的視頻生成大模型萬相2.1時,全球的目光也聚焦在了另一股開源力量——DeepSeek。
如果說阿里云的開源是一場技術(shù)盛宴,那么DeepSeek的開源周則如同一顆震撼彈,直接在國際舞臺上掀起了滔天巨浪。
與阿里云的堅定開源不同,DeepSeek開源周的種種項目,讓外網(wǎng)的多方人士感到震撼,仿佛一夜之間,屬于真正“OpenAI”的格局被徹底改寫。
今天已經(jīng)是DeepSeek的開源周的第三天,在此之前,DeepSeek已經(jīng)公開了2個令人矚目的技術(shù)成果。
第一天,DeepSeek開源了FlashMLA代碼庫,這是針對Hopper GPU優(yōu)化的高效MLA解碼內(nèi)核,專為處理可變長度序列而設(shè)計。
傳統(tǒng)解碼方法在處理不同長度的序列時,常常會導(dǎo)致GPU的并行計算能力被浪費(fèi),而FlashMLA通過動態(tài)調(diào)度和內(nèi)存優(yōu)化,讓Hopper GPU的算力被“榨干”,吞吐量顯著提升。

圖源:X平臺
簡單來說,FlashMLA可以讓大模型在專業(yè)GPU上跑得更快、效率更高,尤其適用于高性能AI任務(wù)。
這意味著企業(yè)可以用更少的GPU服務(wù)器完成同樣的任務(wù),直接降低了推理成本。
對于開發(fā)者來說,F(xiàn)lashMLA的開源不僅打破了算力壟斷,更降低了技術(shù)門檻,讓他們能夠免費(fèi)獲得“工業(yè)級優(yōu)化方案”,推動更多創(chuàng)新應(yīng)用的誕生。
第一天,DeepSeek開源了DeepEP通信庫,這是首個用于MoE模型訓(xùn)練和推理的開源EP通信庫。
它支持高效的全員溝通,無論是節(jié)點內(nèi)還是節(jié)點間,都支持NVLink和RDMA,確保數(shù)據(jù)傳輸?shù)母咝浴?/span>
同時,DeepEP還具備訓(xùn)練及推理預(yù)填充階段的高吞吐量計算核心,以及推理解碼階段的低延遲計算核心。
這些特性使得DeepEP能夠輕松應(yīng)對大規(guī)模MoE模型的訓(xùn)練和推理任務(wù),極大地提升了模型的性能和效率。
此外,DeepEP還原生支持FP8數(shù)據(jù)分發(fā),靈活控制GPU資源,實現(xiàn)計算與通信的高效重疊。
據(jù)了解,DeepEP在開源后迅速獲得了全球開發(fā)者的關(guān)注和認(rèn)可,其GitHub上的Star量在3小時內(nèi)就突破了1000。

圖源:GitHub
到了今日(第三天),DeepSeek再次祭出了殺手锏——DeepGEMM。
這是DeepSeek能夠訓(xùn)練出V3/R1的核心動力所在,能在大規(guī)模模型訓(xùn)練和推理中,顯著提升計算效率,特別適用于需要高效計算資源的場景。
并且,DeepGEMM的核心邏輯僅約300行代碼,卻實現(xiàn)了高達(dá)1350+FP8 TFLOPS的性能,這一性能表現(xiàn)徹底折服了不少老外。
可以說,DeepGEMM開源項目的出現(xiàn),讓更多開發(fā)者能夠體會到“超級計算機(jī)”一般的高效計算,推動了深度學(xué)習(xí)領(lǐng)域的技術(shù)進(jìn)步。
這一波接一波的沖擊,讓外網(wǎng)直接將DeepSeek譽(yù)為“真正的OpenAI”,人們感慨于DeepSeek的技術(shù)實力和慷慨大方。
三、“開源”值得更多感謝
那么,有的朋友可能會問,我知道開源很偉大,知道做出這些的企業(yè)很無私,但他們的開源,究竟與我們普通人有什么關(guān)系?
事實上,開源的意義遠(yuǎn)不止于技術(shù)層面的突破。
開源的最大意義在于它可以推動企業(yè)打破了技術(shù)的高墻,讓普通人也能享受到AI帶來的種種好處。
正如當(dāng)下無論是大型企業(yè)還是小型創(chuàng)業(yè)公司,都在積極接入DeepSeek等開源模型,將其融入到工作和生活的方方面面。
從智能客服到創(chuàng)意設(shè)計,從醫(yī)療影像分析到教育輔助工具,AI正在以前所未有的速度滲透到每一個角落。
而且開源的意義不僅限于此。
現(xiàn)如今,在全球范圍內(nèi),AI行業(yè)正迎來一場前所未有的“軍備競賽”。
這場競賽不僅囊括了像阿里云、DeepSeek這樣的開源先鋒,也包括像OpenAI和Meta這樣的國際巨頭。
前段時間,OpenAI宣布部分模型免費(fèi)開放。
緊接著,Anthropic也在近日對其大模型進(jìn)行了升級換代,推出了號稱“迄今為止最聰明”的Claude 3.7 Sonnet,僅部分功能不支持免費(fèi)使用。
這些變化正是開源在與閉源的較量勝出,推動了整個行業(yè)加速前進(jìn)。
這種“開源福利”不僅在國內(nèi)引發(fā)了熱潮,更輻射到了全球。
DeepSeek的開源周和阿里云的開源行動,不僅為國內(nèi)開發(fā)者提供了寶貴的技術(shù)資源,也讓全球AI行業(yè)看到了開源的力量。
如今,開源模型不僅在性能上不遜色于閉源模型,更在靈活性和可擴(kuò)展性上展現(xiàn)出獨(dú)特的優(yōu)勢。
開源的力量正在全球范圍內(nèi)匯聚,形成一股不可阻擋的潮流。
只能說,僅通過這半個月以來AI行業(yè)的各種變化來看,誰還能再云淡風(fēng)輕地說出那句“開源模型會越來越落后”。
開源,正在以一種前所未有的速度改變世界。
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn
