阿里云周靖人:大模型生態(tài)會進行優(yōu)勝劣汰選擇,從而收斂到更完整、完善狀態(tài)
12月4日消息,阿里云CTO周靖人在12月1日的發(fā)布會上宣布阿里云開源通義千問720億參數(shù)模型Qwen-72B。據(jù)了解,Qwen-72B在10個權威基準測評創(chuàng)下開源模型最優(yōu)成績,成為業(yè)界最強開源大模型,性能超越開源標桿Llama 2-70B和大部分商用閉源模型,可適配企業(yè)級、科研級的高性能應用。
阿里云CTO周靖人宣布開源通義千問720億參數(shù)模型Qwen-72B
圖源阿里云公眾號
會后,周靖人做了一場閉門分享。在分享會上,周靖人表示,阿里云目前已經(jīng)和不少硬件廠商在洽談合作。之所以開源,就是為了不局限于某一個或某幾家廠商,而是有更多開發(fā)者和硬件廠商一起來參與、推動。
周靖人指出,阿里云目前做是生態(tài)的方方面面,當前更加關注的是模型本身。對于大模型在C端和B端商業(yè)變現(xiàn)的機會和價值,他表示,在to C和to B方面應用的探索會有一些,但還沒有到井噴的狀態(tài)。
關于國內(nèi)大模型大量發(fā)布現(xiàn)狀,周靖人認為,任何一項技術都有一個蓬勃發(fā)展并快速迭代的周期,最終也可能受技術、商業(yè)等各方面的約束而收斂。生態(tài)的好處,就是它自己會收斂到合適的局面。
通義千問發(fā)布會現(xiàn)場
圖源阿里云公眾號
以下是對話實錄(內(nèi)容經(jīng)摘編):
Q:阿里云在三季報發(fā)布后宣布,堅持更長期的投入及優(yōu)先公共云的戰(zhàn)略調(diào)整,大模型是否會有相應的策略調(diào)整?
A:我們從年初發(fā)布至今整個策略都沒有變化,即一方面做技術的突破,另一方面做生態(tài),提供模型的能力。阿里CEO吳泳銘提出的戰(zhàn)略調(diào)整,也跟整個大模型社區(qū)的發(fā)展方向非常吻合,沒什么具體的差異。公司最近會把技術工作路線更加明確下來。
Q:很多大型廠商選擇了不開源,阿里云為什么要選擇開源模式?
A:我認為是大家站位不同。在過去10年內(nèi),整個開源社區(qū)蓬勃發(fā)展,今天我們要讓更多技術和更多人參與進來。開源社區(qū)是最佳的、也是唯一的途徑。只有真正從心底去擁抱開放的生態(tài),去促進開發(fā)者社區(qū)的發(fā)展,才能將我們的技術融入到各行各業(yè),最終幫助整個核心技術的突破和創(chuàng)新。
阿里云的初衷不是把模型攥在自己手里,或者做商業(yè)化,而是幫助開發(fā)者。我們的開源策略,跟整個阿里云的初心是完全一致的。因此,我們不光在模型方面開源,數(shù)據(jù)庫、技術等也都貢獻到開源社區(qū)。今天AI的發(fā)展,一定不是由一家公司完成的。不管誰有最強的模型,如果沒有開放的技術和經(jīng)驗,是無法在各項應用場景中落地的。
Q:在大模型能力上中國企業(yè)和美國企業(yè)的差距是什么?
A:科技創(chuàng)新上,原則上是大家你追我趕,都在做非常中長期的一系列探索,在這個時間點或許有差距,但也許差距在縮小,甚至扭轉也有可能。這就是科技創(chuàng)新的魅力。
我們能看到(和ChatGPT)之間有一定差距,還有需要提升的空間,但是不能妄自菲薄。比如多模態(tài)等,國內(nèi)很多產(chǎn)品也能做到ChatGPT的水平,甚至超越它。通義千問和ChatGPT 4.0在使用體感上,是互有勝負的。
Q:通義千問與其他閉源模型相比水平如何?
A:講到評測指標,國外的Hugging Face在全球比較有影響力,它有一系列測評標準,會展現(xiàn)一個客觀的評價。當然,不是所有閉源模型都會參與測評。在Hugging Face上,我們在開源14B的時候是非全模型排名第三,72B發(fā)布之后我們會繼續(xù)等待測評。我認為我們可能會登頂。
Q:Open AI 最近選擇了Agent作為下一步開發(fā)方向,你們有什么思考和跟進?
A:Agent這個概念不是Open AI最近提出的,但它是一個非常重要的模型利用的領域。目前我們社區(qū)已經(jīng)貢獻了很多關于Agent的開發(fā)和創(chuàng)新,接下來每個月都有相關進展,包括如何幫開發(fā)者搭建這樣一個Agent,也會有一些新的功能推出。
Q:聯(lián)想未來將會發(fā)布與阿里云合作完成的AI PC(個人電腦),大模型會給PC帶來哪些實質(zhì)性影響?
A:與聯(lián)想的合作是一個良好的開端。我們希望不單單是在復雜和昂貴的機器上使用模型的能力,而是把它帶到各種端。當我們真正進入AI時代,大模型將改變?nèi)粘I?,模型服務在各個領域無所不在。今后每一個電子設備和生活環(huán)節(jié),從早晨的鬧鐘開始,都會有模型的支持。我相信很快會進入這樣一個時代。
Q:未來是否會和更多硬件廠商進行合作?
A:目前已經(jīng)有不少硬件廠商在洽談,我們的心態(tài)是非常開放的。之所以開源,就是為了不局限于某一個或某幾家廠商,而是有更多開發(fā)者和硬件廠商一起來參與、推動。
Q:怎么看待大模型在C端和B端商業(yè)變現(xiàn)的機會和價值?
A:我們要做是生態(tài)的方方面面,所以當前更加關注的是模型本身。在to C和to B方面應用的探索會有一些,但還沒有到井噴的狀態(tài)。模型的應用是沒有to C和to B之分的,但我們也希望模型的能力能夠滲透到日常生活和工作學習中。接下來會看到一些創(chuàng)新,也許今后幾個月,我們就會聊到一系列應用,以及如何幫助到to C和to B的產(chǎn)品。
Q:阿里云認為實現(xiàn)AGI還要多久?
A:AGI已經(jīng)成為社會性的話題,有各種各樣的解釋。但我認為現(xiàn)在談AGI還太早,因為還有很多技術難題,還有很多長足的工作要做。由于ChatGPT的爆發(fā),讓一年前不怎么關注人工智能的人現(xiàn)在都在關注,我作為技術工作者感到欣慰。但從整個技術發(fā)展來看還需要很多時間,請大家給予更多耐心。不要今天關注一個熱點,3個月沒爆發(fā),大家就淡忘了。
Q:通義千問會將技術產(chǎn)品優(yōu)化和商業(yè)化落地當成重點,還是像Open AI一樣將AGI當作愿景?
A:我們做的工作其實是沒有人指引的。通義千問首先是追求技術的卓越和極致的技術探索。如何能夠把模型的方方面面提升起來?這本身就是一個研究課題,這方面一定是我們接下來的工作重點。
但在這個時代,科研、技術、產(chǎn)品這幾個維度是更有機地聯(lián)合在一起的,沒辦法像以前分得那么開。光埋頭苦干做研究,不做技術產(chǎn)品、不做技術生態(tài),在今天也不行。這就是為什么通義千問是一整個通義模型家族。我們不斷追求技術突破,同時也開源自己的模型,幫助整個生態(tài)繁榮。我們還做產(chǎn)品,包括通義千問App、網(wǎng)頁版產(chǎn)品。
Q:通義千問在技術上還面臨哪些挑戰(zhàn)?
A:整個大模型還處在發(fā)展初期。不管誰家的大模型,都還有很多提升空間。今天的模型具備視覺、聽覺的能力,但如何像人一樣思考、去識別萬物,所有大模型都還有一定差距。通義千問產(chǎn)品這次推出了視覺模型能力,對圖片的理解在很多層面是超過ChatGPT 4.0的,但距離人類的認知能力還有一定差距。
如何讓這個模型有更多思維能力、像人一樣去思考,這方面才剛剛起步。我們當前有非常多要解決的技術難點,這也是為什么接下來每個月都會有一系列技術突破。整個通義千問模型的升級能力遠遠沒有結束。
Q:實現(xiàn)了從0到1后,是創(chuàng)新更重要,還是推廣產(chǎn)品更重要?
A:追求技術的卓越一直是阿里云的初衷。在一定程度上,所謂從0到1和從1到2沒有本質(zhì)區(qū)別,都是在做突破。從0到1非常難,因為要探索一條新的道路。但繼續(xù)把產(chǎn)品技術打磨好,每提高一個百分點,其實也隱藏著非常多的技術難題和投入。
Q:上一次開源14B反響不錯,為什么要再去開源更高的72B?哪些場景是14B無法解決的?
A:14B是一個非常好的起點,但模型的能力還在不斷發(fā)展中,創(chuàng)新技術的突破一直沒有停止過,14B更往上還有很多提升的空間。這是推出72B模型的初衷,今后14B和7B也會有升級的版本出來。
在不同的企業(yè)和不同的開發(fā)環(huán)境,大家對模型的尺寸、能力及背后使用的資源有不一樣的考慮,有時會追求極致的性能。我們不應該用一個模型、一個尺寸,要求大家對接所有的場景,而是應該把選擇權留給開發(fā)者和企業(yè)。
Q:國內(nèi)已經(jīng)發(fā)布了200多個大模型,需要這么多嗎?合理的生態(tài)是什么樣的結構?
A:任何一項技術都有一個蓬勃發(fā)展并快速迭代的周期,最終也可能受技術、商業(yè)等各方面的約束而收斂。生態(tài)的好處,就是它自己會收斂到合適的局面。
今天我們有200多款大模型,能夠感受到科技界積極擁抱的態(tài)度。今年1月時大家還感覺很消極,覺得跟海外差距很大,到12月已經(jīng)沒有這樣的感覺。我相信整個市場、整個生態(tài)也會進行優(yōu)勝劣汰的選擇,也會收斂到更完整、完善的狀態(tài),這就是生態(tài)的魅力。
2、電商號平臺僅提供信息存儲服務,如發(fā)現(xiàn)文章、圖片等侵權行為,侵權責任由作者本人承擔。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn