月之暗面獲超10億美金融資 小紅書、美團(tuán)、阿里等共同投資
2月19日消息,據(jù)36氪,AI創(chuàng)業(yè)公司“月之暗面”近期已完成新一輪超10億美金融資,投資方包括紅杉中國(guó)、小紅書、美團(tuán)、阿里,老股東跟投。
月之暗面的上一輪融資為2023年獲得的超2億美金融資,投資方包括紅杉中國(guó)、真格基金等。本輪融資后,月之暗面估值已達(dá)約25億美金,為國(guó)內(nèi)大模型領(lǐng)域的頭部企業(yè)之一。
此外,該報(bào)道還稱,月之暗面當(dāng)前已經(jīng)在秘密研發(fā)通用多模態(tài)模型,預(yù)計(jì)今年內(nèi)將推出。月之暗面在多模態(tài)相關(guān)技術(shù)上多有儲(chǔ)備,團(tuán)隊(duì)成員曾發(fā)明了包括基于對(duì)比學(xué)習(xí)的視覺預(yù)訓(xùn)練范式MoCo、最高效的視覺網(wǎng)絡(luò)結(jié)構(gòu)之一ShuffleNet等,也有團(tuán)隊(duì)成員主導(dǎo)開發(fā)了detectron2,后者是一個(gè)被廣泛使用的視覺開源項(xiàng)目,曾被集成到Meta全線VR/AR產(chǎn)品中。
圖源:36氪
天眼查App顯示,月之暗面是一家AIGC公司,主要業(yè)務(wù)為AGI,已于2023年6月完成天使輪融資,投資方為紅杉中國(guó)和真格基金。月之暗面所屬公司為北京月之暗面科技有限公司,該公司成立于成立于2023年4月,法定代表人楊植麟,企業(yè)注冊(cè)資本100萬(wàn)人民幣,實(shí)繳資本85萬(wàn)人民幣,企業(yè)經(jīng)營(yíng)范圍包括計(jì)算機(jī)系統(tǒng)服務(wù);軟件銷售;計(jì)算機(jī)軟硬件及輔助設(shè)備零售;計(jì)算機(jī)軟硬件及輔助設(shè)備批發(fā)等。
據(jù)了解,月之暗面(Moonshot AI)成立于2023年3月,是國(guó)內(nèi)大模型領(lǐng)域的關(guān)鍵玩家。其核心團(tuán)隊(duì)曾參與到Google Gemini、Google Bard、盤古NLP、悟道等多個(gè)大模型的研發(fā)中,目前月之暗面團(tuán)隊(duì)人數(shù)已超80人。
北京月之暗面科技有限公司企業(yè)詳情 圖源:天眼查APP
其中,團(tuán)隊(duì)創(chuàng)始人楊植麟是一個(gè)90后,本科畢業(yè)于清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系,博士就讀于全美自然語(yǔ)言處理排名第一的卡內(nèi)基梅隆大學(xué)語(yǔ)言技術(shù)研究所(LTI),師從蘋果AI研究負(fù)責(zé)人Ruslan Salakhutdinov、谷歌首席科學(xué)家William Cohen。
在博士期間,楊植麟用4年時(shí)間完成了一般6年才能完成的博士課程,并連續(xù)作為第一作者發(fā)表了兩項(xiàng)關(guān)鍵研究成果——Transformer-XL和XLNet。Transformer-XL 成為首個(gè)全面超越 RNN 的注意力語(yǔ)言模型,相關(guān)論文是 NeurIPS 2019 與 ACL 2019 的最高引論文之一;XLNet 則在 20 項(xiàng)任務(wù)上超越谷歌 BERT 模型。截至目前,楊植麟本人學(xué)術(shù)引用量自2019年起已超2萬(wàn)余次。
楊植麟個(gè)人谷歌學(xué)術(shù)界面 圖源:AI科技評(píng)論公眾號(hào)
此外,團(tuán)隊(duì)的聯(lián)合創(chuàng)始人周昕宇與吳育昕,均為清華大學(xué)校友。團(tuán)隊(duì)現(xiàn)已匯聚了來(lái)自CMU LTI、Google、Meta(原Facebook)、Amazon等全球頂級(jí)學(xué)術(shù)機(jī)構(gòu)及科技公司的諸多海外高層次人才。月之暗面在人工智能領(lǐng)域持有明確立場(chǎng),特別是在大語(yǔ)言模型的應(yīng)用與融合方面,楊植麟的理解獨(dú)到,堅(jiān)定走To C道路,路線也一直是產(chǎn)品驅(qū)動(dòng)。
技術(shù)優(yōu)勢(shì)上,月之暗面最為稱道的則是Kimi Chat的長(zhǎng)文本基礎(chǔ)技術(shù)能力。11月,Kimi Chat宣布全面對(duì)外開放,不再限制內(nèi)測(cè)資格,能高效處理約20萬(wàn)漢字的上下文。楊植麟曾在演講中表示,規(guī)模化是通向AGI的核心,而隨著模型不斷迭代,長(zhǎng)文本會(huì)逐漸取代微調(diào),成為定制模型的關(guān)鍵技術(shù)。但通過滑動(dòng)窗口、降采樣、小模型等技術(shù)捷徑實(shí)現(xiàn)上下文窗口延長(zhǎng),都是“技術(shù)捷徑”。目前符合大模型技術(shù)原理的做法是通過對(duì)數(shù)據(jù)的無(wú)損壓縮,以真正提升模型能力。
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn