京東云推出vGPU池化方案

柏納

2023-08-15 20:39

8月15日消息，京東云全新發(fā)布vGPU池化方案，提供一站式GPU算力池化解決方案，GPU利用率最高提升70%，大幅降低大模型推理成本。

京東云自主研發(fā)的混合多云操作系統(tǒng)云艦，在原有支持混合多云CPU算力池化能力基礎(chǔ)上，針對(duì)大模型訓(xùn)練所需的泛算力池化能力，進(jìn)一步增加了針對(duì)AI應(yīng)用所需的調(diào)度管理能力，包括卡管理、節(jié)點(diǎn)管理、異構(gòu)資源調(diào)度管理等，為包括大模型訓(xùn)練在內(nèi)的多種AI應(yīng)用，提供一站式算力池化解決方案，從而全面提升資源利用率。

具體而言，包括四大核心優(yōu)勢(shì)：支持任意比例切分和動(dòng)態(tài)調(diào)整機(jī)制，可實(shí)現(xiàn)按顯卡算力、顯存做細(xì)粒度切分，一張物理卡可供多個(gè)容器使用，與整卡算力相比，性能衰減在2%以內(nèi)；支持靈活的配額管理，按顯卡型號(hào)/label 配額，有效保障資源按需分配，提升推理穩(wěn)定性和訓(xùn)練性能；適配主流CUDA版本和不同GPU芯片適配，支持TensorFlows、Pytorch等行業(yè)主流的AI訓(xùn)練框架；支持節(jié)點(diǎn)虛擬分組和節(jié)點(diǎn)組指定應(yīng)用使用，全面提升大模型訓(xùn)練效率。

format-jpg

截自京東云公眾號(hào)

針對(duì)使用大模型算力的成本和效率問(wèn)題，京東云vGPU池化解決方案，支持本地+遠(yuǎn)端的GPU資源調(diào)用，基于多活能力提升訓(xùn)練任務(wù)可靠性，并與現(xiàn)有云平臺(tái)打通，實(shí)現(xiàn)CPU、GPU云算網(wǎng)協(xié)同，并在京東自身大模型場(chǎng)景進(jìn)行打磨，大幅降低大模型推理成本。

在使用場(chǎng)景中，開(kāi)發(fā)者可以根據(jù)卡型號(hào)申請(qǐng)資源，按算力和顯存切分，統(tǒng)一由控制器根據(jù)用戶指定的調(diào)度策略調(diào)整。僅在訓(xùn)練、微調(diào)和推理任務(wù)啟動(dòng)時(shí)進(jìn)行動(dòng)態(tài)分配，在任務(wù)結(jié)束即可以釋放，支持多任務(wù)算力隔離和任務(wù)冷啟動(dòng)。

從實(shí)踐效果看，通過(guò)GPU異構(gòu)資源池化，AI運(yùn)行效率顯著提高，整體GPU利用率提升70%。結(jié)合任意切分和按需分配，在同等GPU數(shù)量的前提下，實(shí)現(xiàn)了數(shù)倍業(yè)務(wù)量擴(kuò)展和資源共享，降低了硬件采購(gòu)成本，使用更少的AI芯片支撐了更多的訓(xùn)練和推理任務(wù)。

format-jpg

圖源：京東云公眾號(hào)

據(jù)悉，在7月13日舉行的2023京東全球科技探索者大會(huì)暨京東云峰會(huì)上，京東全面推出言犀大模型、言犀AI開(kāi)發(fā)計(jì)算平臺(tái)、升級(jí)支撐大模型落地行業(yè)的產(chǎn)品及解決方案。據(jù)介紹，京東大模型“源于產(chǎn)業(yè)、服務(wù)產(chǎn)業(yè)”，融合70%通用數(shù)據(jù)與30%數(shù)智供應(yīng)鏈原生數(shù)據(jù)，具有“更高產(chǎn)業(yè)屬性、更強(qiáng)泛化能力、更多安全保障”的優(yōu)勢(shì)，致力于深入零售、物流、金融、健康、政務(wù)等知識(shí)密集型、任務(wù)型產(chǎn)業(yè)場(chǎng)景，解決真實(shí)產(chǎn)業(yè)問(wèn)題。

京東制定了大模型“三步走”的明確規(guī)劃。目前，京東云已經(jīng)基于內(nèi)部實(shí)踐構(gòu)建了通用大模型；到今年年底這段時(shí)間，京東將經(jīng)由高復(fù)雜場(chǎng)景大規(guī)模錘煉，迭代出扎實(shí)的產(chǎn)業(yè)服務(wù)；預(yù)計(jì)在2024年初，會(huì)將大模型能力向外部嚴(yán)肅商業(yè)場(chǎng)景開(kāi)放。

format-jpg

圖源：京東云公眾號(hào)

京東云京東云vGPU池化方案京東云降低推理成本

聲明

1、該內(nèi)容為作者獨(dú)立觀點(diǎn)，不代表電商派觀點(diǎn)或立場(chǎng)，文章為作者本人上傳，版權(quán)歸原作者所有，未經(jīng)允許不得轉(zhuǎn)載。
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù)，如發(fā)現(xiàn)文章、圖片等侵權(quán)行為，侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴，請(qǐng)聯(lián)系：info@dsb.cn

相關(guān)閱讀

京東云推出vGPU池化方案降低大模型推理成本

2023-08-15 20:42:13

8月15日消息，京東云宣布，全新發(fā)布vGPU池化方案，提供一站式GPU算力池化解決方案，GPU利用率最高提升70%，大幅降低大模型推理成本。

京東云（中原）算力中心上線DeepSeek-R1

2025-02-13 11:51:33

2月13日消息，為了更好地為金融、企業(yè)、政府等客戶提供數(shù)據(jù)不出域的私有化模型推理服務(wù)，在京東云（中原）算力中心已經(jīng)上線的業(yè)界領(lǐng)先的vGPU AI算力平臺(tái)的基礎(chǔ)上，實(shí)現(xiàn)本地化部署DeepSeek，使用戶不會(huì)受主站流量限制和美國(guó)封鎖，實(shí)現(xiàn)客戶數(shù)據(jù)私有化不出域，滿足企業(yè)級(jí)場(chǎng)景使用。

京東服務(wù)+5G消息賦能一站式生活服務(wù)解決方案項(xiàng)目獲獎(jiǎng)

2023-09-28 16:19:37

京東云通信云《京東服務(wù)+5G消息賦能一站式生活服務(wù)解決方案》項(xiàng)目獲5G應(yīng)用征集大賽5G消息專題賽一等獎(jiǎng)。

京東云技術(shù)支持央視元宵晚會(huì)云上之旅紅包互動(dòng)

2023-02-06 15:33:41

今年元宵節(jié)，京東云聯(lián)合工商銀行等企業(yè)為參與元宵晚會(huì)云上之旅的用戶陸續(xù)送出微信紅包，京東云也為央視元宵晚會(huì)云上之旅提供技術(shù)支持。

京東云平臺(tái)解決方案業(yè)務(wù)2022年上半年市場(chǎng)份額達(dá)11.1%

2022-12-27 17:23:05

報(bào)告顯示，京東云平臺(tái)解決方案業(yè)務(wù)快速發(fā)展，2022年上半年市場(chǎng)份額達(dá)11.1%，同比增速達(dá)45%。

京東云江西區(qū)域服務(wù)中心正式落成

2022-08-25 17:44:21

在2022京東云城市峰會(huì)南昌站上，京東云江西區(qū)域服務(wù)中心正式落成。

京東云發(fā)布京東供應(yīng)鏈金融科技平臺(tái)

2022-05-13 14:20:39

今日，在京東云產(chǎn)業(yè)融合新品發(fā)布會(huì)-金融科技專場(chǎng)上，京東云首次發(fā)布京東供應(yīng)鏈金融科技平臺(tái)。

京東云產(chǎn)業(yè)大腦入選浙江首批行業(yè)建設(shè)試點(diǎn)

2022-05-07 20:41:40

據(jù)了解，京東云聯(lián)合浙江清華大學(xué)長(zhǎng)三角研究院打造的臺(tái)州玉環(huán)市泵閥產(chǎn)業(yè)大腦入選浙江首批行業(yè)產(chǎn)業(yè)大腦建設(shè)試點(diǎn)，位列全省產(chǎn)業(yè)前三，并獲評(píng)2021年數(shù)字經(jīng)濟(jì)系統(tǒng)優(yōu)秀細(xì)分行業(yè)產(chǎn)業(yè)大腦。京東云產(chǎn)業(yè)大腦在整體結(jié)構(gòu)設(shè)計(jì)中有針對(duì)性的設(shè)計(jì)了三大組成部分。

京東云618戰(zhàn)報(bào)：每秒用戶訪問(wèn)峰值較去年同期提升152%

2021-06-18 10:35:35

今日凌晨，京東云發(fā)布618當(dāng)日首份戰(zhàn)報(bào)。數(shù)據(jù)顯示，在今日凌晨爆發(fā)期，每秒用戶訪問(wèn)峰值較去年同期提升152%。

柏納

亚洲无码高清自拍偷拍自慰av网站,免费高清无码黄色网,欧美一级片免费在线观看,午夜毛片在线观看

京東云推出vGPU池化方案