京东云推出 vGPU 池化方案,可令“大模型推理大幅降本”
2023-08-18 20:57:48来源:IT之家
【资料图】
IT之家 8 月 15 日消息,据京东云官方公众号报道,京东云日前推出 vGPU 池化方案,官方表示,“该方案可提供一站式 GPU 算力池化能力,令 GPU 利用率最高提升 70%,大幅降低大模型推理成本”。
▲ 图源 京东云 官方公众号
京东云表示,凭借其“自主研发的混合多云操作系统云舰”,京东云在原有支持混合多云 CPU 算力池化能力基础上,针对大模型训练所需的泛算力池化能力,进一步增加了针对 AI 应用所需的调度管理能力,包括卡管理、节点管理、异构资源调度管理等,为包括大模型训练在内的多种 AI 应用,提供一站式算力池化解决方案,从而全面提升资源利用率。
京东云同时称,自家池化方案具有四大优势,IT之家转录相关内容如下:
算力切分灵活:支持任意比例切分和动态调整机制,可实现按显卡算力、显存做细粒度切分,一张物理卡可供多个容器使用,与整卡算力相比,性能衰减在 2% 以内。 精细化配额管理:支持灵活的配额管理,按显卡型号 / label 配额,有效保障资源按需分配,提升推理稳定性和训练性能。 多场景适配:适配主流 CUDA 版本和不同 GPU 芯片适配,支持 TensorFlows、Pytorch 等行业主流的 AI 训练框架。 多节点管理:支持节点虚拟分组和节点组指定应用使用,全面提升大模型训练效率。
京东云表示,在使用场景中,开发者可以根据卡型号申请资源,按算力和显存切分,统一由控制器根据用户指定的调度策略调整。仅在训练、微调和推理任务启动时进行动态分配,在任务结束即可以释放,支持多任务算力隔离和任务冷启动。
从实践效果看,通过 GPU 异构资源池化,AI 运行效率显著提高,整体 GPU 利用率提升 70%。结合任意切分和按需分配,在同等 GPU 数量的前提下,实现了数倍业务量扩展和资源共享,降低了硬件采购成本,使用更少的 AI 芯片支撑了更多的训练和推理任务。
相关新闻
- 京东云推出 vGPU 池化方案,可令“大模型推理大幅降本”
- 8684火车app(8684火车)
- 凌晨突发!贵州黎平肇兴镇一客栈发生火灾9人遇难
- 方创琳:下活长江经济带发展一盘棋
- 爱美客08月17日获深股通增持5.52万股
- 8月18日生意社醋酸基准价为3816.67元/吨
- 各级领导一线巡诊 衡阳以高质量调研服务推动高质量发展
- 西北地区首个光储氢热综合应用示范项目建成
- [快讯]百丞税务公布2023年半年度分红方案预案
- 美国30年期抵押贷款利率升至7.09% 达2002年以来最高水平
- 上海白银现货今日价格(2023年8月18日)
- 今日趣图:4场决赛0进球的世界第一中锋,出列!!
- 探索“渔商旅”融合新业态 珠海洪湾中心渔港打造“开渔节”消费新场景
- 2023年服贸会金融服务专题活动将于9月举行
- 出境游订单已排至“十一”黄金周 相关上市公司抢抓机遇推新品
- 浙江世宝AH股齐涨 马斯克日前称下周直播新版FSD自动驾驶
- 香港医生是如何做到“不敢腐,不能腐,不想腐”?
- 培育好乡土人才“金种子”
- 8月18日独家药品板块跌幅达2%
- 认知障碍数字疗法,是“灵药”还是数字版的“保健品”?