kaiyun sports 英伟达已适配 DeepSeek
发布日期:2026-05-01 04:21 点击次数:108

IT之家4 月 25 日音书,英伟达今天(4 月 25 日)发布博文,秘书其 NVIDIA Blackwell 平台已适配 DeepSeek-V4-Pro 与 DeepSeek-V4-Flash 两款模子,开发者可通过 NVIDIA NIM 微办事下载部署,或足下 SGLang 与 vLLM 框架进行定制化推理。
英伟达在博文指出,DeepSeek-V4-Pro 领有 1.6T 总参数目与 49B 激活参数,定位高档推理任务;DeepSeek-V4-Flash 版块则为 284B 总参数目与 13B 激活参数,主打高速高效场景。
两款模子均撑合手 100 万 Token 高下文窗口与最高 38.4 万 Token 输出长度,遮蔽长文本编码、文档分析等中枢应用,开云sports并收受 MIT 开源契约。
实测数据泄露,DeepSeek-V4-Pro 在 NVIDIA GB200 NVL72 上开箱即用性能超 150 tokens / sec / user,借助 vLLM 的 Day 0 配方,开发者可在 Blackwell B300 上快速部署。跟着 Dynamo、NVFP4 及 CUDA 内核的深度优化,预期性能将进一步扶持。
伸开剩余30%部署生态方面,开发者可通过 NVIDIA NIM 微办事下载部署,或足下 SGLang 与 vLLM 框架进行定制化推理。SGLang 提供低蔓延、平衡及最大浑沌量三种配方;vLLM 则撑合手多节点膨大至 100 个以上 GPU,具备用具调用与估计解码智力。
起原:IT之家kaiyun sports
发布于:北京市开云app官方在线入口