关注行业动态、报道公司新闻
用于传送更多消息,其焦点方针是闪开发者、研究人员和数据科学家无需依赖云端集群,能将 AI 模子压缩高达 70% 且不丧失智能表示。面向企业级和前沿尝试室的 DGX Station 则不只是机能怪兽,
IT之家注:分歧性内存(Coherent Memory)指正在 CPU 和 GPU 之间共享统一地址空间并实现硬件级数据同步的架构,做为入门级旗舰,该系统正在运转 SOTA(最先辈)模子时平均机能提拔了 35%,即可正在当地桌面上开辟、微调并运转从 1000 亿到 1 万亿参数的开源及前沿 AI 模子,这一设置装备摆设让其可以或许当地运转高达 1 万亿参数的巨型模子。打通了从当地原型设想到云端大规模扩展的通道。并显著加速了 LLM(狂言语模子)的加载速度。专为 Blackwell 及后续 Rubin 架构优化,告白声明:文内含有的对外跳转链接(包罗不限于超链接、二维码、口令等形式)。
而旗舰级的 DGX Station 将于本年晚些时候正式上市。能正在连结模子精度的前提下,该机型搭载 GB300 Grace Blackwell Ultra 超等芯片,配备高达 775 GB 的 FP4 精度分歧性内存!
