首页 > 百科 > 

英特尔发布Project Battlematrix推理工作站软件更新

2025-08-26 09:06:42   来源:兵不污刃网

英特尔发布Project Battlematrix(战斗阵列)推理工作站软件更新,英特并计划在第三季度末发布功能更全面的推理强化版LLM Scaler。

今年5月,工作英特尔发布了代号为Project Battlematrix(战斗阵列)的站软推理工作站。推理工作站具有广阔的英特发展前景,主要表现在:一是推理安全部署,数据可在本地进行处理;二是工作易于设置,将所有软件置于容器中,站软提供一站式解决方案;三是英特易扩展,可灵活配置不同数量的推理显卡;四是在成本效益上具有显著优势。Project Battlematrix推理工作站最多可支持八块英特尔锐炫 Pro B60 24GB GPU,工作提供高达192GB的站软VRAM,运行高达1500亿参数的英特中等规模且精度高的AI模型。

英特尔采用容器化方案来帮助客户解决软件部署的复杂性问题。在容器内部,工作对大语言模型进行了大量的优化,包括Linux软件栈的支持、验证以及分阶段的软件发布。基于全新的推理优化软件栈,Project Battlematrix还能够简化英特尔锐炫Pro B系列GPU的部署,加速英特尔GPU和AI战略的落实。

全新的软件栈在设计时充分考虑了易用性和行业标准,是专为Linux环境构建的容器化解决方案。经过优化,该方案能够借助多GPU扩展和PCIe P2P数据传输,带来卓越的推理性能。与此同时,该方案还具备企业级的可靠性和可管理性,如ECC、SRIOV、遥测和远程固件更新等。

LLM Scaler容器1.0版本对于前期客户支持至关重要,英特尔进行了以下更新:

vLLM:

·针对长输入长度(>4K)的TPOP性能优化:在32B KPI模型上,40K序列长度的性能提升高达1.8倍;在70B KPI模型上,40K序列长度的性能提升高达4.2倍

·与上一版本相比,8B-32B KPI模型的输出吞吐量性能优化约10%

·逐层在线量化,减少所需的GPU内存

·支持vLLM中的PP(流水线并行)(实验性)

·支持torch.compile(实验性)

·推测解码(实验性)

·支持嵌入和重排序模型

·增强的多模态模型支持

·最大长度自动检测

·数据并行支持

OneCCL基准测试工具支持

XPU Manager:

·GPU功耗

·GPU固件更新

·GPU诊断

·GPU内存带宽

英特尔表示此版本将按照5月初发布时公开的时间表顺利交付,并计划在第三季度末发布功能更全面的强化版LLM Scaler,同时积极争取在第四季度发布完整版本。

  文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

时尚

郑北大桥来啦!郑州将建一座斜拉桥跨越火车北站

郑北大桥来啦!郑州将建一座斜拉桥跨越火车北站发布时间:2017-05-04 11:15 来源:豫都网 我来说说 我要投稿[摘要]郑州农业路快速通道工程东段和西段的主线桥已经基本施工完成,中段的涉铁路段

焦点

电脑显示器表面玻璃材质 液晶玻璃是什么新型玻璃,行业资讯

玻璃是目前使用较广泛、应用范围较广的无机非金属材料,能够应用于建筑、日用、艺术、仪表等领域,种类十分丰富。除了常用的钢化玻璃、印花玻璃以外,还有光学玻璃、调光玻璃等对技术要求较高的类型。本篇文

娱乐

国网汉阴县供电公司:高效检修消缺 备战迎峰度冬

“一定要知晓各自任务和危险点,做好每一项安全措施……”10月30日,国网汉阴县供电公司对122铜钱线双河支线开展隐患消缺,现场工作负责人反复叮嘱杆上作业人员注意每一个安全细节,确保消缺工作安全高效推进

百科

引领全球木居 宜华家居致力提升中国品质

引领全球木居,宜华家居致力提升中国品质一直以来,木制家居都以健康、环保、品味不俗的形象深入人心,在木文化盛行的中国,一贯不乏木家居爱好者。近年来,随着经济发展、国力腾飞,市场的消费力逐年递增,更多消费