星空-Day

2026-06-17 02:50:08||273次|新闻资讯

【导读】6月12日，MiniMax新一代原生多模态旗舰模子 M3正式开源。同日，摩尔线程旗舰级AI训推一体智算卡MTT S5000已经完成对于该模子的Day-0极速适配。这是国产年夜模子与国产算力芯片完成适配的又一例证，也彰显了摩尔线程依附原生FP8算力底座与高效MUSA软件生态，对于前沿年夜模子需求的即时相应与不变支撑能力。

MiniMax M3开源地址：

https://huggingface.co/MiniMaxAI/MiniMax-M3

开发者可下载镜像举行开箱体验：

registry.mthreads.com/mcconline/inference/vllm:v0.20.0-ph1-4.3.5-torch2.9-20260605-mtcc51

MiniMax M3是今朝海内独一同时具有前沿Coding Agentic能力、超长下文与原生多模态的开源年夜模子，也是第一个将完备frontier能力带入开放世界的模子。该模子基在自研MSA（MiniMax Sparse Attention）架构，可将上下文窗口扩大至1M级别，并于BrowseComp、SWE-Bench Pro等国际权势巨子评测中到达前沿程度。作为原生多模态模子，M3重构了整个数据管线，从第零步最先多模态练习，使文本及视觉语义空间高度对于齐。

图示：MiniMax M3的Coding Agentic能力于软件工程、终端履行、东西挪用等多维度权势巨子评测中到达前沿程度。

针对于MiniMax M3的焦点技能特征，MTT S5000从硬件算力、软件栈到开源框架举行了全链路精准匹配与深度优化：

支撑超长上下文：高密度算力与年夜显存提供坚实支撑。

MSA架构带来的超长上下文窗口，对于推理阶段的KV Cache存储及访存带宽提出了极高要求。MTT S5000依附硬件级原生FP8加快，单卡AI算力（浓厚）高达1000 TFLOPS；同时配备80GB年夜容量显存与1.6TB/s的超高带宽，为百万token级长序列提供足够的缓存空间与卓着的数据吞吐能力。此外，依托MUSA C++与Triton-MUSA等抽象层，M3的新算子布局可实现快速迁徙，确保摩尔线程平台可以或许快速完成架构适配。

赋能前沿Coding与Agentic能力：实现低延迟、高吞吐的推理优化。

面向M3重点强化的编程与智能体场景，摩尔线程基在此前对于DeepSeek-V四、MiniMax M2.七、GLM-5.1等多款国产旗舰模子的Day-0适配经验，已经形成一套高效、体系化的繁杂推理使命优化要领论。本次适配经由过程原生算子定制，于保障模子精度无损的条件下，显著晋升推理吞吐、降低相应延迟；同时，摩尔线程完成为了vLLM与SGLang两年夜主流推理框架的同步拉起，以MUSA开放架构拥抱开源生态，为开发者提供矫捷多样的部署选择。

鞭策原生多模态推理：笼罩全精度与领悟全场景。

M3作为从Step 0即举行多模态混淆练习的模子更适配当下Agentic AI多元场景的需求，同时这也要求算力底座具有多元化算力。MTT S5000智算卡笼罩从FP8至FP64全计较精度，可无缝适配从模子研发到贸易化落地的完备链路，助力国产旗舰年夜模子快速完成生态普和。

跟着MiniMax M3于MTT S5000上完成适配，开发者此刻便可基在MUSA软件栈与vLLM/SGLang双框架完成部署，并连续得到算子级机能优化。依托MUSA架构对于主流AI生态的深度兼容与连续演进，摩尔线程已经具有笼罩前沿模子“适配—部署—优化”的完备工程能力，帮忙开发者以更快相应、更稳运行、更低迁徙成本接入最新模子能力，加快年夜模子立异落地与范围化运用。

-星空

文章推荐

高校模拟法庭智慧教室系统解决方案

解锁成都知识产权保护中心信息化建设升级密码

可视化运维管理平台：分布式系统运维利器

xingkong.com科技助力朝阳钢铁指挥中心全面升级

携手并进共创辉煌 | xingkong.com科技八周年生日快乐

xingkong.com科技知识产权保护中心审理庭解决方案：助力知识产权保护中心信息化建设

上一篇：没有了！

下一篇：xingkong.com科技车载机动指挥解决方案