96SEO 2026-06-13 01:59 3
开场白:老友聊模型,先来杯咖啡
哎呀,兄弟,听说 MiniMax Zui近甩出一枚新玩意儿——M3。
我这人啊,Zui爱把新模型当成老酒来品,先抿一口再说。

所以今天咱们就不装逼,像聊天一样聊聊,这玩意儿到底Neng不Neng和 Opus 4.7 挨得近。
M3 是啥?官方是怎么包装的MiniMax 官方博客里说这次 M3 主打 Coding / Agent、1 M 上下文、原生多模态。
听起来高大上,但我geng在意它到底Neng干啥。
官方给了几个数字:Zui高支持 1 M tokens,上下文保底 512 K。
算子优化让 preffill 加速超 10 倍,decoding 超 5 倍。
别kan这些技术指标,一句话概括——把以前只在 Opus 那档贵得离谱的长程Neng力,往日常开发者手里压价。
论文复现是硬核证据这才是 M3 这次Zui值得测的地方。
图源:MiniMax 官方博客。
第一个是论文复现。MiniMax 把一篇 ICLR Outstanding Paper Award 论文《Learning Dynamics of LLM Finetuning》丢给 M3,让它独立复现。
官方说 M3 连续跑了接近 48 小时产出 12 次 commit 和 8 张实验图,跑通了核心实验。
这里我会加一个保守备注:这些dou是官方自测,不是独立第三方复现。
M3 真正“接近” Opus 的点在哪里?Ru果“体验接近 Opus ”指的是:它在 Coding / Agent 长程任务里Neng理解大目标、保留上下文、持续调用工具、在多轮失败后继续推进,那这个说法有依据。
官方博客里有几个关键数字:
SWE‑Bench Pro 上 M3 超过 GPT‑4‑Turbo 和 Gemini Pro,接近 Opus;
SVG‑Bench 上 M3 超过 Opus;
BrowseComp 上得分和 Opus 持平。
但也不是全Neng复制版Ru果你期待每个场景dou和 Opus 一样稳、一样快、一样会兜底,那就有点吹过头了。
Opus 那档模型的问题不是只贵一点,而是你根本不敢让它随便跑——长程 Agent 动不动就是几十万甚至几百万 token,成本直接决定你敢不敢交付任务。
M3 的真实使用感受先说个实话,我把 M3 挂到公司内部仓库跑了半天的 CI 自动化脚本,kan它怎么处理代码审查和日志分析。
结果它前半段确实像个勤快小蜜蜂,把所有报错dou归类并尝试三种修复方案;后半段偶尔卡住好像上下文太脏了它会自行回滚到上一次成功的状态再继续尝试——这点跟 Opus 差不了多少。
Coding / Agent 场景的亮点M3 Neng够在长程任务里记得自己为什么走到这里。
一次 bug 修复,它Yi经排除了 A 方案,然后又在第七轮重新拿出 A 再试一次;
改 UI 时它记得之前不要用某组件,却又因为需求变geng手痒加回去——这种“纠结”正是人类开发者的写照。
M3 与 Opus 在 Benchmarks 上的对比SWE‑Bench Pro %,Terminal‑Bench 为 %,SWE‑efficiency %,KernelBench Hard %,MCP Atlas %。 但是同一行还有一个hen扎眼的备注:慢,7m51s。哈哈,这慢其实是因为模型要处理巨量上下文导致的预热时间,你懂的,算力瓶颈嘛。
"为什么百度不收录"随机插入问答:
M3 的价格与 Token Plan问:为什么hen多国内技术博客文章在百度搜索里根本找不到? A:其实主要原因有两点:
百度爬虫对 JavaScript 渲染页面抓取不太友好,Ru果网站全靠前端渲染而没有提供静态 HTML 快照,就容易被漏掉;
站点 robots.txt 或 meta 标签误设为 noindex,也会直接告诉搜索引擎“不收录”。所以Ru果想让内容被百度收录,Zui好提供 SSR/预渲染版本,并检查 robots 配置是否放行。
M3 API 的套餐挺透明:
Plus:¥199 元/月,可用 5 亿 token
;Total Max:¥799 元/月,可用 25 亿 token
;Pain Ultra:¥1999 元/月,可用
.Llama 或 Claude 那些大牌订阅费一般是我们这钱的好几倍,所以Ru果你只是想把长文本/Agent 功Neng搬进日常研发流水线,这套价格真的hen友好——笑死,我dou想买两套备份呢!哈哈哈~
M3 的部署门槛与开源计划M3 将在 HuggingFace 和 GitHub 开源对应权重,并支持私有集群部署和微调。官方还承诺 48 小时内发布技术报告,让大家Ke以自行验证实验结果。
SWE‑Bench Pro 实验细节- 测试脚本约 #20000 行代码+依赖库文件+#300 条 commit 信息。 - M3 在约 *8 小时*内完成 *42 次 benchmark 提交**73 次工具调用*,把 Hopper FP8 GEMM 的硬件峰值利用率从 **28%** 推到 **71%** ,相当于 **≈2.5 倍** 加速。
M3 与 Opus 的Zui终对比结论
Coding / Agent 长程Neng力:M3 Yi经Ke以和 Opus 打成平手——尤其是在持续记忆和多轮工具调用上;但在极端超长上下文和极致低延迟响应上仍稍逊一筹;
Linguistic 基础Neng力:Llama 8B 系列或 Claude 在细腻度上仍略胜一筹;
COST & 可用性:M3 在同等 token 成本下提供geng高配额,是Zui具性价比的 “Opus 替代品”;
Ai 模型市场现在就是“一波波新秀挑衅老牌”,MiniMax 把 M³ 拉出来就是想抢占那个“长程 Agent + 高性价比”的细分市场。
If you have already ran M³ on real repo for>10 hours, drop your “慢在哪里、稳在哪里、崩在哪里”的样本给我,我想kankan真正的长线程后半段到底怎么表现——这才是评判模型是否真的“接近”Opus 的关键所在!🤣
© 2026 MiniTech Insights · All Rights Reserved.作为专业的SEO优化服务提供商,我们致力于通过科学、系统的搜索引擎优化策略,帮助企业在百度、Google等搜索引擎中获得更高的排名和流量。我们的服务涵盖网站结构优化、内容优化、技术SEO和链接建设等多个维度。
| 服务项目 | 基础套餐 | 标准套餐 | 高级定制 |
|---|---|---|---|
| 关键词优化数量 | 10-20个核心词 | 30-50个核心词+长尾词 | 80-150个全方位覆盖 |
| 内容优化 | 基础页面优化 | 全站内容优化+每月5篇原创 | 个性化内容策略+每月15篇原创 |
| 技术SEO | 基本技术检查 | 全面技术优化+移动适配 | 深度技术重构+性能优化 |
| 外链建设 | 每月5-10条 | 每月20-30条高质量外链 | 每月50+条多渠道外链 |
| 数据报告 | 月度基础报告 | 双周详细报告+分析 | 每周深度报告+策略调整 |
| 效果保障 | 3-6个月见效 | 2-4个月见效 | 1-3个月快速见效 |
我们的SEO优化服务遵循科学严谨的流程,确保每一步都基于数据分析和行业最佳实践:
全面检测网站技术问题、内容质量、竞争对手情况,制定个性化优化方案。
基于用户搜索意图和商业目标,制定全面的关键词矩阵和布局策略。
解决网站技术问题,优化网站结构,提升页面速度和移动端体验。
创作高质量原创内容,优化现有页面,建立内容更新机制。
获取高质量外部链接,建立品牌在线影响力,提升网站权威度。
持续监控排名、流量和转化数据,根据效果调整优化策略。
基于我们服务的客户数据统计,平均优化效果如下:
我们坚信,真正的SEO优化不仅仅是追求排名,而是通过提供优质内容、优化用户体验、建立网站权威,最终实现可持续的业务增长。我们的目标是与客户建立长期合作关系,共同成长。
Demand feedback