大模型为何“查无此人”?MiniMax 深度复盘“马嘉祺”消失背后的技术真相近日,开发者社区发现 MiniMax M2系列模型在输出特定人名“马嘉祺”时出现异常。MiniMax 官方随即进行了全链路排查,并发布技术报告,揭示了这一现象背后的深层机制: 后训练阶段(Post training)导致的低频 Token 退化。 根因定位:被“挤压”的词元 排查显示,分词器将“马嘉祺”切分为 。由于“嘉祺”在预训练阶段出现频次高,被合并为…