MiniMax 大模型“叫错人名” 稀宇科技:特定词元后训练不足导致近日,稀宇科技(MiniMax)发布了一份技术报告,详细剖析了其 M2系列模型为何无法准确输出“马嘉祺”等特定人名的深层原因。这起看似偶然的错误,实际上揭示了当前大模型训练中普遍存在的一个隐蔽缺陷。 词元偏移:被“挤压”的向量空间 问题的核心源于大模型处理文本的基本单位——分词器(Tokenizer)。以“马嘉祺”为例,该名字在模型内部被切分为“马”和“嘉…