M4 MacBook Pro 性能实测：24GB 内存挑战本地 AI 极限

随着苹果 M4 芯片的普及，如何在不依赖云端算力的情况下，在本地顺畅运行大语言模型（LLM）成为了开发者关注的焦点。近日，开发者 jola 分享了其在 24GB 内存版本的 M4 MacBook Pro 上部署本地 AI 工作流的深度实践。测试结果显示，经过优化的 Qwen 3.5 9B 模型能够跑出每秒 40 tokens 的生成速度，为离线办公与私密开…