M4 MacBook Pro 性能实测:24GB 内存挑战本地 AI 极限随着苹果 M4 芯片的普及,如何在不依赖云端算力的情况下,在本地顺畅运行大语言模型(LLM)成为了开发者关注的焦点。近日,开发者 jola 分享了其在 24GB 内存版本的 M4 MacBook Pro 上部署本地 AI 工作流的深度实践。测试结果显示,经过优化的 Qwen 3.5 9B 模型能够跑出每秒 40 tokens 的生成速度,为离线办公与私密开…