- 新版本支持 Llama 3.2 的 1B 模型。 该应用适合重视数据安全和私密沟通的用户。 ### 性能表现 在iPhone 15 Pro Max 上运行 Qwen2.5-3b 时,初始速度为每秒 12.49 tokens,但开启 Apple Metal GPU 加速后速度略降至每秒 11.84 tokens。同时,设备出现发热现象,这可能与高强度计算任务有关。苹果公司可能会通过...