英国程序员西蒙·威利森(Simon Willison)最近两年非常出名,他的个人网站 有很多文章,介绍 AI 的最新进展。 本周,他发表了很长一篇的 2024年大模型回顾(非官方的 中译),非常精彩。
- 这些基础设施有必要吗?DeepSeek v3 的 600 万美元训练成本和 LLM 价格的持续暴跌可能暗示了这一点
- 苹果的 mlx-lm Python 支持在我的 Mac 上运行各种 MLX 兼容的模型,性能非常出色。Hugging Face 上的 mlx-community 提供了超过 1000 个已转换为必要格式的模型。
- Prince Canuma 开发的优秀且发展迅速的 mlx-vlm 项目也把视觉大语言模型带到了 Apple Silicon 上。我最近用它运行了 Qwen 的 QvQ。
- llama.cpp 生态系统在这方面帮了大忙,但真正的突破是苹果的 MLX 库,这是一个「专为 Apple Silicon 设计的数组框架」。它真的很棒。
- ChatGPT 的语音模式现在让你可以直接和模型分享摄像头画面,实时聊聊你看到的东西
- 2024 年的另一个关键趋势:多模态 LLM 正在兴起