从应用开发者视角回顾2023年LLM的真实表现

2024年2月17日·Jah Guo

最近，OpenAI发布了Sora，进一步推动了人们对大语言模型（LLM）的关注。作为一名深度参与LLM工作一年的产品经理，我将在LLM的大背景下分享我的实际工作经验。

1. LLM已成为科技巨头的"政治正确"标配

继社交网络、移动互联网、区块链和元宇宙之后，2023年再次被誉为第四次工业革命——AI时代的元年。各大科技公司在传统概念之外发现了新的机遇，并展开了激烈的竞争。OpenAI、微软、谷歌和Meta正以清晰的战略快速推进。与以往不同的是，中国的大型互联网公司由于算力有限和应用场景不明确，目前对下一步行动持谨慎和观望态度。

2. 老板们经历着爱、恐惧和无奈

老板和CIO们也被自媒体疯狂洗脑。尽管大多数产品决策者并不了解大模型的运作方式，他们仍然决定在内部和外部率先实施大模型，抢在他人之前。在将ChatGPT包装成自己的助手后，他们发现内部企业信息不仅被发送到公司外部，甚至发送到了国外，从而引发了法律风险。而且迟缓的交互体验几乎无法使用。

3. 全球最大的科技巨头都在复制ChatGPT

自从ChatGPT开创了对话+提示词的交互模式以来，科技巨头们几乎完全照搬了其智能助手的模式。API、多模态应用和应用商店紧随其后。虽然OpenAI的下一个突破性功能尚不可知，但有一点是确定的：所有人都在急切地等待跟进。

4. 这可能是"皇帝的新衣"

无论是在社交媒体、行业论坛还是产品发布会上，许多人声称大模型已经为他们的产品注入了新的活力，甚至为数千家企业孵化了行业专用模型。然而，没有人敢承认这些大模型在专业领域往往缺乏理解力，有很多任务它们无法完成。大模型获取专业或特定领域知识往往需要付出巨大的代价。

5. 媒体兴奋不已，产品经理、程序员和业务专家却都很沮丧

大约90%的时间被数据相关任务所消耗，包括收集、编写、清洗、格式化、切片、训练和标注。这个过程日复一日、周复一周、月复一月地持续着。生产研发团队常常对信息的准确性感到不确定。业务专家不确定如何训练模型。产品经理在思考如何促进业务专家与LLM之间的直接沟通。这个过程的终点对每个人来说都不明朗。

6. 迅速成为云平台的新增长点

传统云平台提供商基于机器学习推出了LLM训练平台。继MLOps之后，LLMOps的概念应运而生。尽管面临技术和算力方面的挑战，云平台正在将LLM转变为下一代基础设施。然而，其设计往往被认为粗糙，业务专家难以直接使用。看起来云服务产品经理尚未完全理解用户将如何利用LLM的能力。

7. 逐渐从前台转向后台，以业务为核心

经过半年的高强度努力，我逐渐意识到大模型本身无法完成所有事情。以大模型为主要方法构建业务流程，无法及时、经济地满足业务需求并提供可靠的投资回报。许多产品经理现在离线使用大模型来辅助异步知识和数据处理。为了让这些模型有效地学习和组合新形式的知识，我们给这种包含业务逻辑的代码片段起了一个新名字——Agent。

8. 行业开始定义下一代应用的新形态

想象一个未来，人们不再需要决定使用哪个网站或应用程序。相反，他们只需告诉AI自己的意图，AI就会直接找到答案或执行操作。这种交互式AI可能代表着下一代应用形态。目前，许多产品经理将其设计为聊天机器人，有时称为智能助手。然而遗憾的是，即使有多个助手，用户仍然需要做出决策或进行搜索。

9. 监管来得比以往更早

意见领袖宣称："如果你将来不使用AI，你就是失败者"，并很快通过提供课程来获利。OpenAI进一步展示了数百万个新"应用"或Agent可以在短短一周内涌现。因此，大量敏感数据正在被上传到全球各地的数据中心，导致相互冲突的价值观不受约束地混合在一起。没有任何其他产品类型能如此迅速地引起政府的关注。

10. AI已从技术神坛走下，变得普通人也能触及

训练AI曾经是算法工程师的专属领域。然而，在模型部署之后，现在需要业务专家和用户更多地参与训练过程。借助提示词生成工具和训练平台，你可以在没有任何算法知识的情况下完成模型训练。即使是小规模模型也可以轻松部署到服务器或个人电脑上，就像安装软件一样。这是一个重大转变，让算法工程师感到不安。