← 返回未来思考

从应用开发者视角回顾2023年LLM的真实表现

最近,OpenAI发布了Sora,进一步推动了人们对大语言模型(LLM)的关注。作为一名深度参与LLM工作一年的产品经理,我将在LLM的大背景下分享我的实际工作经验。

1. LLM已成为科技巨头的"政治正确"标配

继社交网络、移动互联网、区块链和元宇宙之后,2023年再次被誉为第四次工业革命——AI时代的元年。各大科技公司在传统概念之外发现了新的机遇,并展开了激烈的竞争。OpenAI、微软、谷歌和Meta正以清晰的战略快速推进。与以往不同的是,中国的大型互联网公司由于算力有限和应用场景不明确,目前对下一步行动持谨慎和观望态度。

2. 老板们经历着爱、恐惧和无奈

老板和CIO们也被自媒体疯狂洗脑。尽管大多数产品决策者并不了解大模型的运作方式,他们仍然决定在内部和外部率先实施大模型,抢在他人之前。在将ChatGPT包装成自己的助手后,他们发现内部企业信息不仅被发送到公司外部,甚至发送到了国外,从而引发了法律风险。而且迟缓的交互体验几乎无法使用。

3. 全球最大的科技巨头都在复制ChatGPT

自从ChatGPT开创了对话+提示词的交互模式以来,科技巨头们几乎完全照搬了其智能助手的模式。API、多模态应用和应用商店紧随其后。虽然OpenAI的下一个突破性功能尚不可知,但有一点是确定的:所有人都在急切地等待跟进。

4. 这可能是"皇帝的新衣"

无论是在社交媒体、行业论坛还是产品发布会上,许多人声称大模型已经为他们的产品注入了新的活力,甚至为数千家企业孵化了行业专用模型。然而,没有人敢承认这些大模型在专业领域往往缺乏理解力,有很多任务它们无法完成。大模型获取专业或特定领域知识往往需要付出巨大的代价。

5. 媒体兴奋不已,产品经理、程序员和业务专家却都很沮丧

大约90%的时间被数据相关任务所消耗,包括收集、编写、清洗、格式化、切片、训练和标注。这个过程日复一日、周复一周、月复一月地持续着。生产研发团队常常对信息的准确性感到不确定。业务专家不确定如何训练模型。产品经理在思考如何促进业务专家与LLM之间的直接沟通。这个过程的终点对每个人来说都不明朗。

6. 迅速成为云平台的新增长点

传统云平台提供商基于机器学习推出了LLM训练平台。继MLOps之后,LLMOps的概念应运而生。尽管面临技术和算力方面的挑战,云平台正在将LLM转变为下一代基础设施。然而,其设计往往被认为粗糙,业务专家难以直接使用。看起来云服务产品经理尚未完全理解用户将如何利用LLM的能力。

7. 逐渐从前台转向后台,以业务为核心

经过半年的高强度努力,我逐渐意识到大模型本身无法完成所有事情。以大模型为主要方法构建业务流程,无法及时、经济地满足业务需求并提供可靠的投资回报。许多产品经理现在离线使用大模型来辅助异步知识和数据处理。为了让这些模型有效地学习和组合新形式的知识,我们给这种包含业务逻辑的代码片段起了一个新名字——Agent。

8. 行业开始定义下一代应用的新形态

想象一个未来,人们不再需要决定使用哪个网站或应用程序。相反,他们只需告诉AI自己的意图,AI就会直接找到答案或执行操作。这种交互式AI可能代表着下一代应用形态。目前,许多产品经理将其设计为聊天机器人,有时称为智能助手。然而遗憾的是,即使有多个助手,用户仍然需要做出决策或进行搜索。

9. 监管来得比以往更早

意见领袖宣称:"如果你将来不使用AI,你就是失败者",并很快通过提供课程来获利。OpenAI进一步展示了数百万个新"应用"或Agent可以在短短一周内涌现。因此,大量敏感数据正在被上传到全球各地的数据中心,导致相互冲突的价值观不受约束地混合在一起。没有任何其他产品类型能如此迅速地引起政府的关注。

10. AI已从技术神坛走下,变得普通人也能触及

训练AI曾经是算法工程师的专属领域。然而,在模型部署之后,现在需要业务专家和用户更多地参与训练过程。借助提示词生成工具和训练平台,你可以在没有任何算法知识的情况下完成模型训练。即使是小规模模型也可以轻松部署到服务器或个人电脑上,就像安装软件一样。这是一个重大转变,让算法工程师感到不安。