红杉年度文章解读:生成式AI进入第二阶段,应用层价值凸显以及商业模式将重塑

  • A+
所属分类:分享

chatGPT账号

在红杉资本在最新发布的文章《Generative AI's Act O1 :The Agentic Reasoning Era Begins》中,讨论了当下生成式AI正在从以训练时计算的快思考,向以推理时计算的慢思考发展。OpenAI 的新模型 o1便是重要的标志。慢思考的到来也将会带来新的机会,行业认知的重要性被高度重视起来,过去对于AI应用以及背后的商业理解也将被刷新。

红杉年度文章解读:生成式AI进入第二阶段,应用层价值凸显以及商业模式将重塑

简单说,过去以模型服务商作为绝对主角的时代将过去,大众对通用基座模型抱着只要把它越训越大,它就能无所不能的期望,这曾一度给上层应用开发者极大的不安全感焦虑,而事实上,这两年实践下来,这一认知正在不断被纠正。应用服务商也不再是模型的wrapper,随时可能被降维打击,未来的空间大大扩展。

随着底层模型能力突破遭遇瓶颈,加上白热化的竞争,模型服务商已经不再那么吸引人,最近,有消息称国内做预训练大模型的厂商越来越多正在选择放弃基础大模型的投入,转战应用层。

下面就一起来了解红杉在文中提到的重要观点以及笔者解读。

从“快思考”到“慢思考”的转变

如果说,快思考是动物都具备的本能反应,那么快思考就是人类特有的理智活动。显然,人类期待的AI解决的不简单是快思考的问题,而更在意慢思考的能力。例如,以 AlphaGo 击败围棋大师李世石为例,AlphaGo 通过深思熟虑的策略而非简单依赖以往的经验,从而走向胜利。 过去,生成式 AI 主要依赖于快速的预训练模型进行响应,这种思维属于系统 1(快思考),简单的模式匹配和快速响应。然而,随着 o1 模型的推出,AI 开始具备更复杂的推理能力,体现为系统 2思维(慢思考)。这种思维方式强调深度思考和复杂决策,能够让 AI 在面对新问题时进行深入分析和推理,有效应对复杂问题。

红杉年度文章解读:生成式AI进入第二阶段,应用层价值凸显以及商业模式将重塑

同时,o1 发布让大家看到推理时计算(或“测试时计算”)侧的价值,它的出现带来了新的 scaling law(推理时),也给众多模型服务商新的启发,开始从卷训练计算,向卷推理计算转变,简单堆机器堆数据的资源竞争格局将带来缓解。

延伸阅读:

测试时计算vs.预训练计算:LLM进化的重大转折

OpenAI o1模型推理能力大幅提升的背后:重复采样如何提升AI推理能力

一模统管并未发生,从模型算法向领域KnowHow迈进

红杉称,过去猜测未来AI的巨大机会可能会被几家基座模型提供商所垄断,随着模型能力的不断提升,应用层开发也毫无价值和壁垒。但事实上,这两个推测都没发生,不仅模型服务商陷入了激烈的成本竞争,基础模型做应用产品成功的案例也少之又少。

红杉年度文章解读:生成式AI进入第二阶段,应用层价值凸显以及商业模式将重塑

另一方面,虽然模型能力已经从“预训练层”向“推理计算层”推进,但混乱的现实世界仍然有有大量的领域和应用特定推理,也就是行业认知,这些无法有效地编码在通用模型中。因此,还会有“定制认知架构(Custom Cognitive Architectures)”层,即代码和模型交互的流程,它接收用户输入并执行操作或生成响应,教模型如何思考。实际上就是领域应用逻辑,它是模型到落地的最后一公里。比方说,在工厂环境中,每款“机器人”产品都配备了一个定制化的认知架构,旨在模拟人类的思维方式来应对特定的任务。例如,它们能够审查拉取请求、编写并实施迁移计划,将服务从旧的后端迁移到新的后端。这些机器人会分析所有依赖项,提出必要的代码修改,添加相应的单元测试,并邀请人类进行审查。一旦获得批准,它们将在开发环境中执行所有更改,并且在所有测试通过后,才会合并这些代码。整个过程类似于人类处理任务的方式——通过一系列明确的步骤,而不是提供一个笼统的、不透明的解决方案。

转变会带来什么?

慢思考,以及领域认知将会给未来带来什么?不难想象,沿此思路将会有比原来多得多的场景被解锁,行业认知+模型的强大能力将使得AI应用层产品价值大大强化,进而颠覆原有的业务模式。

应用层价值被强化

伴随着推理能力的提升,一大批新的Agent应用程序将会诞生,这里说的新,不再是简单的模型包装,而是可能同时结合多个基础模型和复杂的认知架构的应用服务。

文章中提到了这些优秀的应用层产品:

  • Harvey:作为 AI 律师,它能够分析复杂的法律文本,辅助律师更高效地进行案件准备;
  • Glean:一款 AI 工作助手,致力于信息处理和任务优化,提高团队的工作效率;
  • Abridge:AI 医疗记录助手,通过自动化生成医疗记录,减轻了医生的负担;
  • XBOW:自动化渗透测试工具,能够为企业提供高效的网络安全测试服务。

不难发现,他们都是面向领域的,具有复杂业务流程和认知复杂度的场景的产品。在过去两年的实践来看,想要一个通用模型搞定所有事情,应用层专注做界面包装的认识被打破了。过去开发者被OpenAI等模型服务商的降维打击的压迫感以及无助感在迅速缓解,AI应用的繁荣正在发生。特别是最近cursor等产品的出现,更让大家看到了应用产品的价值。

延伸阅读:

大胆问,别尴尬,AI IDE(Cursor)可能比你想的强大(中外实际体验对比差距大【有视频】)

Cursor出彩的背后:“Prompt设计好比网页设计...”

ChatGPT逆向工程后续:用v0 Chat和Cursor重塑前端开发流程,开启AI编程新纪元

服务即软件(Service-as-a-Software),AI Native企业将涌现

不难想象,随着AI应用的不断深入到行业,能力不断强化,个体能效不断提升,这将极大地降低人力成本,对于人力密集型和知识密集型服务业市场将是巨大冲击,比如律师,会计,编辑,程序员等行业。有了AI加持,同样的事情可能会使用很少的人就能搞定,进而显著降低了企业在开发软件时所需的人力成本,提升企业的市场竞争优势。这样传统的人力外包型业务将快速被服务型AI应用所替代,外包化将更加流行。

以软件公司为例,传统提供saas服务给客户帮助解决问题,而变成了直接承包业务,从传统的“软件即服务”模式向“服务即软件”转变。这一转变将市场重心从简单的软件使用转向更复杂的工作成果,潜在市场规模可达数万亿美元,按价值付费变得不再是口号。

红杉年度文章解读:生成式AI进入第二阶段,应用层价值凸显以及商业模式将重塑

人机协作正在从AI辅助,到AI in loop,再到human in loop,再到AGI这一进程快速迈进。这在我之前的文章《Dify构建全AI雇员的BPO公司示例,揭示AI Native公司的创建方法》中也有介绍,某种意义上讲,或许我们苦苦寻找的AI Native产品并不存在,而Ai Native的企业将比比皆是。未来的外包市场或将是最为火爆的行业之一。

投资重点

红杉年度文章解读:生成式AI进入第二阶段,应用层价值凸显以及商业模式将重塑

最后,红杉指明了受投资者喜欢的新方向,那就是应用层产品,他们表示,企业业务在云计算过渡期间,大约有 20 家应用层公司创造了 10 亿美元以上的收入,而在移动过渡期间,又有大约 20 家公司创造了类似的成就。那么,企业AINative化可能也将来如此大的规模效应,甚至更大。

点此原文:https://www.sequoiacap.com/article/generative-ais-act-o1/

近期原创文章:

  • 为什么LLM无法真正推理?OpenAI的o1也无法改变这一事实 原创
  • 克制大模型怪脾气的新招——基于意图的提示校准降低LLM提示敏感度问题,让大模型表现更稳定 原创
  • Anthropic提出Contextual Retrieval让RAG再进化,大幅降低检索失败率 原创
  • 测试时计算vs.预训练计算:LLM进化的重大转折 原创
  • AI"破解"AI:来自Claude协助的OpenAI o1模型架构图
  • OpenAI o1模型推理能力大幅提升的背后:重复采样如何提升AI推理能力
  • OpenAI前研究科学家开源面向未来的提示工程库 ell,重新定义提示工程
  • 揭秘MemoRAG:AI记忆模块如何提升生成质量
免责声明

免责声明:

本文不代表知点网立场,且不构成投资建议,请谨慎对待。用户由此造成的损失由用户自行承担,与知点网没有任何关系;

知点网不对网站所发布内容的准确性,真实性等任何方面做任何形式的承诺和保障;

网站内所有涉及到的区块链(衍生)项目,知点网对项目的真实性,准确性等任何方面均不做任何形式的承诺和保障;

网站内所有涉及到的区块链(衍生)项目,知点网不对其构成任何投资建议,用户由此造成的损失由用户自行承担,与知点网没有任何关系;

知点区块链研究院声明:知点区块链研究院内容由知点网发布,部分来源于互联网和行业分析师投稿收录,内容为知点区块链研究院加盟专职分析师独立观点,不代表知点网立场。

  • 我的微信
  • 这是我的微信扫一扫
  • weinxin
  • 我的电报
  • 这是我的电报扫一扫
  • weinxin
chatGPT账号
知点

发表评论

您必须登录才能发表评论!