爆米花独角兽独家编辑
前言
爆米花独角兽独家整理了 16(17)家来自全球范围内的 VC 发表关于他们对 AI 赛道投资的理解。本篇文章是几篇报告中质量最高的,因为作者搜集了 Synapse Partners 关于生成式 AI 的几乎所有文章,然后将其关于 GenAI 不同方面的观点进行归纳总结,重新完成本篇文章。
这是第十三篇《企业用 AI 要烧多少钱才回本?Synapse Partners 教你跨过生成式 AI 的 ROI 鸿沟(万字长文)》
其他圆桌系列,
《圆桌 | 德国 Cherry Venture 的 AI 投资理念》
《圆桌 | 美国 Flybridge 投资理念:人工智能的未来》
《圆桌 | 中东欧 Movens Capital 的 AI 投资理念》
《圆桌 | 印度 Pentathlon 谈 AI SaaS 的愿景》
《圆桌 | 阿联酋 Terra Nova :AI 数据需求的三个类别》
💡Synapse Partners 简介💡
Synapse Partners 是硅谷的一家风投,成立于 2016,专注于投资那些利用数据和人工智能(AI)开发企业应用程序的初创公司。其目标是与全球前瞻性的企业合作,帮助它们转型为智能公司,从而提升竞争力和市场地位。
Evangelos Simoudis是 Synapse Partners 的创始人兼管理合伙人。他在硅谷拥有超过 30 年的经验,是一位资深的风险投资者和全球企业顾问。Simoudis 在高科技行业有 20 年的工作经历,担任过运营、市场营销、销售和工程等多个高管职位。他还著有多本书籍,包括《无人驾驶未来中的大数据机会》和《运输转型》等,致力于探讨大数据和数字平台的应用
💡摘要💡
企业在应用生成式 AI 时的挑战与投资策略
随着生成式 AI 进入第四个炒作周期,企业需要警惕过度承诺与实际收益之间的差距,必须采取三项行动:制定明确的战略 ;评估和缓解风险;明智地实验和迭代。
企业在应用生成式 AI 时面临三大困难:人才短缺;数据问题;模型能力缺陷。
企业在应用 Gen AI 时,会遭遇如下成本:技术成本;合规成本;响应验证成本;用户培训成本。
在投资策略上,我们将生成式 AI 初创公司分为四类:工具开发者、基础模型开发者、内容生成器和智能体开发者。我们重点关注智能体开发公司。
💡目录💡
一、AI 正在经历第四个炒作周期
二、为什么现在是企业大规模使用生成式 AI 的前夕
三、企业在应用生成式 AI 时遇到的困难
四、企业使用生成式 AI 有哪些成本?
五、ROI 多少,企业端 GEN AI 的需求才会彻底爆发?
六、生成式 AI 的核心投资理念
01.
AI 正在经历第四个炒作周期
与过去每一个 AI 时代一样,生成式 AI 为企业带来的承诺可能会低于实际实现的收益。要想成功,企业必须避免以往 AI 时代的陷阱。凭借在企业 AI 领域 40 年的职业生涯,我了解了这些困难的类型和原因,也清楚企业在应用生成式 AI 时必须做些什么来避免重蹈覆辙。以下是我的分享。
在过去的 40 年中,在引入大语言模型(LLM)之前,AI 经过了三个时代:
●80 年代的专家系统时代,
●90 年代的机器学习时代,
●2006 年开始的深度学习时代。
●在第一个时代,我为企业开发 AI 技术。
●在第二个时代,我管理着一些提供机器学习产品的组织和初创公司。在过去的 20 年里,我一直在为创建先进企业 AI 解决方案的私人公司提供资金。生成式 AI 的炒作正在危险地增长。您正在积极试验生成式 AI,因为您将其视为提高员工生产力和降低成本的手段,例如在客户支持、营销和销售、办公运营、设计和工程等领域。但是,您必须了解前几个时代的陷阱,才能成功利用生成式 AI 的企业潜力。
每个 AI 时代都取得了重要成功。数字设备公司的 XCON 专家系统是专家系统时代的成功,HNC 的 Falcon 系统是机器学习时代的成功,DeepMind(谷歌)的 AlphaFold 是深度学习时代的成功。
然而,这些时代都伴随着炒作周期。前两个时代的炒作周期之后是多年的“冬天”,原因是未能实现承诺的收益。
未实现的原因多种多样:有些成功的原型解决了重要问题,但无法扩展到生产级系统;有些承诺的功能成本过高或根本无法开发;还有很多 AI 解决方案成功地由企业或第三方开发出来,但所解决的问题并不重要。
炒作与现实之间的不匹配有以下几个原因:
●企业被炒作所吸引,认为必须采用 AI 技术,以免错失机会,或仅仅为了向股东表明自己没有落后。与此同时,他们并未分析这些机会是否真的适合自身公司,或者哪些重要的现有问题可以通过 AI 解决。他们甚至没有评估自己是否具备有效开发、采用和部署这些解决方案的能力。企业难以将 AI 战略和投资与业务模式和流程联系起来。
●在很多情况下,解决企业具体问题所需的 AI 技术不可用,或者尚不足以应对企业业务流程的复杂性。我发现两个重要的问题往往未被提出。首先,在我的企业问题可以有效解决之前,需要实现多少 AI 创新?换句话说,开发解决方案需要破解多少个“代码”?其次,即使我愿意采用第三方 AI 解决方案,解决方案是否适合公司复杂情况?我的公司是否有能力部署此类 AI 解决方案?
●数据和模型。在机器学习和深度学习时代,大规模标记数据和模型的可用性成为关键因素。尽管大多数企业拥有数据,但数据的状态并不适合机器学习系统。许多企业致力于构建合适的数据基础设施,这些工作至今仍在进行。
●专家系统时代需要大量工程师团队,他们需要访问领域专家,这些专家对如何解决特定问题的看法常常相互矛盾。第二、三时代的系统则需要数据架构师、工程师和科学家(他们事实上可以被视为其他类型的专家)来处理数据并创建最佳模型。数据标注也需要一定的专业知识。每个时代的系统都要求企业拥有合适的人才和足够的人员。大多数公司发现很难招聘数据专家,特别是在 1995 年互联网普及后,许多专家更愿意为高科技公司和互联网初创公司工作。
●成本和其他指标。企业 AI 解决方案的开发时间通常比其他类型的企业解决方案更长。从原型扩展到企业级 AI 解决方案并进行全公司部署可能需要很长时间且成本高昂。除了开发和维护成本,还需要培训人员掌握新流程和与这些系统的交互方式。大多数时候,企业并不理解这些参数,最终得出这样的结论:此类部署需要的资源超出了其愿意或能够分配的范围。
鉴于对前几个 AI 时代中炒作与现实之间的差距有了深刻理解,在生成式 AI 项目中,企业必须采取以下三项行动:
行动 1:制定战略,明确生成式 AI 适用于哪些业务流程和重要问题,从而利用未被挖掘的价值。作为战略的一部分,确定应使用的 LLM 类型,并定义必要的架构以提供灵活性,因为这些模型的功能在迅速变化。如果需要对这些模型进行专有修改,请确保公司能够获得必要的数据,并解决可能出现的伦理、隐私、知识产权和网络安全问题。
行动 2:识别并妥善评估这些系统对企业构成的各种风险,包括技术、人员、网络安全、监管等。找出每种风险的缓解方法及每种缓解的成本。
行动 3:明智地进行实验并迭代。定义实验以测试如何解决战略中确定的每个问题。为每个实验制定对公司有意义且与战略一致的评估标准。快速迭代并淘汰无法验证的假设。为每个原型设定必须实现的里程碑,才能考虑其是否适合扩展,包括如何应对 LLM 幻觉问题,识别扩展所需的资源及资源来源(如从其他项目转移资源或分配新预算)。
AI 仍然为企业带来了巨大的价值。我们正处于一个长期趋势的早期阶段。随着生成式 AI 的炒作增加,企业在制定战略、开发和推出生成式 AI 解决方案时必须从过去的 AI 时代中汲取教训。随着技术、基础设施和数据变得普遍可用和易获取,能够理解过去经验并采取上述三项行动的企业将在新兴的生成式 AI 时代中取得成功。
02.
企业大规模使用生成式 AI 的前夕
前面我们总结了生成式 AI 新时代,企业面临的坑。尽管很难断定生成式 AI 是否将会彻底改造所有业务流程等。但是目前美国的现状是:各公司已开始分配预算并启动试点项目。
多年来,企业一直在使用 AI 来自动化各种流程。每次自动化的目标都是提高生产力、降低成本、提高效率、改善客户体验、挖掘和增加收入。例如,机器人流程自动化已用于自动化多种后台流程,以提高生产力并降低人工成本;机器学习广泛应用于网络广告中,以提高广告效果和降低成本。
IDC 于 2023 年 10 月在北美、欧洲和亚洲进行的一项商业高管调查显示,通过 AI 增强运营效率是首要目标。摩根士丹利的一项调查显示,14% 的首席信息官(CIO)将 AI 视为公司优先事项。高盛报告称,2024 年企业 IT 预算的 3% 将分配给 AI 项目,这一比例预计将在三年内翻倍。当前大多数企业的 AI 投资规模较小,但依然至关重要。
这些预测的意义在于两点。首先,它们符合企业采用云计算的模式,意味着随着 AI 应用价值的展现,预算会像云计算预算一样逐年增加。其次,我们目前正处于企业生成式 AI 采用的早期阶段。
本次 AI 浪潮是由个人在家中试验广泛应用的 AI 应用(多为聊天机器人和大语言模型)所推动,而非公司要求。当员工在个人使用中体验到 AI 技术的好处后,会推动其在企业中围绕相关用例进行应用。这种从个人到企业广泛应用的模式与电子邮件和云计算的普及相似。
然而,今年启动的试点项目要进入生产阶段还需要时间。摩根士丹利的一项调查显示,89% 的受访 CIO 预计将很快部署生成式 AI 项目,这一比例相比 2023 年第三季度的 69% 有显著增长。在这 89% 中,9% 的 CIO 已在 2023 年生产运行 AI 项目(包括生成式 AI),38% 预计在 2024 年投入生产(可能在年末),42% 则预计在 2025 年及以后。
我们公司与不同行业的合作以及收到的咨询表明,客户支持、各类市场营销任务和编程辅助在行业中占主导地位。此外,一些独特的用例如药物发现、新材料发现以及现有产品中 PFAS 化学物质的替换,也展现了生成式 AI 的独特价值。
03.
企业在应用生成式 AI 时遇到的困难
在与 portfolios 交流时,我们发现企业在使用生成式 AI 上面临的几个挑战。分别是人才短缺,企业数据短缺,模型能力缺陷
一、人才短缺
人才问题比我们最初预想的更加严重。大型科技公司的大规模招聘,以及其他行业企业未能重视并留住 AI 专家,导致企业的 AI 团队人员不足。为了填补这一空缺,企业不得不依赖外部顾问来制定策略。这种情况下,概念验证(POC)项目推进缓慢,实验数量少于计划,甚至有些项目停滞或未能完成。这意味着,许多企业将在缺乏充分信息的情况下,匆忙做出 AI 部署和预算决策。团队人手不足的情况下启动部署,增加了 AI 项目失败的风险。
企业应用生成式 AI 需要的人才需要具备三种素质:
第一,他们必须能够重新构思和重新设计要自动化的流程或任务,以此创新并实现显著价值,而不仅仅是小幅度的效率提升。简单的人工流程自动化很难创造重大价值,流程需重新设计以利用 AI 的优势。
第二,他们需具备 AI 技术知识。生成式 AI 领域发展迅速,企业应确保其 AI 专家保持技术前沿,以判断:
●是否使用现有模型或开发新模型;如使用现有模型,需选择合适的模型(当前已有多种大语言模型,除基础模型外还有许多选择),
●适当的方法来调整所选 LLM,以满足自动化的需求,结合企业及其他可用数据,和
●如何实施并扩展自动化流程的应用。
第三,他们需懂得如何应对生成式 AI 应用的风险。风险包括由“幻觉”导致的模型输出错误、因所用数据来源引发的版权及其他法律风险、因训练数据而产生的隐私侵犯和偏见、引入影响应用安全性的病毒、妥善扩展试点应用至广泛部署等。
二、数据短缺
生成式 AI 的企业应用方式
企业在尝试生成式 AI 时,主要采取两种方式:
1.使用专有数据与基础模型结合:利用如 GPT-4、Gemini、Claude 等基础模型,或由公司提供的应用,开发聊天机器人和其他应用。
2.开发自有生成式 AI 应用:一些企业,如摩根大通、富国银行、益博睿、沃尔玛、United Health、索尼等,正在尝试或已完成自有生成式 AI 应用的开发。
不论哪种方式,数据问题都会影响项目的成功。
A.数据质量
用于微调 LLM 的企业数据在质量和格式上存在诸多不足。我们的 Portfolio 必须处理手写笔记,先将其数字化、识别笔迹,再由专家分析补充缺失的上下文,每条记录才能得到适当的标签并准备进入微调过程。这让我感到意外。我本以为经过企业过去二十多年在商业智能领域的努力,数据状况应该会更好。也许是因为生成式 AI 使公司能够利用商业智能从未使用过的数据。
B.数据完整性、治理和伦理问题
为符合法律的需求,企业需要:
●以道德的方式处理数据,确保模型不会延续有害的刻板印象或系统性偏见,这样才能使模型的每一个决策都公平负责。
●确保数据不会在生成式 AI 模型部署后导致不安全的结果或产生有害内容。
●清除因故意或无意而受到破坏或被篡改的数据,因为这类数据可能导致安全漏洞,影响模型的可靠性。Anthropic 正在这一领域积极工作。
●保护隐私,既是伦理方面的要求,也是涉及包含个人或敏感信息的数据的法律要求,确保遵守 GDPR 或 CCPA 等法规,这不仅限于数据安全。
●保证在微调模型之前的数据来源清晰,以避免诉讼、网络安全和其他风险。
C.数据的成本问题
公司逐渐意识到,即使是中等规模的生成式 AI 实验,也需要使用数十万甚至数百万条专有文件来微调模型。这样的文档集需要经过预处理来解决上述问题。一旦完成,生成的文档集还需进行适当的标签处理,之后才能开始模型微调过程。因此,即使是大型文档集的标记化成本逐渐降低,前置步骤的成本依旧可能非常高,这取决于数据的规模、质量、内容和复杂性。
三、大模型自身的问题
在 AI 试点项目中,大多数企业使用现成的大模型(LLM),通常倾向于知名基础模型,然而,无论使用何种模型,企业均认识到模型的准确性、幻觉问题和可解释性仍是亟待解决的关键问题。数据显示,各公司已在试验模型微调和检索增强生成(RAG)方法。
我们参与了多个针对 LLM 缺陷的改进项目。其中一些努力聚焦于提升企业数据质量和协调性,另一些则致力于通过修改模型参数、基于指令的提示和指令学习来改进 LLM 性能。
尽管 RAG 在试点项目中表现出潜力,但在其对生产系统的价值被验证之前仍需进一步试验。每种应对 LLM 缺陷的方法对数据使用和模型适应性的要求不同。企业尚未理解这些要求及其对生产系统的潜在影响。
尽管大模型是当今生成式 AI 试点项目的主要组件,但其他技术也被采用。这些技术仍处于变动状态。
一些企业使用了超大规模云提供商的完整 AI 堆栈(从存储和计算到 LLM);
另一些企业则通过应用提供商(如 Adobe、ServiceNow、Salesforce、Workday)开发原型;
还有一些公司使用数据管理供应商(如 Snowflake 和 Databricks)。
随着项目规模的增长,企业可能意识到生成式 AI 需要其数据中心不具备的专业数据中心架构和其他资源,因此更多 AI 系统将通过超大规模云提供商部署。
04.
企业使用生成式 AI 有哪些成本?
企业也必须在开发生成式 AI 应用时了解大语言模型(LLM)使用的成本,因为这些成本可能会相当可观。下面将识别这些成本类别,并展示影响成本的决策,以便企业在生成式 AI 应用的试验、实施和部署过程中作出最佳判断。
1.企业员工正在使用生成式 AI 处理越来越多的任务。大多数情况下,他们从使用免费版本的包含基础模型(如 ChatGPT 或 Bard)的聊天机器人开始,模型性能对于一些任务(如写邮件、总结文件)已足够好。初步使用效果令人满意后,员工通常会购买个人订阅以访问更好的 LLM。不久后,这些个人订阅成为企业的一项重大支出,这与企业员工使用 Dropbox 和 Slack 等工具的路径非常相似。
2.针对企业中复杂或专有的流程(如客户支持、设计、数据分析和软件编程),通常需要不同的方法。大多数企业首先尝试更加复杂的提示工程,仍然使用开箱即用的 LLM。
3.如果效果不足或不可能实现,他们可能会通过微调或检索增强生成(RAG)来提高这些基于云的 LLM 的性能。
4.如果这些方法仍无法满足需求,企业可能会选择开发自己的专有 LLM。例如,Intuit 开发了 GenOS 生成式 AI 应用,使用专有 LLM 帮助客户解决税务、会计、营销、现金流和个人财务问题。丰田正在开发生成式 AI 应用,帮助汽车设计师在创意阶段提供支持。我们需要开发一些指标,以帮助企业决定何时从复杂提示工程转向微调现有 LLM,最终选择开发专有 LLM,其中成本效益分析是关键指标之一。
每种方法都有其优缺点,并涉及不同的成本:
●复杂提示工程的最高成本在于寻找理解问题且能创建合适提示的员工,
●而 RAG 方法的最高成本在于找到合适的数据以使 LLM 专业化。
本文将识别成本类别,而非给出具体费用,因为成本取决于所需模型类型、应用程序和模型构建环境。我们识别出四类成本:
1.技术成本
2.合规成本
3.响应验证成本
4.用户培训成本
本文将识别成本类别,而非给出具体费用,因为成本取决于所需模型类型、应用程序和模型构建环境。我们识别出四类成本:
1.技术成本
2.合规成本
3.响应验证成本
4.用户培训成本
技术成本
技术成本包括数据、工具、数据中心和人力。数据是开发新 LLM 或修改现有 LLM 的关键成分。根据 LLM 所要应用的业务流程,企业可能需要除了专有数据之外还要额外授权数据。用于模型微调或专有 LLM 开发的数据必须被标注、清理(如删除带有偏见的记录并确保数据质量),并进行妥善管理。根据企业如何处理专有数据的策略,可能选择使用服务型 LLM,或在自己的数据中心托管 LLM,每种选择的成本不同。
使用专有 LLM(或小型语言模型)需要企业了解这些模型的训练、推理和维护成本。企业需授权生成式 AI 软件基础设施工具,以便执行标记化和向量管理、大规模神经网络架构开发、模型验证与完整性保障、MLOps 及生成式 AI 应用开发工具。如果使用开源模型(如 Falcon 或 Mistral)开发 LLM,可能会产生模型支持成本。如果修改专有 LLM(如 GPT-4)并将其托管在本地,则成本会更高,因为还需支付模型许可证费用。此外,由于如今开源和专有模型种类众多,企业还需考虑选择初始 LLM 的成本。
由于 LLM 的复杂性远超于一般的判别式 AI 预测模型,生成式 AI 在模型完整性(如防范网络威胁)方面的难度和成本要高于判别式 AI。如果这些是公司关注的关键问题,则需在数据中心中开发并托管 LLM,从而承担相关成本。
企业必须确定现有数据中心资源是否足以支持 LLM 的开发和托管。使用公有云资源的生成式 AI 初创公司发现,当前数据中心架构并非针对 LLM 训练和推理进行优化。用于生成式 AI 的数据中心需要新架构,以不同的 CPU/GPU 比率和组件互连,且对电力需求更高。数据中心升级成本高昂。
合规成本
政府意识到 AI 的力量,包括生成式 AI,能够带来巨大的改变。生物技术、医疗、教育等领域的转变将带来巨大益处,但虚假内容生成等也会有负面影响。为了应对生成式 AI 中数据使用带来的问题(如生物识别数据)及其应用可能产生的影响(如评分应用),多个国家已开始实施各种法规。美国发布了总统行政命令来覆盖生成式 AI 操作,欧盟通过了《AI 法案》,这些法规的制定均早于中国,日本则采取了较为宽松的监管方式。
符合这些法规,尤其是跨国公司的合规要求将会昂贵。企业需确保所用数据、构建的模型和嵌入这些模型的应用符合每个地区的规定,可能需为每个地区开发不同的模型,确保数据和模型构建过程符合当地法规。此外,一些需认证的现有应用(如医疗应用)在引入新 AI 组件后将需重新认证。
响应验证成本
使用 LLM 的人对其“幻觉”和不一致的回应应已熟悉。企业在考虑生成式 AI 用于客户支持或软件开发时,尤其担心客户满意度和潜在责任问题,例如客户收到错误回复或 LLM 生成的代码造成企业系统问题。因此,企业需考虑验证 LLM 响应正确性和一致性的额外成本,以及开发并嵌入模型性能保障机制的成本。
用户培训成本
最后一类成本是培训员工以充分利用生成式 AI 的能力,包括提示工程的培训,以及如何更好地使用开始集成到生产力工具和其他企业应用中的各种辅助工具。这些成本可能非常高,影响企业考虑的用例。
每个企业都需制定其 AI 策略中的生成式 AI 组件。作为策略分析的一部分,企业需确定是否需要专有模型、该模型是否应涵盖多个领域,以及用户使用单一企业 LLM 还是多个特定任务或领域的模型更为合适。
05.
ROI 多少,企业使用生成式 AI 的需求才会彻底爆发?
AI 解决方案和基础设施提供商承诺在未来几年内投入 1 万亿美元用于 AI 相关的资本支出,以应对企业生成式 AI 解决方案的高需求。几年前,汽车行业也曾对电池电动车(BEV)和其他新能源车(NEV)投入类似规模的资金,预期消费者需求强劲。然而,如今由于需求低于预期,汽车制造商正在减少投资承诺,面临产能过剩的风险。
要使得在软件、数据和基础设施上的巨额投资合理化,企业需要从每个生成式 AI 解决方案中获得多少投资回报率(ROI),以便自信跨越生成式 AI 的鸿沟?
为回答上述问题,企业需要确定目标 ROI 和实现时间。
例如,生成式 AI 解决方案应在一年、五年或更长时间内提供 3 倍、5 倍、10 倍甚至更高的 ROI。企业还必须意识到,跨越生成式 AI 鸿沟不仅依赖于技术,还需要开发新的商业模式、组织优先级和文化转变。
虽然可以参考 20 世纪 90 年代末的互联网浪潮,但我更想考虑两个不同的领域:公司车队对 BEV 的使用以及企业对云计算的采用。分析当前阻碍 BEV 的采用的因素,并了解是什么促成了企业广泛采用云计算,并持续至今。
BEV
车队管理者考虑使用 BEV 和 NEV 主要有三个原因:减少碳足迹、提高车队的正常运行时间以及降低总拥有成本(TCO)。城市包裹配送、公共交通和长途物流等用例有不同的 ROI 倍数和实现时间。然而,由于现有商业模式下这些车辆的高昂前期成本、续航限制以及不足的充电和能源传输基础设施,这些问题对 ROI 的设定构成挑战,导致车队运营商推迟了商业 BEV 和 NEV 的广泛应用,促使汽车制造商减少投资承诺。
云计算
大约十年前,企业开始广泛采用云计算,跨越了所谓的鸿沟,从而造就了许多成功的云解决方案提供商。这一过程始于技术首次引入企业后的 15 年,并在早期采用者开始报告他们所获得的 ROI 后加速。通过降低 IT 成本和资本支出、提供更大的部署灵活性和更便捷的系统集成,以及引入新的商业模式(订阅和按用量付费),企业实现了 ROI。但跨越鸿沟并实现期望的 ROI 花费了约 15 年,并且在公司 IT 组织内部引发了关于云计算优劣的激烈争论。
跨越生成式 AI 的鸿沟
跨越生成式 AI 鸿沟需要企业回答几个重要问题:
●我的 AI 解决方案是否需要访问 GPT-4 这样的商业基础模型,或者使用企业数据微调开源模型是否足够?
●我正在开发的解决方案应采用何种商业模式?
●我的哪些团队已准备好部署并利用该解决方案?
为实现广泛的企业应用,特别是在非高科技行业中,生成式 AI 解决方案在某一用例中的应用必须提供与其投入的资源(人员、数据、软件和基础设施)和承担的执行风险相称的 ROI,并且在符合公司战略目标的时间内实现。选定的用例应解决难题,最好是与成本减少、收入增长或客户满意度提升相关的难题。其他如时间节省、风险减轻和员工福利等方面的生产力提升用例可以作为候选,但从未被视为最重要的。
以云计算在客户关系管理(CRM)中的角色为例。美林证券是 Salesforce 的最大早期采用者,使用 CRM 以促进收入增长。生成式 AI 在文件总结、邮件回复生成和市场宣传材料创建方面的表现虽优秀,但如果考虑推理成本,相较于使用低成本员工,仍可能更便宜。当前这些成本并未反映在服务商对企业用户的收费中。大量的风投和私募资本,以及谷歌、微软、亚马逊、英伟达等 AI 基础设施提供商的雄厚资产,使得这种差距得以存在。
无疑,随着时间的推移(两年、五年、十五年?),可用的大模型将能够以今天成本的很小比例,提供更好的总结、市场宣传材料甚至更重要的内容,即使将模型微调和专业化的成本考虑在内,仍能实现企业和提供商都能接受的 ROI。但目前我们尚未达到这一阶段。
为了熟悉和适应生成式 AI,企业需要较简单的用例。这有助于企业熟悉技术,甚至测试新的商业模式。然而,能体现生成式 AI ROI 的项目必须解决对企业至关重要的难题。这些难题有些是特定于行业的,有些则跨行业适用。实验可能持续六个月,但开发和部署针对关键问题的解决方案可能需要数年,在此期间需要考虑并可能改变技术、商业模式和文化。
06.
生成式 AI 的核心投资理念
我们与企业合作伙伴共同评估了生成式人工智能(Generative AI)在企业中的应用准备情况,并据此更新了我们的投资理念。研究显示,我们有理由相信,大语言模型(LLMs)/ 基础模型及其相关应用的出现将为开发新型智能企业应用程序开辟道路,同时为现有应用增添重要的新功能。
自成立以来,我们公司始终专注于投资开发横向或纵向企业软件的早期人工智能初创公司。我们关注基于数据驱动和机器学习的人工智能应用,这些应用克服了基于逻辑系统的诸多局限性。过去半年中,我们与合作伙伴密切合作,评估企业在生成式人工智能上的准备情况,并相应调整了我们的投资理念。我们坚信,大语言模型 / 基础模型和相关应用将成为开发新一代智能企业应用的关键,并为现有应用提供重要的增值功能。
一、AI 初创公司的主要类别:
我们将生成式 AI 的初创公司划分为四个主要类别:
1. 工具开发者:此类别包括开发基础设施软件以构建和支持生成式 AI 应用的公司。包括矢量数据库、智能代理构建环境、模型集成与管理、自动数据标注以及专用的 AI 云服务。典型公司如 Pinecone 和 LlamaIndex。
2. LLM/ 基础模型开发者:这类公司专注于开发和授权使用大语言模型(无论是横向的还是垂直的),并将其作为服务向消费者和企业提供,这些模型已逐渐成为新兴的平台级应用。典型公司有 OpenAI、Cohere 和 Anthropic。
3. 内容生成器:利用现有大语言模型的接口进行提示生成,通过简便的提示生成各种形式的内容,如图像、视频、文档、广告等。代表公司包括 Stability AI 和 Simplified。
4. 智能体开发者:这一类公司专注于开发可独立执行复杂任务或与人类协作的横向或纵向应用。在这些应用中,大语言模型作为一个组件发挥作用,但未必是核心。代表公司如 Replit 和 Grammarly。
Synapse Partners 的生成式人工智能投资策略聚焦于开发包含专有大语言模型的智能体公司。这些智能体所使用的大语言模型可能是从零开发的,也可能是开源模型的专业化版本。在这些智能体中,大语言模型对整体系统智能和功能的贡献比例大约为 20%-30%,而不是内容生成器那样达到 70%-80%。这些智能体的价值在于它们能够针对频繁变化的条件为特定行业应用场景(如汽车配置管理或物流配送规划)提供支持。尽管我们可以看到一些公司(如 Inflection.ai)正在尝试开发通用型智能体,但我们聚焦于企业软件领域,因此优先考虑特定任务和行业的智能体更符合我们的投资理念。
二、智能体开发的两种投资理念
对于智能体开发公司,我们主要关注两种投资理念。
第一种是投资于那些为以前难以实现自动化的、且频繁变化的任务开发特定行业智能体的公司,比如帮助建筑师设计办公楼,或者帮助汽车设计师生成符合特定功能和规范的新设计。在这个理念下,我们也会考虑那些智能体为已实现自动化的任务提供新方法的公司,比如生成零售退货的分析报告。
第二种投资理念是关注那些将智能体集成到现有应用程序中以提升功能和灵活性的公司。例如,在客户支持应用中整合一个生成式 AI 驱动的智能体,可以帮助客户支持代表更有效地总结呼叫中心的案例,为客户提供更优质的界面体验。
无论是否包含大语言模型,智能体都是一种软件程序,能够:
- 接受完成特定目标的输入;
- 进行推理并制定计划以实现既定目标,且在实现目标过程中能够对遇到的情况做出应对(即它可以感知其环境);
- 自主执行它认为最适合的计划(即它能追踪自身表现);
- 随着时间推移进行学习和性能提升(即它可以根据从环境中获得的反馈来调整自身的知识库)。
为完成这些任务,智能体需要具备一个适应其运行环境的世界模型。在某些情况下,大语言模型可以成为智能体的一个重要组件,尤其是在数据分析、编程、蛋白质折叠等基于语法的领域应用中。
智能体必须具备以下特征:
- 灵活性:智能体必须能适应不断变化的环境,随时调整自身行为以应对世界的变化。
- 可靠性:智能体必须能够可靠地执行任务,处理意外情况并从错误中恢复。
- 可解释性:智能体必须能解释其推理和决策,使用户了解其工作原理,从而增强信任。
如果这些智能体的大语言模型连接到一个包含行业知识的知识库中,它们便可以自动优化用户设定的目标,协助制定多项计划,生成查询以检索规划组件所需的数据,并通过总结和解释已执行的操作结果向用户反馈。
07.
总结
生成式 AI 已迅速成为人工智能领域的一个新兴热点。尽管它吸引了投资者和企业家的高度关注,并促使数百家初创公司诞生,但我们数据库中的企业合作伙伴正在审慎评估其解决现有问题的潜力。部分问题可以通过采用其他技术来解决,而生成式 AI 则在解决新问题方面展现了关键优势。然而,他们普遍认为这些研究仍处于初级的沙盒阶段,尚不具备大规模预算的分配条件。受生成式 AI 热潮的影响,我们的投资组合公司对其解决方案的需求显著增加,即便他们采用的是判别式 AI 技术。尽管我们将追求新的生成式 AI 投资理念,但我们不会忽视一直以来的人工智能投资理念,这些理念已构建了强大的投资组合,并继续收到有潜力的商业计划。
在我 40 年人工智能领域的工作经历中,我曾多次见证特定技术推动的“AI 热潮”。在每一次的 AI 热潮中,我们都见证了大量风投支持的初创公司成立,其中大多数在最初的高期待期过后陷入停滞,其特点是大规模融资轮次和高估值。在这些情况下,导致失败的主要原因是客户需求未达预期,且发展速度远低于初创公司的预期。这一次,我们或许会看到类似的结果。因此,未来 12 个月对于生成式 AI 的发展至关重要。初创公司需要利用现有的资金储备来教育潜在客户,说明生成式 AI 如何为企业带来效益,并实际兑现其声称的价值。
写在最后
敬请期待。
除此之外,如果在阅读本篇时,略有困难,那是因为您尚未阅读他的前述文章,
●第一篇《AI 算法分析 94 家海外 AI 独角兽》,我们分析了 2015 年后成立的 6500 家 AI 公司, 并且整理出了 94 家海外 AI 独角兽。
●第二篇团队分析《原创研究 | AI 创业:团队决定命运?》。
●第三篇机构分析 《AI 投资新格局:科技巨头主导,VC 退居二线》。
●第四篇,OpenAI 分析《原创研究 | OpenAI 黑帮使命:从邪恶的 OpenAI 手中拯救人类》。
●第五篇中美技术对比《原创研究 | 大国竞争之中美 AI(一)技术篇》。
●第六篇中国独角兽分析《大国竞争 | 中美 AI 对比(二)独角兽篇》。
●第七篇中国 AI 独角兽点评《人工智能:爆米花独角兽与数字庞氏的交响》。
●第八篇国内创业方向分析《大国竞争 | 中美 AI 对比(三) 创业方向和人才来源》。
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。