对话百度智能云:读了两年LLM,我们找到了AI应用的正确范式
在刚刚过去的2024年百度世界大会上,百度CEO李彦宏公布了截至11月初的文心模式日均调用次数——超过15亿次。一年前这个数字是5000万倍。一年内增长了30倍。李彦宏感慨地说,“这条陡峭的增长曲线代表着近两年中国大型模型应用的爆发。”
进入2024年之后,大车型的能力迭代逐渐进入稳定期。大模型的技术趋势已经从大语言模型转向更多的多模态模型,模型的API价格也出现了大幅下降。
更多模态的可能性给了开发者更多的想象空间,而模型调用成本的解放则为开发者打开了最重的束缚。一切都预示着人工智能应用的爆发即将到来。
AI应用的开发者该如何适应这个时代,站在开发者背后的大模型平台又扮演着怎样的角色?这已经成为当下最需要思考的问题。
11月14日,极客公园创始人兼总裁张鹏、百度副总裁阮宇、百度副总裁谢广军围绕这些问题进行了讨论。
在这次讨论中,阮宇和谢广军发表了一些精彩的观点:
01
大模型时代的应用开发让创意验证更简单
张鹏:阮宇先生从移动互联网时代就开始做产品、经营产品。您是否观察到人工智能时代到来后应用程序开发范式的变化?更具体地说,制造产品的方法和流程是否发生了变化?
阮宇:移动互联网时代发展的实际过程是产品经理对用户需求的抽象。有了这个抽象之后,我们就开始组织对用户需求的研究,最后提出MRD,然后开始开发一对一外教口语陪练线上,最后进行测试和上线。传统的标准化流程就是这样的瀑布流程。
在AI时代,它实际上对流程的影响更大,因为大模型的能力带来了低代码甚至无代码开发的可能性。事实上,通过千帆提供的Agent方法,在现有工具链的支持下,PM的一些想法只需要输入一两句话对话百度智能云:读了两年LLM,我们找到了AI应用的正确范式,就可以从大模型生成一个简单闭环的轻量级Agent 。您可以直接在线尝试。这其实是一个比较大的颠覆。
如果是涉及比较复杂场景的企业级应用,整体逻辑仍然是先选择一个小切口,然后利用原有的移动互联网流程经验来开发。但这一过程也引入了许多新的发展模式。比如我们推出的文心快码,相当于AI帮助研发快速生成代码,代码采用率也比较高。这样的话,就相当于你有了一个想法之后,将来有一天这段代码全部由机器来写,整体效率会大大提高。
这其实就是我们发现现在的产品开发范式与原来有很大不同:一是流程越来越简单,二是整个开发模式正在走向更加高效的方式。
张鹏:听起来移动互联网时代能否快速尝试和验证一个东西,既取决于人的因素,也取决于技术的因素。现在AI能力可以打破原有开发流程背后按部就班的技术框架。在这个过程中,人的想法变得更加重要。
我也想请广军分享一下这方面的情况。阮宇一直是千帆平台上重要的开发者,但你肯定会看到更多的开发者。如今这种发展模式发生了哪些变化?哪里变得更简单,哪里变得更困难?您对此有何看法?
谢广军:从我们平台上很多开发者的经验来看,从验证应用思路的角度来说确实更容易。但到了应用的实际生产阶段,可能还需要经过一系列的搭建流程。千帆平台最终希望在整个过程中进一步降低大家的开发门槛。
总而言之,在我们的平台上实现大型模型驱动应用程序的过程通常经过以下步骤:
了解每个模型的固有功能并选择正确的模型。构建应用程序架构。根据场景的需要,对模型进行优化和调优。
张鹏:您如何解释这个“三步走”的过程?
谢广军:第一步是选择模型。这其中涉及到很多知识。您应该选择什么尺寸的型号?比如文心大型号有4.0和3.5。还有一些较小的型号,例如ERNIE Speed和ERNIE Lite,以及一些特殊型号。然后,根据具体的应用需求,选择一种语言模型。或者一些多模态模型,甚至传统意义上的视觉模型等等。
第二步实际上是构建应用程序架构。如今,大规模模型的应用架构已经比较统一了——刚才阮宇介绍的代理是一个非常通用的架构——而除了代理架构之外,用户可能还需要改造你的传统应用范式和应用模型来为端到端应用程序构建更加自动化的架构。
前两步,我们其实是致力于让大家快速验证自己的想法。但在现实企业中,尤其是在生产环境中实施时,仍然会出现想法能够得到验证,但结果却未必令人满意的情况。这时,用户真正需要的是模型的优化和调优。例如,知识库应用程序需要结合自己的文档内容来进行RAG调优,这当然也包括各种与性能相关的优化。
千帆平台提供了很多这样的机制和功能来支持模型的优化和调优。
张鹏:听起来如果把模型应用看成今天的硬件产品的话,举个例子,全世界都知道你要做硬件就得去深圳,千帆就是那个“深圳”。制造硬件需要一整套零部件供应链。
谢广军:是的。
02
无论是+AI还是AI-Native,
产品开发的目标设定原则没有改变
张鹏:发展范式发生了巨大变化,但超级应用还没有出现。这说明找到PMF还是很困难的。这不仅仅是技术的积累,还有很多复杂的工作要做。看来,真正走AI-Native路线对于应用初创公司来说是相当有挑战性的。
广军接触过这么多开发商,肯定有成功的,也有失败的。如果你想成为AI-Native应用的创业者,在做出这个决定之前你应该评估什么?从中可以得出什么结论吗?
谢广军:我把应用开发者分为两类。
第一类是自上而下的业务驱动,已经拥有完善的业务模式和应用产品。如今,大模型时代已经到来。他希望通过大模型来降本增效,带动整个业务有更好的用户体验。这类开发者对于大模型的需求非常明确,这就是能为他们带来什么新的价值。
第二类是自下而上的,由技术驱动。这个类别可能更像我们所说的AI-Native。所谓AI-Native,其实就是指不同的思维视角,即大模型技术能够催生什么新的应用,从这个角度考虑问题。
张鹏:千帆平台上都出现了这两种类型的开发者吗?
谢广军:有非常成功的案例。在我们平台第一类业务驱动的开发者中,我们曾经有一个专门从事职业教育培训的客户,主要是职业考试培训领域。这家公司的APP叫做“考试宝”,它的重要场景之一就是很多参加专业考试的人——比如考厨师证、医学证的人——都会在上面答题、模拟考试。除了提供问题外,他们还必须提供答案以及对答案的解释一对一外教口语陪练线上,例如解释为什么他们在这道问题上选择了A。过去,这些分析都是人工标注,每个问题的成本约为一到两元。现在他们发现,使用大型模型做同样的事情并生成几乎与手动注释一样有效的分析,成本几乎可以忽略不计,几美分就可以生成一个问题的分析。这是典型的降本增效的商业模式。
我们以教育赛道为例。过去,在英语教学培训行业,总有英语实践的场景。以前,学习口语,必须与外教、中教进行在线对话,进行实战训练。现在,许多客户利用大型模型和数字人技术来创建英语陪练的虚拟人。虚拟人可以听到你的语气、纠正你的语法并指出问题。这个赛道现在发展得非常快。
张鹏:听起来两者有相似之处。
谢广军:其实现在无论是叫“+AI”还是“AI-Native”,最终做之前都要有一个明确的目标。如果你是个人开发者做小项目来实践的话,探索一下肯定没问题。但如果你真的想做生意,你还是需要设定目标。这其实和之前非常相似。因此,不能说AI来了,一切都会被颠覆。虽然开发范式变了,但做产品的目标设定原则没有变,反而更应该引起重视。
张鹏:换句话来说,以前如果我自己写代码,用户使用时不会产生直接成本。但现在用户一使用代币就会消耗掉,所以需要更清晰地思考。
03
不要被人工智能的能力所愚弄
张鹏:虽然现在有很多新的机会,但肯定也存在一些陷阱。所以想听听阮宇老师的分享。从移动互联网产品开发到AI驱动产品开发,其中实际遇到了哪些陷阱?能不能分享给大家,让大家少走弯路?
阮宇:我认为目前AI应用有两个主要的陷阱。
第一个是产品经理、客户和用户不要对AI抱有太高的期望。大家对AI(大模型)的认识是一年多来逐步发展的过程。从一开始我就觉得AI无所不能,现在越来越理性、务实。做应用的时候,无论是移动互联网时代还是AI时代,本质都是找到客户和用户场景,然后务实地满足用户需求。只有这样,才能真正体现出应用的价值和生命力。正如广军刚才所说,你要有一个目标。这个目标是满足用户的需求,在特定场景下为用户和客户创造价值。这是一个真正好的应用程序。
张鹏:连关键指标都得能拆。但问题也在这里,对于客户来说关键指标是什么?
阮宇:比如在客服场景中,客户最关心的是你能帮他们解决多少客户投诉,能为他们节省多少成本。在数字人场景下,客户更关注线上营销,可以大幅提升效率,降低获客成本。有离线屏幕的地方,就能以更低的成本服务更多的顾客。因此,不同的场景有不同的目标,解决不同的用户需求。
第二个陷阱,尤其是在原生人工智能应用中,人们认为很多行业知识和理解可以被忽略,并且经常陷入这方面的许多陷阱。我们任何时候都要尊重专业精神,尤其是行业经验。在做AI的过程中,我们也需要花大量的时间和客户沟通,了解行业的真实需求,学习客户自己积累的知识和经验。同时,大模型应用能否有效使用,需要客户理清公司内部的知识结构和体系,做好数据治理。智能化离不开数字化。首先要有数字化,要有知识体系,才能实现智能化。这也是在接触很多客户的过程中发现的。 AI要很好地解决一个场景中的问题,背后一定是做了很多深入的理解和整理工作,做了大量的工作来梳理这个AI应用下的知识体系。
所以这是两个比较大的陷阱,希望新创业者能够避开。
张鹏:我们不希望每个人都经历这样的事情,对吧?
阮宇:对,尽量少踩。
张鹏:你刚才说的其实是很关键的。首先,不要对人工智能超出其当前发展阶段的能力抱有任何幻想。
如果客户有幻觉,开发者也有幻觉,那么这件事就很有可能会输掉。至少有一方是醒着的吧?因此,无论是模特还是人们都抱有幻想。现在模型的幻觉要靠技术来消除。如果这是它的特性,它可能永远不会完全消失。但人们首先要做的就是克制自己的幻想。
消除妄想之后,你可以弥补一些东西,那就是了解具体的需求。刚才提到,谁能把同样的技术很好地运用到不同的客户身上,其实和企业的数字化程度有关。这也可以反过来理解。模型平台还可以选择当前合适的领域和客户来使用。一件一件地做。
我想这可能是我们今年观察到的变化之一。过去,AI能力的渗透可能比较慢,但现在我们还是需要一步一个脚印,提供一些新技术。生产力开始发生变化。
说起AI产品开发的“陷阱”,广军观察到了很多这方面的样本。他是不是应该多一些理解呢?
谢广军:从我们平台的角度来看,平台上的开发者一般有几个陷阱需要避免。
第一个是成本坑。从去年下半年到今年,平台上有很多开发者在做各种应用验证。他们遇到的一个共同问题是:如何从验证阶段过渡到商业价值的实际应用和生产?每个企业都需要计算每个场景的投资回报率和商业效益。那么,第一个陷阱其实是,使用大模型真的能降低成本吗?换句话说,成本降低与商业收益成正比吗?
张鹏:感觉去年大家都想不惜一切代价去尝试一下,但今年大家都决定算账了。
谢广军:是的。众所周知,今年从模型调用成本来看,各平台不断降价。降价之后,应用的各项指标确实有了明显的提升。这也证明大家在过去的一段时间里确实被成本困住了。所以从技术角度来说,我们还需要提供一系列的机制和技术来帮助客户降低大模型应用的成本。比如如何用更小的模型达到同样的效果(需要模型开发),如何量化大模型,以及如何在应用中将大小模型结合起来。
这也与第二个陷阱有关。如果说第一个障碍是成本的障碍,那么第二个障碍实际上就是效率的障碍。很多开发者实际上已经完成了应用验证,但是当他们真正进入生产场景时,却发现无论如何调优,大型模型应用仍然达不到理想的问题解决能力。例如,做智能客服时,理想的目标可能是准确响应率达到90%,满足用户需求,但如果卡在88%,就无法上线。这个时候,实现调优就非常重要了。在千帆平台上,我们一年多来致力于打造调优工具链,包括模型调优、应用策略调优,为让用户调出更好的模型效果做了很多工作。
许多开发人员在平台上遇到的第三个陷阱实际上是性能障碍。不过,这个和第二个坎不同的是,即使模型的最大性能已经被激发出来,开发者仍然需要使用一段时间,比如两三个月后,你会发现之前的应用程序离线测试或初期低流量测试时表现良好的产品现在已无法满足客户或用户的需求。
这主要是因为用户结构发生了变化,用户的查询发生了变化,导致整体结构发生了变化。因此,当前大规模模型的实现需要不断迭代、不断优化。无论是模型还是应用能力,一次调整到最佳是不够的。我们现在也鼓励用户在千帆平台上构建自己的数据闭环或者数据飞轮,通过用户数据进一步微调模型,然后上线迭代,让模型和业务更加智能,更加适应应用模型。
从平台的角度来看,这三个陷阱非常典型。
张鹏:这三个坑描述了一个非常特殊的形象。停止开发几天并期望战斗在一代产品中得到解决已经成为过去的时代了。如今,人工智能应用开发是一场与人工智能共同成长的长期战役。如果这个意识不清晰,很可能你一开始就会陷入这些陷阱。
前面讲的更多的是AI如何让客户的想法更好的落地,但是这中间其实还有一个问题,那就是如果开发者做产品的决策是错误的怎么办?在做出这个选择之前——无论是使用AI产品还是做AI产品——你实际上需要评估场景范围一对一外教口语陪练线上,包括你是否AI Ready。关于这一点,我想请问广军,必须要做哪些准备,才能真正谈及大型模型场景的落地。
谢广军:这个和我们前面提到的两个模型比较有关系。
一是将大模型的能力与现有应用相结合,改变用户交互模式,提升用户体验;或者用大模型代替人工链接,提高效率。通过一些总结的方法,我们可以判断这个大模型是否能够形成商业模式,是否可行。
二是利用大模型的能力象限,打造新的应用场景。这比较困难,但值得探索。至于探索方法论,我觉得我们还是需要把整个商业模式想清楚。现在很多创业者可能只解决了第一步,想清楚用户价值。但用户价值本身随着技术能力的变化而变化。如果不真正理解商业模式,业务就很难发展。因此,在不断尝试新的业务场景的过程中,需要结合大模型的能力象限,对商业模式和模式进行更深入、更清晰的思考。
我来分享一个观点。今天的大型模型确实是人类技术史上非常大的飞跃,但我们仍然处于探索大型模型能力的早期或初级阶段。我们感觉未来几年大型模型的能力将会大幅提升,每一次飞跃都可能拓展新的应用边界。因此,还是建议开发者放眼未来,打造面向未来的产品。
张鹏:但另一方面,起点不要期望太高一对一外教口语陪练线上,还是需要进行严格的评估。我也想到刚才阮宇老师说的,不要对今天AI的能力抱有任何妄想。那么也许大模型落地的另一个重要前提就是首先要消除人们的幻想。企业家的幻想,开发商的幻想。
04
大型号都可以
快速重用行业最佳实践
张鹏:百度智能云在智能客服、数字人等领域已经实现了很多大规模的模型应用。详细来看,产品背后的文心模型能力是如何与各个场景契合的?
阮宇:在这些应用的背后,千帆提供了很多能力。千帆首先提供了底层的大模型能力,在其之上我们构建了非常丰富的应用层。千帆平台本身根据自身的能力,为应用程序开发过程提供了丰富的工具链,然后让客户使用一些简单的画布进行调整就可以完成简单的开发过程。让平台自然生长出很多面向不同场景的应用。
在大机型出现之前,我们想要依靠一款产品来普遍满足不同用户的需求,其实是比较困难的。但有了大模型的能力,我们现在可以解决客户更多的个性化问题,这意味着产品可以真正贴合实际场景。
张鹏:满足个性化需求,大模型在能力上起到所谓“泛化”的作用,而不需要针对每个个性化场景重新做AI。
阮宇:是的。
张鹏:从最终效果来看,大机型的加持是如何提升客户指标的,比如支付转化率,或者客户服务满意度?你有哪些指标来监控这个预期效果的实现程度? ?
阮宇:从客户的角度来看,我们其实更关心大模型的应用能给企业带来的实际效益。我们以一位使用客阅的餐饮行业头部客户为例。该客户每天处理大约 70,000 个客户服务电话。使用客悦后,客服转人工比例从22%下降到10%。同时,每天节省代理运营成本约2.5万元。这是一个非常有意义的大型模型应用帮助客户在特定场景下创造价值的例子。
张鹏:一个非常强烈的感觉是,去年我们也会关注一些大模型的所谓参数级的分数。现在我们看的是客户面前的大模型具体数字的变化,也就是大模型到底能把这件事的效果提升多少,能真正解决问题多少。这是一个相当大的变化。
阮宇:是的。
张鹏:我想问的问题是,比如说阮宇提到的数字化客服,可以有一些标准和最佳实践,但是到了每个客户的时候,需求还是不一样的。本质上,这样的产品是否应该支持所谓个性化服务的需求?这里有什么经验可以分享吗?
阮宇:以科悦为例,第一大方面就是在满足客户的客服需求的时候,我们还是可以抽象出很多共性的问题。例如,用户与系统的对话过程、工单如何流转等,有很多标准化的流程。在标准化的流程中,可以将接待客户的接口抽象为统一的接口。
无论哪个行业,面对客户的许多标准技术都是固定的。大模型的好处是,用户进来后,可以根据自己的情绪和需求提供个性化的响应。在之前的NLP场景中,很多小模型只能使用标准化、固定的标准词汇,所以很多客服人员就像机器人一样,非常机械。但对于大型模型,可以实现个性化。您可以定义客户服务角色。例如,如果你想要一个轻松的小姐姐形象,你可以用轻松的语气与顾客交谈;如果你希望客服严谨客观,也可以相应模拟一下。因此,大模型可以根据不同客服人员的风格偏好,快速生成相应的风格词。
这背后是我们基于千帆平台提供的一系列工具链和画布配置能力,包括客服的情感属性等,这些都可以通过通用的方式通过产品配置来实现。因此,这很大程度上节省了开发成本,并且可以快速在其他行业中重复使用。
张鹏:这个怎么能重复利用呢?你能举个例子吗?
阮宇:比如餐饮业。餐饮行业客服的知识库可能包括退款、订单,甚至诸如“您想买多少只炸鸡?”之类的问答。这些知识库的内容在餐饮行业已经非常统一了,换个场景也适用于奶茶店。大模型实际上解决了ToB场景中大规模定制的原始问题。
这一观察也来自于科悦这段时间服务客户的经验。我们的客户有的是金融行业,有的是人力资源行业,还有的是餐饮行业。客户有很多种类型。
张鹏:好像某个行业有了最佳实践之后,很容易被这个行业的更多人使用,也能更好地解决问题。所以,一开始就实施这样一个实际的流程是最关键的,第一步非常重要。
阮宇:是的,相当于我们有了一个通用的工具。一旦在某个场景下运行顺利,就可以覆盖不同的行业。西菱数字人的应用意义更为重大。因为有了数字人的数字资产,再利用就很容易了。在实际场景中,我们现在只需一句话就可以快速生成一个数字人。这种数字人可以用于离线大屏幕上的手语客户服务,也可以用于银行系统中的业务处理。它可以出现在很多需要数字人存在的场景中,并且具有很强的可扩展性。
05
AI时代的开发者,
最重要的是3个能力
张鹏:我再问一个很务实的问题,就是这种发展范式的转变对创业、对组织、对产品团队的影响。阮宇总裁领导着一支非常AI-Native的团队。您认为像今天这样的团队和移动互联网时代的团队在能力的构成和分布上会有什么变化,或者说您更需要什么样的人?
阮宇:我觉得通过描述一些特征更容易定义未来AI时代需要的人才。如果这样一群人面对未来的AI时代,我认为一个人或者一个组织的学习能力的重要性越来越凸显,因为大模型的技术变化非常快。你对新事物的理解以及领导和整个核心团队的认知水平可能会决定你对产品本身和用户场景的理解。新技术如何运用在场景中,产生更大的价值,很大程度上与团队本身的学习能力有关。其实我觉得这个能力以前很重要,但是因为变化太快,所以现在就显得更加重要了。
还有一点,对于组织来说,非常重要的是团队有AI原生的思维方式,是否是基于现在的技术和我们掌握的能力来思考问题,是否是从新的角度进行重构。在原来的业务中,其实更重要的是寻找新的场景、新的机会。
第三个素质是拥有跨行业的知识。因为现在有很多新的机会出现,对于一个面向客户的组织来说,不仅需要了解自己所处的行业和技术,还需要了解餐饮行业、教育行业……也就是你面对的客户行业,需要将不同行业的知识储备与现有大模型的能力结合起来,然后帮助各个行业完成向数字化智能化的转型。这其实非常重要。
张鹏:也就是说,你需要快速学习公共领域的知识,然后最好在私人领域积累一些知识。那么在当前的AI时代,对学科专业背景有没有影响呢?比如今天做科技产品,文科生和理科生的机会是不是变得更平等了?
阮宇:人工智能面前人人平等。只要每个人都能用好人工智能,无论是哪个学科的,都会有自己的知识结构和知识库。甚至可能是文科学生拥有更广泛的知识,然后他们可以根据公共领域知识和您自己的知识基础来用自己的想法制作自己的抹布。例如,极客公园(Geek Park)将历史访谈文章和深入的内容纳入培训模型,最终内容和效果可能会更好。在AI时代,每个人都有自己的优势。
张彭:鲁恩·尤(Ruan Yu)的专业是什么?
鲁恩·尤(Ruan Yu):历史
张彭(Zhang Peng):您研究了历史,一位文科专业,我研究了一名文科专业的新闻学。只有广6是科学专业。似乎每个人都在AI之前是平等的。
碰巧问“科学专业的学生”广6个关键问题。如今,Qianfan成立了如此丰富的开发人员生态系统。展望未来,Qianfan工作的目标和界限是什么?换句话说,Qianfan如何将自己定位在这一浪潮中?
Xie guangjun:从技术角度来看,我认为当今大型模型的实施包括几个要素:计算能力,数据,模型功能和应用程序。 Qianfan平台本身还致力于在这四个要素中查看我们自己的定位。现在,Qianfan的平台定位可以集中在三个属性上:数据,模型和应用程序开发。
首先,作为一个大型模型平台,我们必须始终关注用户的需求。用户需要哪种模型?今天,从技术研发的角度来看,模型的边界已经达到,那么我们应该在整个预制模型级别上做什么?
第二个是我们需要在数据工具上努力工作。结合大型模型应用程序,企业需要什么样的数据功能?今天,我们将讨论需要在应用程序开发中进行预培训,微调和建立应用知识基础的模型。实际上,这些需要在实施企业期间支持数据工具,因此数据工具必须是Qianfan,并且需要大力开发它们。要做的事情。
第三是模型类型工具。如前所述,该模型越大,更高级的模型并不是更适合应用程序实现的模型。这种类型的工具实际上有两个目标。一种是降低开发阈值,并使用户越来越降低其开发和构建应用程序。我们甚至提到在创造性验证阶段,如果您可以清楚地说出您的意图,则可以构建一个应用程序。第二个是建立一个真正的企业级应用程序,这不仅是降低阈值的问题,而且还涉及各种调整策略和实施。
Xie guangjun:至于我们现在不做的事情,Qianfan平台将无法提供应用程序。我们仍然希望开发人员可以使用我们平台的功能来更好地构建自己的应用程序,并且该应用程序确实可以实现。实际上,这里有很多有关工具和数据的信息,以及模型级别的恒定迭代和支持。这是我们为自己设定的边界。
本文由佚名发布,不代表阿卡索英语培训 - 英语一对一线上外教培训!立场,转载联系作者并注明出处:/peixun/21127.html