吴恩达预言成真?这群AI「员工」狂卷KPI

更新时间:2024-04-13 01:57:19作者:无忧百科

吴恩达预言成真?这群AI「员工」狂卷KPI


新智元报道

编辑:编辑部

【新智元导读】吴恩达认为,或许我们凭着GPT-4智能体,早已达到GPT-5。今天,他的话果然言灵了。

最近,一大波智能体的应用诞生,让全行业看到了「新大陆」。

号称世界首个AI工程师Devin,7×24小时不限时打工,能够debug、训模型、构建部署应用程序,胜任各种代码任务。

几天前的谷歌Next大会上,还发布了「智能体构建器」,可以让每个人能够用自然语言构建自己的Agent。


不难看出,智能体不仅将会成为人人可触及的一项技术,而且各行各业都将被不断升级迭代的智能体重塑。

甚至,这场AI技术+场景的爆发,还会诞生出一些「前无古人」的东西。

用大模型+智能体,对抗汽车行业内卷

如今的汽车行业,已经卷到超乎想象的程度。

用户需求的多样化,愈发丰富的触点,都需要业内人士时时翻出创新的水花。

幸运的是,飞速发展的LLM,让任何全新的视角都有了可能。


就拿一辆车的获客场景来说吧。

如今的新媒体,已经成为营销过程中的重要一环。

谁能拥有优质内容,就会拥有最大的曝光度,完成奇迹般的获客KPI。

要知道,传统的4S店,并没有专业的创意内容生产团队,视频制作、账号运营,经常都是销售人员和市场经理兼职完成,效率非常低下。

而这时,就需要非常擅长输出高质量视频、图文、海报的AI登场了!


为此,易慧智能联合推出提出了一个全新的群体智能组织孪生方案。

人类主管来定目标、审结果,而其余的活儿,包括任务分解、任务执行、任务复盘,都可以通通交给智能体!


比如,现在我们要为一个账户定个KPI:一周内涨粉500人。

目标输入系统后,智能体们就开始忙活了。


第一步,运营经理Agent会给自己的AI「同事」们进行任务拆解——

1. 我们本周需要策划2场直播,把品牌信息传播出去,还要和用户好好互动。

2. 我们需要在抖音、快手、小红书发布5个短视频,提升品牌影响力。

3. 还要保持平台账号的活跃度,及时回复用户评论,增加他们的参与感。


「领命」后,文案策划师Agent和海报设计师Agent,会基于品牌价值观,制作出吸引眼球的文案和海报,同时还会负责传递和交付。

随后,运营专员Agent,就会把内容分发至各个平台了。


在这个过程中,唯一涉及人类的环节,就是市场部经理需要对内容进行人工确认,确保品牌形象的一致性和专业性。

活动结束后,运营经理Agent还会整体来个复盘。它会仔细分析数据,确保创意能带来实际的营销效果,为后续的内容和用户运营提供数据支持。


吴恩达看好的智能体,或许已实现GPT-5

说到智能体,就不得不提到AI大牛吴恩达,最近可谓是多次公开表示非常看好它们的发展:

AI Agent工作流将在今年取得重大进步,甚至可能超越下一代「基础模型」。


他发现,基于GPT-3.5的智能体工作流在应用中,实力超越了GPT-4。

也就是,可能我们早就提前到达了GPT-5,因为在GPT-4之上构建的智能体可以实现性能跃阶。


能够取得碾压大模型惊艳效果的智能体,有四种常见的设计模式,即自我反思、工具使用、规划,以及多智能体协作。


智能体关键组件框架|来源:OpenAI科学家Lilian Wang

大模型群体智能

其中的多智能体协作,其实对我们来说并不陌生。

比如斯坦福西部小镇SmallVille,就是基于层次规划的智能体社会小镇,来实现对人类社群行为的可信模拟。

除此之外,清华自然语言处理实验室和面壁智能共同提出的ChatDev,则是基于语言交互的智能体软件开发,实现群体交互协作式任务完成。


对此,吴恩达表示:「让多个协作智能体辩论协作,要比单独使用一个智能体,可以取得更好的性能。」


不仅如此,大量的研究和实践也提到,多个智能体之间可以通过彼此交流、分享信息和策略,甚至进行「辩论」来找到更优、更有效的解决方案。

如今,一场大模型+智能体应用狂潮,即将在汽车这一垂直领域中率先爆发。

车企大模型落地新范式:组织孪生

2023年,易慧智能在走访调研了大量汽车客户后,发现了诸多痛点。比如,行业竞争白热化,降本增效压力巨大;用户媒介触点多样化;购买周期长期化等等。

与此同时,想要在这一领域直接落地传统的大模型应用,则不得不面对信息孤岛、流程复杂、成本控制和市场响应速度等难题。

而前文提到的「群体智能」,恰恰可以利用自身强大的智能协作和信息共享能力,来解决这些问题。


如今,一种基于AI Agent和群体智能技术的全新范式——「组织孪生」正在诞生。

它以数字创新为核心技术框架,主要包含了三个部分:岗位孪生、架构孪生、业务孪生。

更直白地讲,智能体贯穿到了企业整个组织工作流中。


岗位孪生

其中,数字员工是岗位孪生最直接的表现形式。

数字员工可以直接应用到行业链中,比如常见的客户服务、电话销售等等。

利用LLM创建的数字员工,能够模拟真人的交流方式,不仅包括声音、表情,还具备了高情商的智能。

我们都知道,数字员工最大的亮点便是,「工作」不限地点时间,7×24全天候提供及时、高效的服务。

凭借智能体技术,数字虚拟人可以持续学习和进化,能够具备执行任务深度反思的能力,实现在技术和服务水平上不断提升。

除此以外,数字员工可以根据企业需求,进行个性化高度定制。

架构孪生

如上,岗位孪生可以简单理解为,智能体个体在执行自己流程中的任务。

但是,如同人类协作一样,有些任务非一己之力所为,而是需要群体智能体去完成。

这时候,「架构孪生」就上场了。


它是指将真实世界中的组织架构映射到数字世界中,通过智能体网络技术定义智能体间的交流和逻辑。

举个简单例子,清华自然语言处理实验室和面壁智能联合开发的智能体平台AgentVerse中,就可以利用基础模型定制多智能体环境,以及创建刚刚提到的这些具有不同能力与身份的智能体。

其中,协同决策是最重要的一环,需要智能体之间密切交流。

AgentVerse横向沟通模型侧重的是智能体之间相互理解和协作,而纵向沟通更侧重于职责分工。

而基于易慧智能的每个单独场景,智能体之间可以实现横向和纵向沟通。


业务孪生

此外,在汽车行业中,真实的业务流程非常复杂。

就拿出差任务来说,从申请、行程安排、车票酒店预订,到事后报销等等,都需要调配大量人力物力资源。

通过整合大模型、搜索增强(RAG)、智能体构建等技术,业务孪生可实现自动执行任务,优化执行效果。

举个例子,面壁智能的AI智能体框架XAgent创新性引入了「双循环机制」。

在外循环中,XAgent对任务进行规划,在内循环,它便成为任务高效执行者。


另外,XAgent在设计过程中,还引入了专为增强人机协作的交互机制。

可见,这一框架能够为复杂的行业场景,提供一个全新数字化工作和管理方式。

LLM群体智能赋能汽车行业

有了组织孪生新范式,LLM群体智能究竟如何在汽车行业应用中发挥最大效益?

不如就拿车企营销中五大核心场景来举例。

营销五大场景

作为消费领域超级大单品,汽车的营销有着其它消费品难以企及的销售难度和销售周期。

汽车销售中最具独特地方在于,高客单价、低成交率,以及长销售生命周期。

目前,为了应对营销场景中许多困难,提高销量,汽车营销场景也积累了一套标准化、全闭环的方法论。


针对汽车营销环节长久积累的应用实践痛点,以及结合对智能体应用落地的独到理解,易慧智能基于汽车营销的核心场景增长需求,联合推出了五大场景营销解决方案。

它们分别是数智研究院场景解决方案、新媒体运营场景解决方案、用户运营场景解决方案、集约DDC场景解决方案、與情运营场景解决方案。

并且,通过群体智能技术实现汽车营销业务的组织孪生,提高行业效能。


- 集约DDC场景解决方案

汽车营销中,常见的一种模式是DCC,也就是外呼邀约客户。

它对外呼专员的工作繁琐程度、沟通能力要求多且繁杂,成为制约获客转化效率的痛点和难点。

通过对呼叫中心客服进行的组织孪生,利用LLM可以提供及时反馈能力,提升转化效率。


- 用户运营场景解决方案

同时,培育和孵化潜在客户也是一个复杂,但至关重要的环节。

利用群体智能体,可以极大地释放销售人员的客户培育的压力,提高了销售环节转换效率。

比如,在新客孵化过程中,客户分析智能体可以对客户信息的要素进行更加细致地筛选,最终产出值得孵化的客户名单。


- 数智研究院场景解决方案

消费者需求分析,竞品分析报告对于改善运营效率,优化销售和售后流程有着重要的意义。

这时据数智研究院,便可以代替人类去完成某些繁琐任务。

其间,智能体会自动收集全网数据,并对数据进行高效治理和分析,大幅缩短报告生成时间,提高了时效性和准确性。


- 舆情运营场景解决方案

除此以外,舆情对品牌形象和产品销售有着重要的影响。

有了群体智能体,一旦检测到潜在负面舆情,数字员工会直接拉群,立即通知其他员工,一起协作完成难题。

这样一来,群体智能体赋能了汽车行业中完整的营销场景,可以大大实现企业的降本增效。


智能体生态建设

但若要汽车行业实现智能最大化,仅靠一个企业是无法完成的,而需要多方团结协作。

也就是说,我们需要搭建一个「群体智能协作平台」。

这是汽车行业实现「组织孪生」的载体。

其将通用大模型、行业工具、行业解决方案、行业数据伙伴串联在一起,实现技术和能力互补。


那么,在这个群体智能体生态中,车企们如何去选择通用大模型,获取行业数据,如何应用行业工具?

当前,通用大模型遍地都是,难就难在该用哪个?哪个适合自己?

对于企业来说,选择大模型往往需要考虑以下一些因素,包括能否匹配特定需求,集成和兼容问题,成本效率,定制化和可扩展能力等等。

选好大模型,下一个问题便是数据处理和获取问题。

汽车行业中,制造商、供应商、维修服务商之间数据共享不足,导致无法形成完整的数据周期。


甚至,数据的准确性、合规性、隐私性都是亟待解决的问题。

此外,接入行业工具是群体智能技术最重要的一个环节。

汽车行业中的技术工具依然存在API开放性差、安全性差等问题。对此,急需建立一个完善的API开放机制,以及使用规范。

除了技术项的问题,还需要企业对汽车行业业务流程市场环境,以及客户需求有着深入分析。

若想攻克这些难题,实现汽车行业的组织孪生,需要全体生态伙伴不断进步与持续合作。

三巨头强强联合

有了以上对汽车行业的深刻洞察,清华自然语言处理实验室、易慧智能、面壁智能三方共同发布了《大模型驱动的汽车行业群体智能技术白皮书》,受到业内广泛关注。

有趣的是,不仅易慧智能总裁李伟毕业于清华大学自然语言处理实验室,在智能体技术领先的面壁智能也正是由清华孵化的AI公司。作为国内最早研究NLP和大模型的研究团队之一,它的影响力可见一斑。

与此同时,他们在理论和实践上也正巧能力互补。

清华自然语言处理实验室希望进行技术转化;面壁希望大模型和智能体的方案进入更多行业;易慧智能则希望技术与行业场景结合,产生更多客户价值。

于是,一拍即合,决定开启合作。


由此缔造的大模型驱动群体智能协同工作平台,无疑会将企业级AI应用和生态建设带到新的水平,帮企业智能化升级最后一公里。

在这个过程中,三方也是携手攻克了重重难关。

最显而易见的一个难题就是:大模型的幻觉问题,在智能体的应用实践中该怎样避免呢?


来自:「Siren’s Song in the AI Ocean: A Survey on Hallucination in Large Language Models」

攻克重重难关

这个问题难以避免,但还是有对应的解决之道。

在这方面,清华大学教授刘知远和面壁智能联创李大海都有着丰富的经验。

首先是从模型自身的层面:

比如可以通过预训练和微调,来给模型注入领域知识,从而进行控制。

其次是在Agent的设计上:

  1. 在调用工具时,如果发现API或URL是来自幻觉,就中断执行;

  2. 设计反思机制,让模型根据出错的信息自行修正结果;

  3. 借助外部知识,通过搜索引擎或知识库,引入正确的上下文。


当然,具体落地过程中,还会有其他问题。

如果智能体之间依赖自然语言交互,交互过程就容易失控,这时就需要设计协议或给定workflow,通过Function call等方式指定输出形式。

多智能体系统成本太高,太耗费token怎么办呢?


这时,就需要综合比较workflow设计的灵活性、RAG还是微调模型、各个环节采用什么模型,并且在工程和推理中有更多策略设计。

此外,由于目前的大模型还是黑箱,最终效果难以达到预期时,还需要从算法策略上来调优,而这,就到了考验团队能力和沉淀经验的时候。

业内首份白皮书重磅发布

如今白皮书的发布,对汽车产业的智能化进程,无疑具有重大的指导价值。

对学界而言,白皮书对「大语言模型」「单体智能」「群体智能」等关键技术专题进行了深入、系统的总结和梳理,并且做了案例分析,将对相关研究提供有益参考。

它总结和展望了大模型群体智能在汽车营销领域的应用,这将对汽车行业的智能化转型意义深远。

对于业界而言,它更是首次提出了汽车营销领域的AgentVerse群体智能协同框架。从此,大模型场景化落地便有了标杆。

而这种「人机协作」的新理念,也将人的创意与大模型结合了起来。


对此,三方也非常期待,通过白皮书与业界同仁共同探索和实践,将大模型群体智能的潜力转为现实。

清华大学刘知远教授认为,「我们正步入一个由大模型驱动的「Internet of Agents」智联网时代」。通过白皮书,LLM群体智能的潜力将转化成现实,一同推动汽车行业迎接智能化的挑战和机遇。

面壁智能联创李大海同样看好三方的协力合作:「通过打造的智能体协同平台,为车企们提供群体智能与组织孪生的一站式解决方案」。

在易慧智能总裁李伟的畅想中,在20年后,自动驾驶一定已经走入我们的生活,我们的出行不再需要司机,而是虚拟个人助理和虚拟数字员工团队。

而100年后的某一天,我们大概已经进入「虚拟时代」。那时的人们不会再依赖于出行,而是「身未动,心已远」。

白皮书下载方式:关注「易慧智能」,并回复「白皮书」即可