支付宝在AI大模型时代

更新时间:2024-02-22 01:55:43作者:无忧百科

支付宝在AI大模型时代

作为亿万用户的“过年搭子”,国民APP支付宝今年凭借多元化、强互动的五福玩法强势出圈。

支付宝发布的数据显示,今年,近6亿人次通过AI科技体验新年味用AI换脸参演《热辣滚烫》等春节档电影、一键生成“会说话”的视频红包,五福热度不减,依然是全民春节必备的仪式感。

春节的支付宝好玩好逛好买,用户们能够顺畅“嗨翻天”,离不开技术团队下的苦功夫。今年的五福节,是首次由AI全面驱动的五福活动,也是支付宝技术团队的又一个“大型战场”。

支付宝CTO陈亮(花名俊义)对此感慨颇深,尽管内部已经有过好几轮演练,但在大模型这样一个“新事物”面前,说不紧张是骗人的。

1月28日,晚上8点,支付宝技术团队所在的蚂蚁空间8号楼已经坐满了人,再过四个小时,五福节就要正式上线了。

俊义已经很久没有这么紧张过,“AI大模型是全新的东西,不像双11已经比较成熟了,(担心)过程中会有各种各样的bug”。

在蚂蚁内部很多人看来,这次五福节带来了久违的“兴奋感”,和头几年备战双11相媲美。充分准备下,五福节经受住了考验。

今年五福期间,近6亿人次通过支付宝推出的AI互动玩法体验新年味。其中,“大家来找福”成为最受欢迎的集福卡方式,共有近30亿个AI生成的福字被用户找到。贾玲新电影《热辣滚烫》换脸片段上线五福“飙戏小剧场”后,一天吸引近百万网友AI“参演”,自发成为电影的“编外宣传员”。


五福节作为一个关键时间点,推动AI在支付宝上规模化落地应用的同时,也推动了支付宝的第二次技术迭代。这也向外界传递出支付宝技术遇山开山、遇水搭桥的决心,以及眼下重投AI的态度。

01.支付宝“AI技术战”

近日Sora的面世,再次印证了人工智能浪潮势不可挡的气势。诚然,在推动生成式AI的技术能力上,美国科技巨头不断取得突破性进展。不过,AI技术能力和AI大规模落地应用的可行性是两回事。两者之间,隔着成本可控、可持续性等必须解决的难题。

在AI规模化落地应用的可行性上,中国互联网公司正在积极探索和验证各种解决方案,支付宝就是其中一个。

俊义举例介绍,杭州亚运,作为亚组委技术支持方,支付宝已经在推动AI规模化落地——全球1亿数字火炬手。背后的数字人技术为蚂蚁自研,这一技术专注数字人建模、渲染、驱动、交互等核心能力,充分结合AIGC与大模型技术,通过AI降低数字人全链路生产成本,目前可支持2D、3D数字人,提供播报型、交互型解决方案。


到了五福节——这个支付宝每年的重头戏,今年多了AI玩法,挑战则继续升级。对于一个用户数量超10 亿的国民APP,春节期间要面对大量用户同时涌入的情况,AI互动更是首次在支付宝大范围亮相。

好在任务圆满完成,2024五福节,在支付宝技术团队的努力下,用户玩得开心之余,还有两个不容易被发现的“隐藏服务”。

首先是智能手机99%全覆盖:Galacean结合端云协同渲染,能做到UI和Canvas互动分离,仅将Canvas互动部分交给云端渲染。这使得11年前的iPhone 5S都可以流畅运行,做到99% 设备支持。

其次是图片流量节省约50%:支付宝客户端推进行业前沿的AVIF图片标准落地,在保证验收通过的前提条件下,压缩率在PNG、WebP 压缩的基础上还能再压50% 以。极大降低用户图片资源的流量消耗,同时降低网络耗时。

谈及这次AI驱动的五福节,俊义最大的成就是“让整个AI在支付宝融入到了日常生活中。”在他看来,AI驱动的五福不管面向to C也好,to内部员工也好,都是解决大规模落地的问题。”

2024支付宝五福节,就是一次AI互动应用集中大规模落地的练兵场,而好士兵从来不打无准备之战。

自2021 年大模型在学界引发震动以来,蚂蚁集团的技术团队就在关注这个领域。2023年11月,蚂蚁集团技术团队训练的蚂蚁百灵大模型通过了备案。

蚂蚁大模型坚持自主研发、全栈布局,目前已形成包括大模型底层基础设施、基础大模型、行业大模型、应用产品在内的完整技术链条。

蚂蚁建设了超过万卡的异构集群,其中硬件算力效率(HFU)超过60%,集群有效训练时长占比90%以上,RLHF训练在同等模型效果下训练吞吐性能相较于业界方案提升3.59倍,推理性能相较于业界方案提升约2倍。

02. 技术团队护航

五福节众多AI小产品的涌现,看上去是娱乐用户,实则是蚂蚁大模型落地的第一次大规模探索。

为了推动AI大规模落地,支付宝技术团队基于基于百灵大模型升级了安全大模型,

“ChatGPT火了以后,从去年开始训练这个模型,支付宝有万卡异构规模GPU集群能力,有硬件和训练能力。”

俊义介绍,AI要实现大规模落地应用,需要解决两个技术性问题,即算力支撑得住、成本可控。

眼下蚂蚁基础大模型平台具备万卡异构集群,其中千卡规模训练MFU可达到40%,集群有效训练时长占比达到90%以上。

数据层面,除了全网通用语料与金融领域的优质语料,蚂蚁还注入了优质的研判分析数据,以及大规模知识工程所带来的超过270亿Token的知识量;模型层面,蚂蚁认为金融专属指令更能够代表大模型,解决特定金融任务的能力,其从真实场景中萃取了超过60万条以上的专属指令。

成本方面,目前,蚂蚁的CPU利用率从2017年的不到10%,提升到了2023年的近40%。

此外,蚂蚁自研代码大模型CodeFuse也帮助支付宝提升可代码开发效率。目前,约50%的蚂蚁程序员在写代码时都用上了CodeFuse,AI生成代码占比超过10%,大大提高了代码开发效率。

算力和成本优势下,支付宝在今年五福节完成了一个挑战,成为第一款亿级用户产品中,第一个推出多人AI人像的。

五福节的时空照相馆可同时支持6人同框,包括单人照、双人照、全家福,一共有近千个关系对。单人、双人、全家福,每个类型下面有5-6个风格模版,每个风格模版有最多10种姿势可选,这就意味着支付宝的后台模版多达近三万张。


作为AI改造支付宝业务的“总指挥”,俊义表示:“支付宝技术发生了一些变化,过去成熟东西依旧在,同时在叠加新的,2024年的五福尤其明显,因为AI驱动应用更多了,等于站在新起点。”

03. 支付宝AI方向是什么?

实际上,这已经是支付宝经历的第二次技术迭代,上一次则要追溯到双11。支付宝的技术淬炼,就是在一个又一个“大型战场”上磨练升级突破的。

作为蚂蚁集团14年的技术老兵,俊义从第一届双11开始,完整经历双11十余年的支付压测与技术保障,他身上的一个大标签就是“双11技术总指挥”。

俊义见证了双11飞速发展的整个过程,也感受到双11影响力带来的巨大挑战,尤其是容量挑战。

2009年,淘宝CEO给当时的支付宝CTO发了个邮件,要做促销活动,俊义说“大家也没当回事,只是觉得量蛮大的”。第二年,双11正式开始后,流量峰值一年比一年离谱,“我都不太信,我们只能竭尽全力去打这些峰值。”

就这样,支付宝的第一次技术迭代被业务需求逼了出来,其中最关键的自研技术有分布式数据库技术(OceanBase)、绿色计算技术(分布式架构)。

目前,OceanBase已服务超过1000家行业客户,其中30%将其应用于核心系统。在金融领域,OceanBase已成为市场占有率第一的分布式数据库。

蚂蚁在使用绿色计算技术之前,全局的算力利用率跟行业平均水平一样,8%。而从2019年投入研发,经过4年时间,现在翻了好几倍,达到了近40%。

在当下AI浪潮中,为了跟上技术周期浪潮的节奏,倒逼自己去解决规模化、商业化落地中不可避免的问题,是行业的共同现状

从蚂蚁内部传递出的信息来看,蚂蚁做大模型第一阶段仍是围绕自身业务,支付宝自身业务从大模型丰富起来,基于通用大模型基础之上,衍生出在医疗场景、遥感领域、民生领域的应用。

AI应用能否大规模落地关系到AI是否能够真正服务社会并走向真正的AGIC时代,抢跑大模型落地已成为行业的默契。面对这个艰巨的行业共同使命,百灵大模型被赋予了全面改造支付宝的应用场景的意义。

但蚂蚁集团对此并不陌生,其自主研发的硬核科技,如分布式数据库、云原生分布式计算架构、智能风控等,一直引领行业的技术方向,也都是被国民级项目倒逼出来。

正如俊义常挂在嘴边的一句话那样,“我们挑战就是源于业务对我们的需求。不是别人不聪明,是因为他们没有遇到这样的挑战。”

支付宝上每一个亿级用户活动,对用户而言是各种买买买和玩玩玩的线上嘉年华,对蚂蚁集团而言,则是一次次逢山开路,遇水搭桥的技术拉练和技术升级。

在用户看不见的地方,AI已经成为切口,一个新的支付宝正在淬炼中。