我们这个重要邻国,最近经历了一次大洗牌
2024-05-19
更新时间:2024-05-19 19:56:48作者:无忧百科
(腾讯集团高级执行副总裁、云与智慧产业事业群CEO 汤道生)
本报(chinatimes.net.cn)记者卢晓 北京报道
无论国内国外,大模型行业近来都十分热闹。相对 OpenAI 和谷歌都还在卷技术,国内大模型厂商们则朝两个不同方向卷了起来。
5月17日,腾讯对外公布了混元大模型的研发及应用落地进展。而在这之前,字节的豆包大模型则以超低价打响了行业价格战。当日,腾讯云副总裁吴运声在接受《华夏时报》等媒体记者采访时表示,“我们会把各种精力放在产品、技术能力发展之上。”
在不同方向背后,随着国内大模型的应用落地越来越多,不止它们的技术进展令外界关注,商业化进展也同样,或者更加受到关注。而大模型厂商们在B端市场的争夺也越发激烈。
混元披露新进展
腾讯云在5月17日举行的生成AI产业应用峰会上披露了混元大模型的最新进展。
据《华夏时报》记者了解,混元大模型也是通过一系列模型家族为不同需求的B端用户服务,包括提供万亿参数的hunyuan-pro、千亿参数的hunyuan-standard、百亿参数的hunyuan-lite等多种尺寸的模型,目前已面向企业及个人开发者全量开放。其中,hunyuan-standard最新上线了支持256k超长上下文窗口的长文模型,具备单次处理超过38万字符的超长文本能力。
腾讯方面提供的数据显示,升级后的腾讯混元,在国内率先采用混合专家模型 (MoE) 结构,模型总体性能相比上一代提升50%,部分中文能力已追平GPT-4,在“时新”问题的回答表现上,数学、推理等能力上均有较大提升。
当天,腾讯云还披露了混元大模型在多模态能力方面的进展。其中,腾讯混元文生图基础架构已升级至Sora同款的DiT架构,支持中英文双语输入及理解,具备多轮绘图能力。此外,腾讯混元还支持图文生视频、视频生视频等多种生成能力,并已经支持 16s 视频生成。
据记者了解,腾讯云是在去年6月首次对外公布了自己的MaaS(模型即服务)解决方案。它当时宣布打造一个覆盖金融、文旅等多个行业的模型商店,在这些行业能力模型基础上,客户加入自己独有的场景数据,就可以快速生成自己的“专属模型”。去年9月,这些行业模型背后的技术底座,腾讯自主研发的通用大语言模型混元对外亮相。据悉,目前混元大模型已经在600多个腾讯内部业务和场景中落地测试。
需要提及的是,5月17日,腾讯集团副总裁蒋杰还宣布,腾讯混元大模型将拥抱开源。他披露,此前混元文生图大模型已全面开源,仅3天时间就在Github上获得超千位开发者关注,多种尺寸的腾讯混元MoE模型也即将对外开源,可分别支持手机端、PC端、云/数据中心等多样化的部署场景。
卷价格还是卷性能
除了技术上的进展,腾讯也透露出自己对B端市场的期待。
腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生在5月17日的发言中称,腾讯混元要构建离产业最近的AI,“大模型的打造只是起点,把技术落地到产业场景,创造价值才是目标”。当天,腾讯云还宣布正式推出生成式AI生态计划,未来将联合千家行业应用厂商,培育千家服务商和万家代理商,共同推动生成式AI技术深入产业全链条,加速产业智能化升级。
但大模型厂商在B端市场竞争已经如火如荼。大家都期待用更低的门槛、更好的应用和更低的价格来吸引中小企业停留在自己的平台上。这其中,价格这个因素在近日更是备受关注。
就在腾讯混元披露最新进展的前两天,字节通过火山引擎发布了豆包大模型。字节并没有披露惊人的技术参数,但它以超级的价格吸引了行业的目光。一个直观例子是,它宣布自己32K主力模型在企业市场的价格,比行业低99.3%。
字节的低价策略让业界惊叹AI大模型行业的价格战要来了。深度科技研究院院长张孝荣认为字节的低价打响了大模型行业价格战的第一枪,但他同时对记者表示,价格战通常发生在技术成熟、竞争激烈的行业。 盘古智库高级研究员江瀚在跟记者交流时也认为,价格战并非总是可行,大模型的研发、训练和应用仍然需要较高的技术和资金门槛,如果厂商在价格战中过度压缩成本,可能会影响产品质量和服务水平,进而影响其市场声誉和长期发展。
对于低价问题,吴运声当日在接受《华夏时报》等媒体记者采访时表示,腾讯混元一直在对外传递自己能力和产品的进展,“我们大量的精力还是在关注怎么样去提高我们底层的大模型能力,包括我们在大模型上怎么能够让用户真的用起来。”
但价格的确是影响大模型普及程度的关键因素之一。吴运声当天表示,为什么腾讯云在去年提行业大模型,是因为通用大模型很大,真正要在行业里面用起来有很多门槛,“客户买不起,买了推理也推理不起,哪怕精调也太贵了。”他还认为,在行业大模型之后,知识引擎将把大模型的应用门槛降得更低。
在谈及大模型的应用困难时吴运声还表示,除了客户业务需求和大模型能力之间的匹配问题外,大模型还面临着实际推进进度和客户需求间节奏不匹配以及安全性等问题,“我们怎么样把技术做的更抽象,能够在各种场景上面适配,这是我们努力做的事情。”
责任编辑:黄兴利 主编:寒丰