王小川:中国大模型第一梯队不超过5家,我们会是其中之一

更新时间:2023-10-19 08:08:58作者:无忧百科

王小川:中国大模型第一梯队不超过5家,我们会是其中之一


经济观察报 记者 陈白 任晓宁 陈奇杰 坐在我们面前的王小川,最新身份是百川智能的创始人、CEO。当然在此之前,熟悉中国互联网公司历史的人早就已经对他的名字耳熟能详了。创立并数度拯救搜狗的人、在张朝阳之外搜狐最亮眼的那颗明星。

不过这一次,王小川看起来是要与过去告别。“不想再做跟随者了。”这是在我们的采访中他会反复提及的话,这句话的主语,有时候是他自己,有时候是百川智能,有时候是整个中国AI产业。

九月的午后北京已有凉意,但百川智能位于中关村的这间会议室里阳光充足,让人感觉仿佛仍身处夏天。从2023年初发轫并席卷全球的生成式AI浪潮在经历了过去一个春夏的发酵之后,许多人认为最初的热度正在过去,这是因为人们最初以为的颠覆时刻,似乎并没有真正意义上到来。

但王小川对此依然保有信心,“到今天我们已经有底了。”这是他对百川智能这家成立时间不到一年的公司目前状态的总结。

10月17日,百川智能宣布完成A1轮战略融资,融资金额3亿美元,阿里、腾讯、小米等科技巨头及多家投资机构均参投了本轮融资。加上天使轮的5000万美元,百川智能融资金额已达3.5亿美元。

过去将近一年时间里,百模大战在中国互联网与科技圈子中风起云涌,王小川依然是其中最为耀眼的新星之一。他创立的百川智能在一众互联网大厂光环之下依然获得了镁光灯的照射,资本同样展示了他们的信任。

但应用端来看,王小川和他带领的百川,甚至是整个生成式AI产业在经历了将近一年的热情高涨之后,他们都在试图解答同一个问题:到底如何实现大规模商用?

这一次,不做跟随者

王小川并不是一个攻击性强的人。他回答很快、简明扼要,几乎没有多余的话。

在王小川这里听不到什么所谓的互联网大厂黑话,也没有熟悉的话术与太极,他简直就像是一串0101的代码组合一样,非常直接的给出是与否的答案,此外别无废话。

这位天才少年在过往历史上有足够多鲜明的标签:16岁就获得了杨振宁颁发的“亿利达青少年发明奖”,并向副总理进行成果演示,后来又获得了奥数金牌、特招入清华、保送研究生。在之后,他大三兼职就进入陈一舟创办的ChinaRen、开发了搜索引擎“孙悟空搜索”,后来硕士毕业,被张朝阳点招进搜狐。

后来的故事被讲述过很多遍。2004年,王小川领着12位清华奥赛集训队的大学生兼职员工,创立了搜狗中文搜索引擎,并被张朝阳赋予了“拿下中国搜索市场”的使命,他成为搜狐史上最年轻的副总裁;但直到十多年之后,搜狐已经从互联网一流大厂中退位、搜索这一产品类型甚至都已经不再是高速增长的赛道时,搜狗最终没有实现超越百度的梦想。

但这并没有掩盖王小川的光彩,因为在搜狗征途上,无心插柳的搜狗输入法,却在日后成为了搜狗最核心的资产。

王小川的教训是,“这个世界不需要搜狗搜索,但需要搜狗输入法。”

第一梯队、超级应用

在生成式AI赛道上,王小川再一次和百度“狭路相逢”。

2023年4月,沉寂一年多的王小川宣布进入AI大模型领域再次创业,与前搜狗COO茹立云联合成立大语言模型公司百川智能。随后,他拉来原搜狗CMO洪涛,负责百川的商业化,至此,搜狗“三剑客”如今再度在百川聚首。

随后的日子里,王小川和他的百川智能节奏开始越来越快。在成立不到半年的时间内,王小川带领百川智能团队推出了四款开源模型(Baichuan-7B,Baichuan-13B,Baichuan2-7B,Baichuan2-13B)及两款闭源大模型(Baichuan-53B,Baichuan2-53B)。

超出业界预期的是,8月8日发布的Baichuan-53B参数量级达到530亿,如期完成了王小川“在今年三季度发布一款参数量级在500亿以上的大规模产品”的KPI。

早前Baichuan-7B和Baichuan-13B的跑分成绩就曾令圈内人士眼前一亮。在清华大学、上海交大、爱丁堡大学联合创建的评测标准C-Eval 中,Baichuan-7B经过52 个学科的测评,最终获评34.4 分,在同量级产品中排名第一。

4月份在接受采访时,王小川透露到月底团队成员将达到50人。而截至目前,百川智能的员工规模已经超过170人。其中,技术人员的比例占70%-80%。

一切都在按照王小川的计划进行。

这一次,王小川的目标已经不止于国内。在谈话中,他更多地谈及了和全球人工智能产业的技术路径选择、大模型能力的对比。

相比一些大模型还在试图追赶ChatGPT的参数,王小川对于中美之间的差距能看出来非常坦然,尽管在技术能力上我们可能有差距,但在应用层面,在王小川看来,中国AI应用未必会是跟随者。

王小川提到,美国闭源大模型的头部格局几乎已经确定,比如OpenAI、Anthropic的Claude,Google也拿到门票,已经没有太多悬念,投资人也不会再投。

但中国的情况不一样,面对轰轰烈烈的“百模大战”,王小川认为,钱当然是重要的,但最终决定的力量还是人和团队、组织能力。“大厂钱多、人多、算力多,但组织效率通常不一定够好,创业公司的组织效率可能好、也可能不好。”

此前他在接受媒体采访时提到,“中国谁做了最好的大模型,还没有结论,大家都在争取机会,而且不一定落在大厂里。”

我们见到王小川时,他看起来更有信心,在他看来,百模大战的第一梯队已经很清楚了,“第一梯队最后可能不超过5家,比如‘大厂’会有三家;然后两家创业公司,这其中有一家会是百川。”

丨对话丨

快与慢

经济观察报:百川智能用4个月,就做了3个大模型,然后又用1个多月全部升级成Baichuan 2,这一速度在你的预期内吗?

王小川:超出预期了,但也不是特别意料之外。并不是说,模型研发速度超出我的预期。之前4月份我们定的是三季度发500亿参数,四季度发1000亿。这些都是在我们的能力范围之内。我的超预期之处,是产出速度。在预期的主线之外,后来还能够有更多产出。

其实对于我来说,在刚开始下场的时候,团队和组织之间还有很多要磨合,所以其实当时制定目标的时候会相对保守一些。

对于百川来说,我始终认为我们的优势是,搜索团队其实是非常适合做大模型的。但后来我发现,在跟行业沟通的时候,其实大家反而特别没有共识,甚至有一种观点会认为,做搜索是落后于当下的、甚至不太会变通的,这实际上是对搜索技术整体不够了解。所以我们在技术层面上已经超过了市场最初的理解,最后结果也证明,我们是对的。

经济观察报:6月份的时候百川推出了第一个大模型Baichuan-7B,当时你的想法是什么?

王小川:我很受鼓舞。这事很重要,否则等你Q3把500亿拿出来,时间会很长,也不知道做得怎么样。Baichuan-7B放到市面上时,已经明显不差于LLaMA1的水平了,是很好的一个成绩。

但市场那会还不懂怎么评价模型。打个比方,毛坯房和精装房,毛坯房其实才是真正可用的。毛坯拿了之后,每个人可以装成自己的样子,而精装房一套样板间其实拿来还得改。我们放的是毛坯房,但市面上很多人不懂,把它当成精装房去测,自然效果不好。一方面有人觉得百川太快了不真实,一方面效果觉得不理想。

到七月份我们吸取教训,放了两个模型,Baichuan-13B-Base和Baichuan-13B-Chat,就是对齐过后的模型,市场一下就接受了。这两个模型已经能够到达80分水平,升级到Baichuan 2之后的版本,我觉得都在90分的水平了,而且模型能力明显超过LLaMA。到Baichuan2-53B的时候,已经代表现在国内大模型最高水准,大家可以去对比了。

经济观察报:90分到100分,其中差的10分是什么?

王小川:主要是在逻辑数学上与ChatGPT还是有巨大距离。另外,GPT-4V发布,已经带有视觉和声音了。我们离美国的水准还是有很大差距的。

经济观察报:速度这么快,你会焦虑吗?

王小川:我们到目前为止还挺好的。以前有过焦虑,但在百川我心态是很平和的,虽然我们做事情的速度很快,但我的心态是这一次要慢慢做。所以我现在并不焦虑。

经济观察报:你怎么看待从百川到整个国内大模型的快慢节奏?

王小川:我是比较乐观的,我认为现在百川基本上有底了。在GPT-3.5这个水平上,若干家公司大厂都有机会做到,这个时间不会太长,应该在年底左右或者再慢一点就能到3.5。所以技术上的差距和鸿沟,已经不再那么明显。我们会看2023年初、1月、2月的时候,ChatGPT突然出现,大家当时是比较茫然的。

接下来怎么做GPT-4,大家还是觉得有距离。

所以不止是百川,我觉得整个国内的生成式AI和大模型还需要很多的探索。而且更有压力的是,美国这次也非常卷,以前我们能够看到,美国的模式是一家公司做某类东西,别的公司一般是不会跟的、或者做差异化。但这一次不一样,从 OpenAI、Anthropic、Inflection等公司都在往前去卷。整体能力来讲的话,我认为比国内还是领先一个身位,我们依然处于跟随位置。

在这种情况下赶差距,可能更现实一点的方案是,聚焦在已经看得见摸得着的东西,而不是谈看不见的未来超越,我想这件事情过于乐观,而且也不太可验证。

恐惧与信仰

经济观察报:前几年许多人一直认为中国科技和互联网产业处于领先位置。但ChatGPT的到来确实造成了震撼,你作为当年第一批举起AI旗帜的人之一,如何看待这种落差?

王小川:其实在Alpha Go的出现之后,大家已经有了很多这种类型的讨论。从我个人来说,当时已经对于对方的人才密度、领先的创新文化和机制,在我自己心底是有一种恐惧感的。但那时候大家讨论的主流声音,都觉得数据为王、有数据就能做AI,尤其做应用会带来很多数据,觉得跟美国的距离没到那么大,但其实我们并没有回答的问题是,顶尖人才到底处于什么位置。

从2021年到2023年之间,打个比方,我能够感觉到零散地天上有掉大模型这类的雨点下来,但并没有关心这些事情。直到2023年用ChatGPT之后,才知道一定要下雨了。在那个时候,虽然雨滴得更大了,但其实好多人还是在质疑这件事情。

所以我认为我不是第一个看到雨滴的人,但是反应过来下雨了,我是第一批。

经济观察报:如何克服你提到的这种“恐惧感”?

王小川:我觉得很震撼,我们的差距在哪里?我觉得在于他们投入和发现未知和新突破技术的来源是出于好奇心,他们拿大资源砸进去做创新的事情的动因往往是好奇心而不是其他,这样的勇气在国内是少见的。

所以对于我自己来说,我对自己说你要做一件对世界有用的事情,我希望把这个变成第一个关键词;而不是说只是别人做成的事,我们在里面去follow、去跟随。

自从2021年搜狗卖给腾讯之后,我关心的事从语言开始,走向对于生命的理解,我的整个心思是在怎么建造生命的数学模型上。我原来做过的一个方向是基因测序,第二段做搜狗,其实关心的事情就是语言。做语言之后,我认为要想取得突破是一件困难的事情,所以才继续开始去尝试理解生命的数学模型。那时在机器语言上面的进展,就没有在我心里面起太多波澜。

现在看起来,生命的突破比语言的突破更晚。因此我就想到,语言突破之后,对于理解生命怎么突破是有帮助的,要研究生命,不能跨越式把语言放掉。所以我决定在生命医学整个大的研究里面,要先把语言这个老本行,这已经被拖的事捡起来。

看见与突破

经济观察报:2023年4月选择下场,是突然的决定吗?

王小川:不是的,我其实在2月份就已经想好了,决定下场。那时候第一件事是先把技术吃透,想明白到底要做什么样的产品。第二件事,是把团队组起来。我4月10日说下场的时候,团队已经有雏形了,怎么想这事、做什么事情,也都想得比较清楚了。

4月10号我下场是官宣写了一封邮件,当时那封邮件,其实不只有理想主义对未来的畅想,对大模型跟我们过去经历的关系,以及对当下什么状态,未来做什么事情,里面都有很完整的表达。

前几天我们开战略复盘会的时候,看到原来那封邮件,我自己还挺感动的。

经济观察报:你对百川的期待或者说目标是什么,会做的比搜狗更成功吗?

王小川:我有时候会调侃,这个世界并不需要搜狗搜索,但世界需要搜狗输入法。但做成搜狗输入法,对我们来讲,投入的精力是远远小于对搜狗搜索的。所以接下来,我们希望做有用的事情,而不只是跟随着做别人做成熟的事。这一点从大模型的未来路径上我觉得也是通的,现在跟随OpenAI确实有用,但需要有更多的创意突破。就像输入法一样,代表了一种对未来的理解。

经济观察报:百川也会如同当年搜狗输入法那样,推出面向C端的超级应用产品吗?

王小川:对,百川会做超级应用。实际上,我们中间提出了百川接下来会做医疗赛道。医疗健康是大家都关心的事,但今天都处于医生不足且对医学的认知还非常不足的状况。对于生命科学的研究一直也是我感兴趣的方向。因此我认为,一个同时能对医学、生命有更多理解的应用,会非常有意义。

版权声明:以上内容为《经济观察报》社原创作品,版权归《经济观察报》社所有。未经《经济观察报》社授权,严禁转载或镜像,否则将依法追究相关行为主体的法律责任。版权合作请致电:【010-60910566-1260】。


陈白经济观察报记者

经济观察报商业评论主笔