专访维基媒体基金会CTO:在人工智能时代,人类贡献者仍然很重要

更新时间:2024-02-29 23:55:58作者:无忧百科

专访维基媒体基金会CTO:在人工智能时代,人类贡献者仍然很重要

赛琳娜·德克尔曼(Selena Deckelmann) 从不害怕互联网上的人。她的祖父是一名电视修理工和无线电台爱好者,继父是一名管道安装工,她从小就学会了如何通过聊天和动手来解决任何问题。

因此,当大学时期的德克尔曼接触到了 Linux(最早的开源操作系统之一)之后,网络社区让她感到非常亲切。

令人兴奋的新技术刺激了德克尔曼,她将自己的专业从化学改为了计算机科学。


(来源:DINA ÁVILA)

德克尔曼在开源技术领域的职业生涯已近三十年,现在是维基媒体基金会的首席产品和技术官 (CPTO,chief product and technology officer)。该基金会是负责管理维基百科的非营利组织。

在工作中,她不仅为世界上最受重视的信息来源之一提供指导,而且还为庞大的“维基百科网络社区”提供服务。

这个社区有数十万人,他们来自全球各地,利用业余时间撰写、编辑和讨论维基百科条目。正是因为这些人的存在,才造就了如今拥有超过 300 种语言版本的维基百科。

不可否认,多年来的技术进步和文化转变已经改变了我们的网络世界,尤其是最近人工智能生成的内容激增,但德克尔曼仍然不害怕互联网上的人。她相信,人工智能和它生成的内容才是互联网的未来。

2022 年夏天,当德克尔曼担任新设立的首席产品和技术官时,她并不知道几个月后,创造生成式人工智能的竞赛将以惊人的速度开始。

随着 OpenAI 的 ChatGPT 和其他大型语言模型的发布,以及随之而来的数十亿美元的融资,2023 年成为了“聊天机器人”元年。

由于这些模型需要大量廉价(最好是免费)的内容才能发挥作用,因此维基百科的数千万篇文章成为了丰富的“养料”。

很显然,聊天机器人和它们的构建者希望通过维基百科来增强自己的知识库。23 年来,维基百科已成为最值得信赖的信息来源之一,而且它是完全免费的,这要归功于该网站的开源使命和基金会的支持。

但随着人工智能生成的文本和图像激增,错误信息和虚假信息层出不穷,引发的问题日益严峻,德克尔曼必须解决维基百科产品和社区面对的一个生存问题:该网站的开源精神如何在即将到来的内容洪流中生存下来?

德克尔曼认为,随着在网上越来越难找到细致而深入的人类视角,维基百科将成为更有价值的资源。

但实现这一承诺需要持续保存和维护维基百科的“跳动之心”:维基百科人自愿投入时间和精力,通过传统的对话和小修小补来保持上面的信息处于最新状态。

德克尔曼和她的团队致力于制定一项人工智能战略,优先为贡献者、编辑和版主构建工具,使他们的工作更快、更轻松,同时根据社区的持续反馈运行平台外人工智能实验。

“我的职责是将注意力集中在可持续发展和人身上。”德克尔曼说,“当我们尝试一些很酷的技术时,我们如何真正让人们的生活变得更好?”

德克尔曼所说的“可持续性”是整个开源领域面临的一个紧迫的问题。当复杂的服务或像维基百科这样的整个平台,几乎完全依赖于志愿者的时间和(无偿)劳动时,贡献者可能无法获得他们继续下去所需的动力和支持,难以维持这些项目的运转。

多年来,德克尔曼的个人追求一直围绕“为互联网建造者寻找和建立可持续的道路”展开。

除了在英特尔和 Mozilla 等公司担任工程和产品负责人并亲自为开源项目做出贡献外,她还创立和运营了多个组织和会议。

这些组织和会议支持开源社区,并为来自代表性不足群体的贡献者敞开大门。

“她总是把社区放在第一位,即使社区里到处都是糟糕的人,他们让很多工作变得困难。”

瓦莱丽·奥罗拉(Valerie Aurora)是 Ada Initiative 的联合创始人,她说这是一个前非营利性组织,致力于支持开源技术领域的女性。德克尔曼是其董事会和顾问委员会成员。

想要同时满足社区的需求和组织的优先事项,这种平衡可能很难实现,而这正是开源理念的核心。

在维基媒体基金会,从产品的长期方向到几十年来首次重新设计的细节,一切都是公开的,所有的反馈都来自于维基百科庞大而直言不讳的社区。

今天,德克尔曼在人工智能开发中发现了一个新的可持续性问题:训练模型的主要方法是从维基百科等网站中提取内容,这些内容通常由开源创作者生成,而这些人没有报酬,有时甚至不知道他们的工作将如何被使用。

她警告说:“如果人们不再有动力在网上贡献内容,要么是因为他们认为这些模型没有给出任何回馈,要么是因为它们只为极少数人创造了很多价值,那么这也是不可持续的。”

在维基百科,德克尔曼的内部人工智能策略着重于用技术支持贡献者,而不是让他们失望。

机器学习和产品团队正在努力推出新功能,例如,在 wiki 的“讨论”页面上自动总结冗长的辩论(一些古老的讨论页面甚至可以追溯到 20 年前),或者在编辑者更新页面时建议相关链接。

“我们正在寻找新的方法,通过总结文本、检测故意破坏或回应不同类型的威胁,为开源社区的志愿者节省大量时间。”她说。

但产品和工程团队也在为未来可能发生的其他事情做准备。鉴于目前的趋势,维基百科可能需要以其他的方式与网友互动。

尽管随着 ChatGPT 的迅速崛起,维基百科的流量没有发生太大变化,但由于谷歌搜索的不断更新和在线行为的代际变化,该网站的访问数量在过去十年中呈下降趋势。

2023 年 7 月,德克尔曼的团队启动了一项人工智能实验,目的之一是探索维基媒体基金会如何将其知识库作为服务提供给其他平台。

他们开发了兼容 ChatGPT 的插件,允许聊天机器人使用和总结维基百科的最新信息,并回答用户的提问。

该实验的结果仍在分析中,但德克尔曼表示,目前还不清楚用户如何(甚至是否希望)在 ChatGPT 平台上与维基百科进行交互。

与此同时,2024 年 2 月,德克尔曼召集了来自开源技术、研究、学术界和工业界的领导者,讨论如何合作和协调解决人工智能带来的重大棘手问题。德克尔曼希望围绕可持续发展展开多次对话和会议,这是第一次。

德克尔曼的产品方法是谨慎和深思熟虑的,并且是深藏于设计之中的。

与科技行业疯狂地利用人工智能炒作形成鲜明对比的是,她的目标是一边让维基百科向前迈进,拥抱历史性的时刻,一边支持使其与众不同的复杂的用户生态系统。

这是一项充满了谦逊色彩的使命,但与她职业生涯中对互联网健康和可持续社区的奉献和支持密切相关。

“维基百科是一件了不起的东西,你一看到它,就可能想在上面留下自己的印记。但我没有。

“她说,“我想帮助维基百科,让它能够走得更远、更久。” 在那之后,她相信富有互联网精神的人们会接过她肩上的担子,继续走下去。

作者简介:丽贝卡·阿克曼 (Rebecca Ackermann) 是一位居住在旧金山的作家、设计师和艺术家。

支持:Ren

运营/排版:何晨龙


01/

02/

03/

04/

05/