刚刚!鸿海集团回应被调查:在积极应对之中,尚无明确结果
2023-11-14
更新时间:2023-11-14 20:38:25作者:无忧百科
国产大模型阵营再添一员。
11月14日,阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型。据悉,该大模型将应用于通用搜索、医疗健康、教育学习、职场办公等众多场景,夸克App也将借助自研大模型进行全面升级。
资料显示,在一项检测大模型中文能力的测试中,夸克大模型拿到第一。
考虑到夸克大模型目前仍未上线。其实际表现如何,未来有待各界检验。
据Github网站介绍,CMMLU是一个综合性的中文评估基准,它专门用于评估语言模型在中文语境下的知识和推理能力。“CMMLU中的许多任务具有中国特定的答案,可能在其他地区或语言中并不普遍适用。”
资料显示,CMMLU涵盖了从基础学科知识到高级专业水平能力的67个主题。其中包括需要计算和推理的自然科学,需要知识的人文科学和社会科学,以及需要生活常识的中国驾驶规则等。
Github网站截图
观察者网发现,在CMMLU最新的zero-shot测试中,夸克大模型在“未开放测试组”中均分位列第一。
相关网站截图
同为zero-shot测试,“XuanYuan-70B”模型则在“开放测试组”中获得了均分第一名。
何为Zero-shot?
有业内人士对观察者网表示,Zero-shot(零次训练)是指模型在测试阶段没有接触过与具体任务相关的训练数据的情况下进行预测和推理。换句话说,模型在没有进行过与特定任务相关的训练的情况下,通过利用其在其他任务上的训练经验,来解决新的任务。
另一个时常出现的是Five-shot(五次训练):模型只能接触到非常有限的数据,然后通过这五个样本来进行预测和推理。
“Five-shot和zero-shot是指在机器学习和自然语言处理中用于描述模型训练和测试的方式。这两个术语常常用于描述模型在小样本学习,比如少样本学习、元学习等等,以及迁移学习中的性能。”该人士表示,在这些情况下,模型需要具备较强的泛化能力,能够从非常有限的数据或没有具体任务相关数据的情况下,进行准确的预测和推理。
资料显示,夸克大模型是基于Transformer架构、自主研发的多模态大模型,每天会对亿级的图文数据进行训练和精调,具有低成本、高响应、综合能力强等特点。同时,夸克大模型还将衍生出通识、医疗、教育等垂类模型,可以提供AIGC、智能检索的专业服务。
据悉,夸克大模型将会优先落地在通识问答、专业搜索等信息服务领域,满足年轻人学习知识和提升自我的需求。未来,夸克大模型应用于搜索、智能工具和资产管理助手等场景,一系列AI原生应用将为年轻人工作、学习、生活提供更全面的服务。
“AI时代已经来临,大模型应用的全新体验临界点近在咫尺。”阿里巴巴智能信息事业群总裁吴嘉表示,基于大模型的AIGC技术将会给搜索产品带来全新变化,加速迈向下一代搜索。夸克借助自研大模型将全面升级,全新的夸克很快会和大家见面。
本文系观察者网独家稿件,未经授权,不得转载。