讯飞版大模型来了！首发通用人工智能评测体系，三大能力不输ChatGPT-花粉乐享

> 乐学堂 > > 讯飞版大模型来了！首发通用人工智能评测体系，三大能力不输ChatGPT

讯飞版大模型来了！首发通用人工智能评测体系，三大能力不输ChatGPT

来源：智东西

2023-05-13 21:12:14

480

管理

智东西

作者 | 程茜

编辑 | 漠影

智东西5月6日报道，今天下午，讯飞星火认知大模型发布，以及大模型在教育、办公、汽车、数字员工行业领域的应用成果同步亮相。

同时，科大讯飞还提出了通用人工智能（AGI）在7大维度481项的评测体系，这七大维度包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。经科大讯飞评测对比，星火认知大模型已经在文本生成、语言理解、数学能力上优于ChatGPT。

讯飞星火大模型采用了“1 N”的整体布局，其中“1”是通用认知智能大模型，包含7大维度的能力，“N”是大模型在教育、办公、汽车、数字员工等多个行业领域的应用。

科大讯飞董事长刘庆峰还透露了星火认知大模型在2023年的关键里程碑，6月9日，星火认知大模型将突破开放式问答，实现多轮对话能力再升级、数学能力再升级；8月15日，突破代码能力、实现多模态交互再升级；10月24日，通用大模型要对标ChatGPT能力，实现中文能力超越、英文能力相当的目标。

此外，在多语言生成中，星火还可以快速生成“英文的讯飞翻译机4.0新品品宣文案”。

刘庆峰说，经过评测，讯飞星火认知大模型的中文语言理解能力已经超过ChatGPT，在英文理解能力上，ChatGPT的能力达到4.48分，星火认知大模型为4.29分。

2、多层次跨语种语言理解

针对英文文案，星火还可以快速对其进行语法检查和纠错。刘庆峰透露，对于英文语法、句式的纠错能力，星火认知大模型已经做到业界最强。

当面对一些模棱两可的话语需要大模型更高层次的理解能力时，星火认知大模型也可以准确剖析其不同含义。如“俗话说男子汉大丈夫要宁死不屈，俗话又说，男子汉大丈夫能屈能伸，这两种说法应该怎么理解”。

刘庆峰谈道，目前在医疗治理方面，科大讯飞智医助理的能力比GPT-4要强很多，但由于医疗领域对专业性的更高要求，这一方面能力的开放需要更加谨慎，将于今年讯飞1024开发者节期间正式发布。讯飞的目标是让星火大模型不仅要成为医生的诊疗助手，还能成为每个人的健康助手。

4、情境式思维链逻辑推理

当提问“孔子在2008年的奥运会上说了什么？”，星火可以快速理解“孔子不可能出现在2008年的奥运会上”。

几何问题中，但问到“等腰三角形的底角是顶角的两倍，这一三角形的角度是多少”，星火给出了下面的答案：

并且，星火还可以化身一个美食助手，可以回答每道菜是什么口味等问题。大模型的加持下，星火可以从简单的文字到文字翻译变为文字到导游角色的升级。

刘庆峰透露，多模态输入和表达目前还没有开放，这一能力将在8月份开放给VIP客户使用。

演示现场还有现场随机抽取问题回答环节，针对于一些奇奇怪怪的问题，星火认知大模型也没有被难到。包括外星人感冒了需要戴口罩吗？我想把四十平的房子装修成七十平的感觉等。

在输出的答案中，星火大模型会对问题场景进行一些限制，考虑到多个场景来使得回答更为准确。刘庆峰说，星火大模型在不断的进步过程中，很多答案也会超出他们的预期。

二、落地四大应用领域，星星之火“燎原”教育、办公、汽车、数字员工

除了强大的通用能力外，星火认知大模型也已经在实实在在的产业场景中实现了应用落地，包括教育、办公、汽车和数字员工四大领域。

1、教育：批改中英文作文能力升级，形成批改、修订、学习闭环

讯飞AI学习机已经可以精准分析每个学生的薄弱环节，并在五万多所中小学校实现应用。此次，星火大模型也再次将学习机的语言学习能力升级。

此前，老师对一个学生的作文进行精批大概要花费半个小时时间，批改完一个班的学生会付出大量的时间成本。

在演示中，星火认知大模型针对小学四年级上册第八单元的作文“我的心儿怦怦跳”的写作要素和写作要求进行批改。

学习机批改的过程包括错别字、语句、内容，最后会生成批改评价以及写作建议，并且用户点击错别字还能看到相应的知识卡片。

批改修订建议还会用不同颜色区分，红色代表不符合某一条写作要求，绿色代表符合写作要求，此外，学习机还给出了优化参考内容。

现场刘庆峰讲述了会议场景下，用户往往有记不全、找不到、对数据安全性担忧几大痛点。智能办公本可以通过语音转文字、字音同步、离线模式录音转写的方式解决上述痛点。

搭载大模型的智能办公本针对上述内容快速生成了会议纪要，不仅包含文本摘要，还结合了用户的手写笔记。

当下，刘庆峰也谈道，纯大模型技术有很多待攻克的技术缺陷，如对新知识难以及时更新、事实类问题容易发生张冠李戴的现象等。

但对于这些，讯飞都有非常明确的解决方案。他透露在科大讯飞成立24周年之际，星火大模型要突破开放式问答，类搜索插件可以全部知道新知识，通过多轮对话进行升级，数学能力再上一个新的台阶。

这都得益于科大讯飞此前在人工智能领域的技术积累，以及在认知智能领域取得的领先成果。如2017年科大讯飞让机器在全球首次通过国家职业医师资格考试、超过了96.3%参加考试的医生，并且在SQuAD机器阅读理解中全球首次超过人类平均水平，2022年在OpenBookQA科学知识推理中，单模型也超过人类平均水平。

作为将大模型率先应用落地的玩家，科大讯飞还通过讯飞开放平台开放了560项AI能力，并且有首批来自36个行业的3000余家企业开发者将接入星火大模型。基于此，科大讯飞将联合行业合作伙伴共建大模型“星火”生态，让大模型能真正落地到行业中去。

结语：讯飞打响大模型应用落地“第一枪”！

大模型的真正价值在于成为生产力工具，使得产业应用真正与前沿技术相结合。当下，大模型也已经进入产业落地的关键期。

科大讯飞此前在认知智能领域的技术积累优势，以及在教育、办公等场景下的深耕使得其成为大模型应用落地的率先突破者。

同时，AI新的技术革命已经到来，正在对各行各业产生深远影响，讯飞星火大模型的应用成果发布将进一步助攻大模型AI技术在各行各业的规模化普及。

花粉社群VIP加油站

1

赏礼

赏钱

0

免责声明：本文仅代表作者个人观点，与花粉乐分享无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非花粉乐分享）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@hflfx.com

见智|ChatGPT大火中国如何研发同类型人工智能？

2023-05-13 21:18

我用AI去讨债：一顿操作猛如虎，3000要回350

2023-05-13 21:11