智东西
作者 | 程茜
编辑 | 漠影
智东西5月6日报道,今天下午,讯飞星火认知大模型发布,以及大模型在教育、办公、汽车、数字员工行业领域的应用成果同步亮相。
同时,科大讯飞还提出了通用人工智能(AGI)在7大维度481项的评测体系,这七大维度包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。经科大讯飞评测对比,星火认知大模型已经在文本生成、语言理解、数学能力上优于ChatGPT。
讯飞星火大模型采用了“1 N”的整体布局,其中“1”是通用认知智能大模型,包含7大维度的能力,“N”是大模型在教育、办公、汽车、数字员工等多个行业领域的应用。
科大讯飞董事长刘庆峰还透露了星火认知大模型在2023年的关键里程碑,6月9日,星火认知大模型将突破开放式问答,实现多轮对话能力再升级、数学能力再升级;8月15日,突破代码能力、实现多模态交互再升级;10月24日,通用大模型要对标ChatGPT能力,实现中文能力超越、英文能力相当的目标。
此外,在多语言生成中,星火还可以快速生成“英文的讯飞翻译机4.0新品品宣文案”。
刘庆峰说,经过评测,讯飞星火认知大模型的中文语言理解能力已经超过ChatGPT,在英文理解能力上,ChatGPT的能力达到4.48分,星火认知大模型为4.29分。
2、多层次跨语种语言理解
针对英文文案,星火还可以快速对其进行语法检查和纠错。刘庆峰透露,对于英文语法、句式的纠错能力,星火认知大模型已经做到业界最强。
当面对一些模棱两可的话语需要大模型更高层次的理解能力时,星火认知大模型也可以准确剖析其不同含义。如“俗话说男子汉大丈夫要宁死不屈,俗话又说,男子汉大丈夫能屈能伸,这两种说法应该怎么理解”。
刘庆峰谈道,目前在医疗治理方面,科大讯飞智医助理的能力比GPT-4要强很多,但由于医疗领域对专业性的更高要求,这一方面能力的开放需要更加谨慎,将于今年讯飞1024开发者节期间正式发布。讯飞的目标是让星火大模型不仅要成为医生的诊疗助手,还能成为每个人的健康助手。
4、情境式思维链逻辑推理
当提问“孔子在2008年的奥运会上说了什么?”,星火可以快速理解“孔子不可能出现在2008年的奥运会上”。
几何问题中,但问到“等腰三角形的底角是顶角的两倍,这一三角形的角度是多少”,星火给出了下面的答案:
并且,星火还可以化身一个美食助手,可以回答每道菜是什么口味等问题。大模型的加持下,星火可以从简单的文字到文字翻译变为文字到导游角色的升级。
刘庆峰透露,多模态输入和表达目前还没有开放,这一能力将在8月份开放给VIP客户使用。
演示现场还有现场随机抽取问题回答环节,针对于一些奇奇怪怪的问题,星火认知大模型也没有被难到。包括外星人感冒了需要戴口罩吗?我想把四十平的房子装修成七十平的感觉等。
在输出的答案中,星火大模型会对问题场景进行一些限制,考虑到多个场景来使得回答更为准确。刘庆峰说,星火大模型在不断的进步过程中,很多答案也会超出他们的预期。
二、落地四大应用领域,星星之火“燎原”教育、办公、汽车、数字员工除了强大的通用能力外,星火认知大模型也已经在实实在在的产业场景中实现了应用落地,包括教育、办公、汽车和数字员工四大领域。
1、教育:批改中英文作文能力升级,形成批改、修订、学习闭环
讯飞AI学习机已经可以精准分析每个学生的薄弱环节,并在五万多所中小学校实现应用。此次,星火大模型也再次将学习机的语言学习能力升级。
此前,老师对一个学生的作文进行精批大概要花费半个小时时间,批改完一个班的学生会付出大量的时间成本。
在演示中,星火认知大模型针对小学四年级上册第八单元的作文“我的心儿怦怦跳”的写作要素和写作要求进行批改。
学习机批改的过程包括错别字、语句、内容,最后会生成批改评价以及写作建议,并且用户点击错别字还能看到相应的知识卡片。
批改修订建议还会用不同颜色区分,红色代表不符合某一条写作要求,绿色代表符合写作要求,此外,学习机还给出了优化参考内容。
现场刘庆峰讲述了会议场景下,用户往往有记不全、找不到、对数据安全性担忧几大痛点。智能办公本可以通过语音转文字、字音同步、离线模式录音转写的方式解决上述痛点。
搭载大模型的智能办公本针对上述内容快速生成了会议纪要,不仅包含文本摘要,还结合了用户的手写笔记。
当下,刘庆峰也谈道,纯大模型技术有很多待攻克的技术缺陷,如对新知识难以及时更新、事实类问题容易发生张冠李戴的现象等。
但对于这些,讯飞都有非常明确的解决方案。他透露在科大讯飞成立24周年之际,星火大模型要突破开放式问答,类搜索插件可以全部知道新知识,通过多轮对话进行升级,数学能力再上一个新的台阶。
这都得益于科大讯飞此前在人工智能领域的技术积累,以及在认知智能领域取得的领先成果。如2017年科大讯飞让机器在全球首次通过国家职业医师资格考试、超过了96.3%参加考试的医生,并且在SQuAD机器阅读理解中全球首次超过人类平均水平,2022年在OpenBookQA科学知识推理中,单模型也超过人类平均水平。
作为将大模型率先应用落地的玩家,科大讯飞还通过讯飞开放平台开放了560项AI能力,并且有首批来自36个行业的3000余家企业开发者将接入星火大模型。基于此,科大讯飞将联合行业合作伙伴共建大模型“星火”生态,让大模型能真正落地到行业中去。
结语:讯飞打响大模型应用落地“第一枪”!大模型的真正价值在于成为生产力工具,使得产业应用真正与前沿技术相结合。当下,大模型也已经进入产业落地的关键期。
科大讯飞此前在认知智能领域的技术积累优势,以及在教育、办公等场景下的深耕使得其成为大模型应用落地的率先突破者。
同时,AI新的技术革命已经到来,正在对各行各业产生深远影响,讯飞星火大模型的应用成果发布将进一步助攻大模型AI技术在各行各业的规模化普及。
花粉社群VIP加油站
猜你喜欢