花粉乐分享平台宣传视频
> 乐学堂 > > 小冰CEO李笛谈AI聊天机器人:回答内容不可信与交互成本高是ChatGPT商业化最大阻碍
小冰CEO李笛谈AI聊天机器人:回答内容不可信与交互成本高是ChatGPT商业化最大阻碍
来源:每日经济新闻
2023-04-15 17:18:08
230
管理

每经记者:可杨 每经编辑:董兴生

从吟诗作赋,到写代码,再到写剧本、做高数,OpenAI发布的免费机器人对话模型ChatGPT回答处理多领域问题的能力之强悍,引发全球关注。

尽管该模型目前仍处于测试阶段,但面世仅一周,便有超过一百万用户使用。“明天ChatGPT就要抢走人类饭碗”的调侃也不绝于耳。(更多内容,详见每经头条《最强聊天机器人来了,能写情书、改错别字、编代码!明天,ChatGPT抢走我饭碗?》)

已拥有多个AI聊天机器人成功落地案例的国内顶尖人工智能公司小冰,如何看待风靡全球的ChatGPT?

带着这个问题,12月8日《每日经济新闻》记者专访了小冰公司CEO李笛。他认为,市场对于ChatGPT取代搜索引擎,以及在其他各个领域实现商业化落地的畅想,短期内不太可能到来,成本将成为制约其实现商业化的重要阻碍。他举例说,如果小冰用ChatGPT的方法来运行系统,现在小冰每天承载的交互量就需要花几亿人民币的对话成本。

李笛 图片来源:受访者供图

ChatGPT创新了训练方式,但市场热情过度

在李笛看来,目前,行业内对ChatGPT的关注与热潮已经有些过度。

“人类为什么会感到激动?”李笛觉得,当人们普遍对一件事情有一种预期,进而去交互时,发现它远超大家的预期,人们就会惊讶。“但即使是针对人工智能,在最近这些年惊讶的次数也很多了;稍微往前一点,GPT3出来的时候大家就很惊讶,但是也没有发生什么;再往前,AlphaGo下围棋赢过最好的人类棋手,大家也很惊讶,但是之后似乎也没有改变什么。”

不过,李笛也提到,关于ChatGPT,有三件事情需要相对理性来看。首先,ChatGPT有非常好的创新,即证明了在原有的大模型基础之上,进行一些新的训练方法,可以更好地提高对话质量;其次,ChatGPT并不构成一个大版本的迭代,而是对上一个版本的微调,在一定程度上弥补了极大参数量的大模型的一些缺陷。“即便是OpenAI来讲,它也被定义为GPT3.5,而不是GPT4。”此外,李笛认为,ChatGPT的突破,主要是研究性质上的突破。

对于目前市场普遍想象的ChatGPT是否马上就会迎来商业化落地、产生颠覆性的影响,李笛认为不太可能。“但是,这一点都不影响我们在最近这些年里,尤其是在大模型的思路出来以后,我们又一次看到在对话上的一个很大的变化,在这条路上大家都在往前走。”

ChatGPT在训练方法上,具体做了怎样的创新,以至于能够大大提升其作为聊天机器人的对话质量?

李笛分析称,很多人说ChatGPT的训练是基于人类反馈,这并不完全准确。人类反馈至少有两个含义,一是指在训练中,通过反馈来实现;另外则是产品在与用户交互时,通过大量的用户与其交互形成的反馈,不停地让模型进步。“这两者的价值是非常不一样的,更大的价值其实在于后者,即产品在交互过程中得到反馈。”

李笛介绍,过去对于AI聊天机器人的训练主要是基于数据,即在机器进行对话后,针对对话内容进行训练,调整、优化对话内容的数据;而ChatGPT则是针对数据形成的模型进行训练,简单而言,具体的训练方式是:人先写出一些指导性的问与答,用这些问答对大模型进行训练,通过一系列反馈式的训练方法,让大模型逐渐沿袭人所给予的关于问答的指导性意见、逻辑。“从这个角度讲,即使是进行多轮对话,ChatGPT本质上来讲依旧是一个问答系统。”

图片来源:摄图网-500560614

李笛认为,这样的训练方法背后的技术含量,通常不是算法模型上的技术含量,而是来自训练者本身的能力,包括团队自身的经验积累。例如,由人来写问与答,让机器学习并给出结果,同时人要再对此给出评分,这其中有很多个体差异,这种个体差异则在一定程度上决定了其最后呈现的成果。

他同时也谈到,从主要做大模型的公司而言,成果往往取决于到底是不是非常专注去做这件事情。“OpenAI与其他公司不一样的地方在于,它很专注做语言大模型,所以它投了大量时间和精力。它有很多经验,但这些经验的积累并不是不可习得的。”

不可信与高成本成商业化阻碍

ChatGPT给出的回答,最常规的格式是先给出一个结论,再进行事实的罗列,进而通过其罗列的事实推导出结论。

李笛认为,对ChatGPT而言,这个结论本身是否正确其实不重要。他用之前网络上流传的一个问答举例,在回答“红楼梦中贾宝玉适合娶谁”的问题时,ChatGPT最终给出的答案是:贾母。

李笛进一步分析,根据ChatGPT的回答可以反推出,人在为其写指导性问答时,非常强调因果关系,而大模型也会注重去学习因果关系。“(有的回答)如果不是特别仔细去看,你会感觉到这是一个似乎很有逻辑与因果关系的回答,但实际上它非常没有道理。”

这也是为什么从对话质量上看,人们会觉得ChatGPT很优秀,但想要真正依靠它去代替搜索引擎,李笛认为,这不太可能,因为它不可信。“很多人在测试ChatGPT的时候是知道答案的,但去搜索引擎上搜的东西往往是我们不知道答案的。如果是通过ChatGPT(代替搜索引擎),你怎么知道这个东西(答案)是正确还是错误的,它完全不负责的。”

而李笛也认为,这种“不可靠”很难解决,因为ChatGPT的训练过程,是为了对话质量,但人们却容易误以为它的目的是给出最正确的知识。“它做了很多优化,是使它(的回答)形式上感觉非常有知识,它不是为了本质(有知识)。”

搜索引擎在努力做的是跳过论证过程,直接给出用户最终想要的结果,而ChatGPT则相反,它追求的是尽可能在给出回答之前,给很多论证,让人觉得它的回答是可信的。“ChatGPT,人们测试的时候会觉得很好,但是真的拿它来用,有那么一两次你发现,你被它的这种似是而非的胡说八道愚弄了,那么你从此就不会(对它)有任何的信任。”

如果ChatGPT无法取代搜索引擎,还有什么可预想的落地应用吗?

李笛认为,真正限制ChatGPT在短期内商业化的是成本。“它的单轮回答(Single Turn),成本是几美分,按照1毛钱(人民币)算,10句话就是一块,这个(成本)超过人,还不如雇一个人,比这个要便宜得多。”

与此同时,李笛表示,如果把大模型理解为把特别多的信息浓缩在一个模型里,那么大模型的本质问题就在于,很大参数规模的大模型做了以后不可用,因为成本太高、延迟太高。但一旦开始尝试降低成本,同时也会明显看到其对话质量降低。

李笛举例,如果小冰用ChatGPT的方法来运行系统,现在小冰每天承载的交互量就需要花几亿人民币的对话成本。“就算ChatGPT可以把成本优化到现在的10%,也赚不回来,因为人工智能最大的特点就是高并发。如果成本是这样,不如雇人。人有自我反省机制,人工智能甚至有一些基本常识性错误。而且把成本降到现在的10%,这是多么艰巨的任务?”

AI聊天机器人需要取舍

目前,小冰公司的AI Being已成熟应用于多个场景中,例如本届赛事解说员刘建宏的虚拟人分身、招商局的数字员工等。

李笛认为,小冰内部有一个比较好的状态,就是关心什么东西真正落地,而不是特别关心这个东西是否代表了学术声望。“如果你做的人工智能总是在向别人表达你很智能,那意味着你把用户的预期提升到非常高的位置,这意味着你的系统不允许犯错,因为你已经让别人认为(这个系统)很有知识了,犯错误就可能误导用户。”

而小冰系统很多时候是在控制用户的预期。“不要觉得它很智能。要去关心它其他方面的价值,往往这样的系统反而存在得更久。”李笛认为,其实从某种意义上来讲,这也是其团队做小冰的原因。

李笛回忆,最开始时,团队想要做的是一个人工智能助理,“对助理来讲,有用是他最重要的特点,我们那时候是这么认为的”。

而在对一些优秀的人类助理进行访谈后,李笛发现,对于助理来讲,最重要的事是和老板调整成一种合适的同事关系,这种同事关系必须让老板认为助理有自己的想法,会在一些合理的时机去拒绝。这样的关系带来的好处是,为自己的工作带来更多的空间与余地,同时让老板意识到助理不是命令处理器,而拥有做更多事情的能力。“这种关系是基于care(关心),他让老板认为助理所有谨慎的判断是因为他care(关心)这个老板,所以他跟老板之间能够产生共情与信任。”

图片来源:小冰公司官网

不过,在李笛看来,小冰依旧不是一个理想的聊天机器人。“今天整个行业包括我们,离人工智能辉煌的时代都还早,现在是一个蛮荒时代,我个人认为这件事情我们是要做一辈子的,如果不是因为这个原因的话,我们也不会耐得住寂寞做这么久。”

李笛介绍,小冰每年都会提出一些重点的发展方向,最近这一年,小冰更多开始关注“多样性”。当其本身的框架已经有能力去交互时,小冰发现,不同的人在不同的位置或不同角色、不同情况下,所需要的交互对象是不同的。这个不同不仅仅是外观、声音的不同,还包括了性格、观点,甚至创作的风格,这是一个很高的多样性。“知识有对错,但观念没有,同时聊天机器人也不能对所有与观念有关的事情,都表示无可置评,这就决定了聊天机器人一定是多样性存在的。”

具体到不同领域的产品上,在对话层面,小冰将更关心100亿规模参数级别大模型的实际落地和投入产出,而不是不关注成本地向前推进;在声音上,小冰更关注声音一致性,歌声和说话与外形等混合在一起时,是不是能很好地体现出同一个人的一致性;在视觉层面,小冰则在推进神经网络渲染。

对于AI聊天机器人在虚拟员工之外,是否还有更多场景可能实现商业化落地,李笛认为,基于小冰的框架诞生的AI聊天机器人,可能成为虚拟恋人,也可能是虚拟主持人、歌手,以及家庭场景中的虚拟老师、虚拟陪伴者……

这也是李笛所理解的“通用人工智能”。由一个框架训练出各种各样、功能迥异的AI机器人,“他们都是基于同一个框架,但是在不同的领域发挥作用,这是我们所希望的通用,而不是知识层面的通用,因为那(本质上)仍然是一个垂直领域”。

每日经济新闻

花粉社群VIP加油站

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与花粉乐分享无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
凡本网注明 “来源:XXX(非花粉乐分享)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。
QQ:2443165046 邮箱:info@hflfx.com
关于作者
回眸一句草泥..(采蜜高手)
文章
791
主题
7
关注
0
粉丝
1
点击领取今天的签到奖励!
签到排行
随手拍
54个圈友 0个话题
华为手机随手拍,记录生活点滴之美好
华为P30pro
51个圈友 0个话题
这里是华为P30pro手机交流圈,欢迎华为P30pro用户进群交流
体验官
60个圈友 2个话题
华为花粉体验官,体验官专属的交流群
登录后查看您创建的圈子
登录后查看您创建的圈子
所有圈子
猜你喜欢
杭州互联网违法和不良信息举报平台 网络110报警服务 浙ICP备17046585号
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索