花粉乐分享平台宣传视频
> 乐学堂 > > 能通过谷歌三级程序员面试、沃顿商学院MBA考试,但ChatGPT竟然学不好数学!
能通过谷歌三级程序员面试、沃顿商学院MBA考试,但ChatGPT竟然学不好数学!
来源:华尔街见闻
2023-05-06 15:50:34
258
管理

近日一份内部文件显示,ChatGPT成功通过了谷歌的编程面试,拿到了年薪18.3万美元的L3工程师offer。虽然L3只是谷歌工程团队的最入门级别,但这仍是一众普通程序员难以企及的水平。

宾夕法尼亚大学沃顿商学院教授Christian Terwiesch近期进行的一项研究发现,Chat GPT-3能够通过该学院MBA的期末考试,并获得B到B-左右的综合成绩,在某些问题上,这个聊天机器人甚至给出了A 级别的回答。

此外,根据一项最新的研究,明尼苏达大学的法学教授让ChatGPT尝试了一下他们学校四门课程的研究生考试题,最终机器人以C 的综合成绩通过了所有考试。

从写稿、编程、到教育,再到商业管理和法律,Chat GPT展现出来的 “逆天”能力一次次震撼所有人,也让不少人担心,在不久的未来,自己的岗位将被ChatGPT取代。

但有一个领域的从业人员似乎还不用担心被Chat GPT代替:ChatGPT在数学方面表现得相当糟糕。

计算机竟然不会计算?

据媒体当地时间周五报道,德克萨斯大学数据科学和统计学教授Paul von Hippel表示: “我没有听到数学老师对(被ChatGPT替代)表示担忧。”

曾就ChatGPT的数学局限性写过文章的von Hippel说:“我不确定它是否擅长数学,这感觉很奇怪,因为数学是计算设备的首个应用领域。”

虽然计算机可以正确地处理许多基本的算术问题,但当这些问题是用自然语言阐述的时候,机器人就会犯错误。

例如,有媒体问ChatGPT:“如果一个香蕉重0.5磅,我有7磅香蕉和9个橙子,那么我共有多少个水果?”

机器人迅速回复:“你一共有16个水果,7个香蕉和9个橘子。”

当你问一个小学生同样的问题,他给出的答案十有八九会是“23”。

如果你问聊天机器人,奥尼尔和姚明谁高?它会毫不犹豫地告诉你,奥尼尔更高。(姚明身高2.26米,奥尼尔身高2.16米)

除此以外,在计算大数字的平方根时,ChatGPT会犯错,在对稍微复杂的计算题进行分解计算时,它也会犯错,如2x300=500。

其实只是一个擅长扯淡的艺术家?

面对这样小学级别的数学问题,身为计算机程序的ChatGPT为什么会如此自信地胡说八道?按照一般人的想法,数学本应该是它的“看家本领”。

实际上,数学是ChatGPT这种被称为大型语言模仿人工智能与生俱来的弱项。

开发人员通过扫描网络上的大量文本,并开发出一个模型,用于判断一个句子中哪些单词可能会跟随其他单词。当你在设备上输入“我想”后, “与某人跳舞”,“知道什么是爱”或“永远在你身边”等词汇可能自动补全。类似ChatGPT这种大型人工智能拥有更为复杂的自动补全功能。

也就是说,ChatGPT实际上更擅长模仿,而非计算。它可以写出一篇符合语法的论文,但却不一定能正确地解决数学问题。

这也是ChatGPT的致命弱点: 它用一种看上去很权威的语言给出语法正确但数字错误的答案。

对此,von Hippel表示:

它表现得像个专家,有时可以提供一个令人信服的答案。但它往往是一种擅长扯淡的艺术家,把真相、错误和虚假信息混合在一起,听起来很有说服力,但其实只有具备相关专业知识的人才能辨明真伪。

至于为什么一些简单问题的回答是对的,而另一些则完全错了,搜索引擎工程师Debarghya Das告诉媒体:

也许正确的比方是,如果你问一屋子不知道数学是什么,但读过很多象形文字的人,‘2 2的后面是什么,他们可能会说‘通常,我们看到的是4’,这就是聊天机器人GPT正在做的。

但是数学不仅仅是一系列象形文字,它是计算。

Chat GPT背后的公司OpenAI首席执行官Sam Altman去年12月在Twitter上表示:

ChatGPT的能力极其有限,但在某些方面足以让人产生对伟大的误解。现在依赖它做任何重要的事情都是错误的。

当您开始与ChatGPT对话时,它会提前发出警告:“虽然我们有适当的安全措施,但系统偶尔可能会发出不正确或具有误导性的信息。”

不过谁也不能保证,在未来,也许是下一代人工智能,能将ChatGPT强大的语言技能与搜索引擎Wolfram Alpha的数学功能结合起来。到那时,它给出的答案不仅是自信的,而且是准确的。

本文来自华尔街见闻,欢迎下载APP查看更多

花粉社群VIP加油站

2
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与花粉乐分享无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
凡本网注明 “来源:XXX(非花粉乐分享)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。
QQ:2443165046 邮箱:info@hflfx.com
关于作者
萤火虫不发光..(花粉指导)
文章
528
主题
0
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行
随手拍
54个圈友 0个话题
华为手机随手拍,记录生活点滴之美好
华为P30pro
51个圈友 0个话题
这里是华为P30pro手机交流圈,欢迎华为P30pro用户进群交流
体验官
60个圈友 2个话题
华为花粉体验官,体验官专属的交流群
登录后查看您创建的圈子
登录后查看您创建的圈子
所有圈子
猜你喜欢
杭州互联网违法和不良信息举报平台 网络110报警服务 浙ICP备17046585号
2
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索