能通过谷歌三级程序员面试、沃顿商学院MBA考试，但ChatGPT竟然学不好数学！-花粉乐享

> 乐学堂 > > 能通过谷歌三级程序员面试、沃顿商学院MBA考试，但ChatGPT竟然学不好数学！

能通过谷歌三级程序员面试、沃顿商学院MBA考试，但ChatGPT竟然学不好数学！

来源：华尔街见闻

2023-05-06 15:50:34

266

管理

近日一份内部文件显示，ChatGPT成功通过了谷歌的编程面试，拿到了年薪18.3万美元的L3工程师offer。虽然L3只是谷歌工程团队的最入门级别，但这仍是一众普通程序员难以企及的水平。

宾夕法尼亚大学沃顿商学院教授Christian Terwiesch近期进行的一项研究发现，Chat GPT-3能够通过该学院MBA的期末考试，并获得B到B-左右的综合成绩，在某些问题上，这个聊天机器人甚至给出了A 级别的回答。

此外，根据一项最新的研究，明尼苏达大学的法学教授让ChatGPT尝试了一下他们学校四门课程的研究生考试题，最终机器人以C 的综合成绩通过了所有考试。

从写稿、编程、到教育，再到商业管理和法律，Chat GPT展现出来的 “逆天”能力一次次震撼所有人，也让不少人担心，在不久的未来，自己的岗位将被ChatGPT取代。

但有一个领域的从业人员似乎还不用担心被Chat GPT代替：ChatGPT在数学方面表现得相当糟糕。

计算机竟然不会计算？

据媒体当地时间周五报道，德克萨斯大学数据科学和统计学教授Paul von Hippel表示： “我没有听到数学老师对（被ChatGPT替代）表示担忧。”

曾就ChatGPT的数学局限性写过文章的von Hippel说：“我不确定它是否擅长数学，这感觉很奇怪，因为数学是计算设备的首个应用领域。”

虽然计算机可以正确地处理许多基本的算术问题，但当这些问题是用自然语言阐述的时候，机器人就会犯错误。

例如，有媒体问ChatGPT：“如果一个香蕉重0.5磅，我有7磅香蕉和9个橙子，那么我共有多少个水果？”

机器人迅速回复：“你一共有16个水果，7个香蕉和9个橘子。”

当你问一个小学生同样的问题，他给出的答案十有八九会是“23”。

如果你问聊天机器人，奥尼尔和姚明谁高？它会毫不犹豫地告诉你，奥尼尔更高。（姚明身高2.26米，奥尼尔身高2.16米）

除此以外，在计算大数字的平方根时，ChatGPT会犯错，在对稍微复杂的计算题进行分解计算时，它也会犯错，如2x300=500。

其实只是一个擅长扯淡的艺术家？

面对这样小学级别的数学问题，身为计算机程序的ChatGPT为什么会如此自信地胡说八道？按照一般人的想法，数学本应该是它的“看家本领”。

实际上，数学是ChatGPT这种被称为大型语言模仿人工智能与生俱来的弱项。

开发人员通过扫描网络上的大量文本，并开发出一个模型，用于判断一个句子中哪些单词可能会跟随其他单词。当你在设备上输入“我想”后， “与某人跳舞”，“知道什么是爱”或“永远在你身边”等词汇可能自动补全。类似ChatGPT这种大型人工智能拥有更为复杂的自动补全功能。

也就是说，ChatGPT实际上更擅长模仿，而非计算。它可以写出一篇符合语法的论文，但却不一定能正确地解决数学问题。

这也是ChatGPT的致命弱点: 它用一种看上去很权威的语言给出语法正确但数字错误的答案。

对此，von Hippel表示：

它表现得像个专家，有时可以提供一个令人信服的答案。但它往往是一种擅长扯淡的艺术家，把真相、错误和虚假信息混合在一起，听起来很有说服力，但其实只有具备相关专业知识的人才能辨明真伪。

至于为什么一些简单问题的回答是对的，而另一些则完全错了，搜索引擎工程师Debarghya Das告诉媒体：

也许正确的比方是，如果你问一屋子不知道数学是什么，但读过很多象形文字的人，‘2 2的后面是什么，他们可能会说‘通常，我们看到的是4’，这就是聊天机器人GPT正在做的。

但是数学不仅仅是一系列象形文字，它是计算。

Chat GPT背后的公司OpenAI首席执行官Sam Altman去年12月在Twitter上表示:

ChatGPT的能力极其有限，但在某些方面足以让人产生对伟大的误解。现在依赖它做任何重要的事情都是错误的。

当您开始与ChatGPT对话时，它会提前发出警告：“虽然我们有适当的安全措施，但系统偶尔可能会发出不正确或具有误导性的信息。”

不过谁也不能保证，在未来，也许是下一代人工智能，能将ChatGPT强大的语言技能与搜索引擎Wolfram Alpha的数学功能结合起来。到那时，它给出的答案不仅是自信的，而且是准确的。

本文来自华尔街见闻，欢迎下载APP查看更多

花粉社群VIP加油站

2

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与花粉乐分享无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非花粉乐分享）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@hflfx.com

号称“全能”的AI模型GPT-3你知道吗？

2023-05-06 15:51

简介之战：GPT4 VS GPT3

2023-05-06 15:46

相关推荐

不一样的聊天体验——用chatgpt让你的聊天更有趣

用自己的手机也能查看别人的聊天记录，操作简单，一学就会

“你聊天，我聊天，明年补考教室见……”

和ChatGPT一起了解骨科手术机器人

人工智能聊天机器人：ChatGPT和Bard，谁更厉害？

关于作者

萤火虫不发光..(花粉指导)

文章

528

主题

0

关注

0

粉丝

0

点击领取今天的签到奖励!

54个圈友 0个话题

华为手机随手拍，记录生活点滴之美好

51个圈友 0个话题

这里是华为P30pro手机交流圈，欢迎华为P30pro用户进群交流

60个圈友 2个话题

华为花粉体验官，体验官专属的交流群

登录后查看您创建的圈子

现在登陆

登录后查看您创建的圈子

现在登陆

猜你喜欢

标签云

@杭州百翼科技有限公司

杭州互联网违法和不良信息举报平台网络110报警服务

浙ICP备17046585号

2

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索