花粉乐分享平台宣传视频
> 乐学堂 > > GPT-4把DeepMind整尴尬了:你登上Nature的排序优化算法,我也会
GPT-4把DeepMind整尴尬了:你登上Nature的排序优化算法,我也会
来源:量子位
2023-06-27 16:23:44
214
管理

明敏 发自 凹非寺

量子位 | 公众号 QbitAI

DeepMind新AI登上Nature才一天,GPT-4就来打擂台了!

只通过两段提示,GPT-4就给出了和AlphaDev如出一辙的排序算法优化方法。

马斯克“路过看到”,也留下了句“因吹斯听”。

所以GPT-4怎么做到的?

2段提示就搞定

带来这个新发现的是一位来自威斯康星大学麦迪逊分校的副教授,名叫Dimitris Papailiopoulos(下面简称D教授)。

他让GPT-4实现这一操作的步骤非常简单,一共就输入了两次提示。

首先,他和GPT-4说:

这有一段排序算法,我觉得它还能进一步优化。你能不能在下面几行,用*注明哪些指令可以删除或者改进?如果不需要修改,就什么都不动。一步一步解释原因,然后回去验证它是对的。

DeepMind方面对AlphaDev这通操作,让人想起当年AlphaGo的“第37步”——一种违反直觉的下法却直接击败传奇围棋选手李世石,让观众全都震惊不已。

同样,AlphaDev则是通过交换和复制移动,跳过了一个步骤,以一种看似错误但实际上是捷径的方式达成目标。

据介绍,AlphaDev是一种强化学习算法、基于AlphaZero打造,它的发现并非基于现有算法,而是从最底层的汇编指令开始摸索的。

它的创新主要在于两种指令序列:

(1)AlphaDev Swap Move(交换移动)

(2)AlphaDev Copy Move(复制移动)

原理上,DeepMind的研究员给它设计了一种单人“组装”游戏:

只要能够搜索并选择出合适的指令(下图A流程),正确且快速地排好数据(下图B流程),就能获得奖励。

不过话说回来,之所以这件事能够引起这么大的关注和讨论,很大一部分原因是AlphaDev登上Nature存在争议。

不少人觉得这也不是什么开创性的研究,DeepMind夸大其词。

你觉得呢?

参考链接:[1]https://chat.openai.com/share/95693df4-36cd-4241-9cae-2173e8fb760c[2]https://twitter.com/DimitrisPapail/status/1666843952824168465

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

花粉社群VIP加油站

1
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与花粉乐分享无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
凡本网注明 “来源:XXX(非花粉乐分享)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。
QQ:2443165046 邮箱:info@hflfx.com
关于作者
DuangDuang(采蜜高手)
文章
451
主题
0
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行
随手拍
54个圈友 0个话题
华为手机随手拍,记录生活点滴之美好
华为P30pro
51个圈友 0个话题
这里是华为P30pro手机交流圈,欢迎华为P30pro用户进群交流
体验官
60个圈友 2个话题
华为花粉体验官,体验官专属的交流群
登录后查看您创建的圈子
登录后查看您创建的圈子
所有圈子
猜你喜欢
杭州互联网违法和不良信息举报平台 网络110报警服务 浙ICP备17046585号
1
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索