GPT-3今年首次升级，吴恩达、Keras之父等大佬纷纷叫好-花粉乐享

> 乐学堂 > > GPT-3今年首次升级，吴恩达、Keras之父等大佬纷纷叫好

GPT-3今年首次升级，吴恩达、Keras之父等大佬纷纷叫好

来源：量子位

2023-04-22 19:24:12

540

管理

杨净箫萧发自凹非寺量子位报道 | 公众号 QbitAI

2021年一开始，OpenAI在GPT-3方向上的又一重要突破，让吴恩达等大佬激动了。

之前给GPT-3一段话，就能写出一段小说。

现在它成功跨界——可以按照文字描述、生成对应图片！

从“五边形闹钟”到“牛油果形状的座椅”，只要你的想象力够丰富，DALL·E全都能画出来。

技术上更厉害的是，OpenAI透露这个AI是基于GPT-3而构建，仅使用了120亿个参数样本，相当于GPT-3参数量的十四分之一。

于是效果一出，吴恩达、Keras之父等纷纷转发、点赞。堪称2021年第一个令人兴奋的AI技术突破。

本质上，它就是一个被重新训练过的“120亿参数版”GPT-3，能根据一段文字描述，生成对应的图像。

为了让DALL·E能“识字画图”，研究者们用包含各种“文本-图像”组合的数据集，来训练DALL·E。

这其中，DALL·E以单数据流的形式，一次性接收1280个字符（token），其中256个字符分配给文字，其余的1024个则分配给图像。

DALL·E将对这些输入信息进行建模，利用自注意力层的注意力遮罩，确保每一个输入的图像字符，都与所有输入的文字字符关联。

然后DALL·E将根据文本，通过最大似然估计，逐个字符生成图像。它不仅能从文字中，生成一整幅草图，还能重新生成图像中的任何一块矩形区域。

此次生成的Demo图像，正是从512个样本中，用CLIP选出的前32个样本。研究人员强调，整个过程他们全程没有参与。

有哪些初步效果？

此次上线的Demo，大致分成这几类效果。

控制变量，修改物体的属性（数量、颜色）。

同时控制多个对象。比如，戴红色帽子，黄色手套，蓝色衬衫和绿色裤子的企鹅。

说实话，要换成是我，我一个也画不出来。（手动裂开）

推断细节。正如上文举的例子，“沐浴在朝阳中的田间水豚”。

单从文字上看，还有很多细节需要考究：水豚位置，阴影有无，绘画风格。但这些，似乎都没有难到DALL·E。

大佬们纷纷给出好评

对于OpenAI这个新鲜出炉的DALL·E，大佬们也纷纷发表了自己的看法。

Keras创始人@François Chollet表示，这看起来非常酷，尤其是“图像生成”部分。

从原理上来看，应该就是GPT-3在文本合成图像方向上的扩展版。

OpenAI的CTO Greg Brockman在转发DALL·E后，更是立刻获得了1.4k的赞。

英伟达的机器学习专家Ming-Yu Liu，也送上了自己的祝福。

他表示，这样的模型在文本转图像的能力上，简直超乎想象。

当然，也有对这种方法的限制感到困惑的学者。

来自哈佛的助理教授Tomer Ullman，在对DALL·E的能力表示惊叹时，也提出了对于模型泛化能力限制的疑惑。

他认为，如果能生成“绿方块上的红方块”，模型理应也能生成“蓝方块上的绿方块上的红方块”？

希望这样的模型，能在提升泛化等能力后，真正被用来减轻设计师们的负担。

当然，如果再开一开脑洞的话，应用前景可能不止于减轻负担。

如果效果足够好，还要什么乙方设计师？

以及像动画、影视等领域，是不是未来剧本一放，AI就能给你出成果了？

参考链接：https://openai.com/blog/dall-e/https://openai.com/blog/clip/https://twitter.com/fchollet/status/1346558591835070464https://twitter.com/gdb/status/1346554999241809920https://twitter.com/liu_mingyu/status/1346573218270724097https://twitter.com/TomerUllman/status/1346556192907255808

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

花粉社群VIP加油站

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与花粉乐分享无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非花粉乐分享）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@hflfx.com

微软拿到GPT-3授权，马斯克抨击OpenAI有悖开放初心

2023-04-22 19:29

LeCun眼中的GPT-3：对世界的运作一无所知

2023-04-22 19:22

相关推荐

不一样的聊天体验——用chatgpt让你的聊天更有趣

用自己的手机也能查看别人的聊天记录，操作简单，一学就会

“你聊天，我聊天，明年补考教室见……”

和ChatGPT一起了解骨科手术机器人

人工智能聊天机器人：ChatGPT和Bard，谁更厉害？

关于作者

Outlier(蜂界传说)

文章

524

主题

0

关注

0

粉丝

0

点击领取今天的签到奖励!

54个圈友 0个话题

华为手机随手拍，记录生活点滴之美好

51个圈友 0个话题

这里是华为P30pro手机交流圈，欢迎华为P30pro用户进群交流

60个圈友 2个话题

华为花粉体验官，体验官专属的交流群

登录后查看您创建的圈子

现在登陆

登录后查看您创建的圈子

现在登陆

猜你喜欢

标签云

@杭州百翼科技有限公司

杭州互联网违法和不良信息举报平台网络110报警服务

浙ICP备17046585号

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索