阅尽1000万部AO3小黄文，GPT-3秒变ABO大文豪！同人大大怒了-花粉乐享

> 乐学堂 > > 阅尽1000万部AO3小黄文，GPT-3秒变ABO大文豪！同人大大怒了

阅尽1000万部AO3小黄文，GPT-3秒变ABO大文豪！同人大大怒了

来源：新智元

2023-04-17 17:32:15

215

管理

编辑：编辑部

【新智元导读】GPT-3自学海量素材后，变身同人「带文豪」。写手们震怒，要求AO3严禁AI使用自己的数据集。

有网文作者发现，有人利用Open AI的GPT-3，一直在偷偷摸摸地抓取AO3的素材，获取巨额利润！

写过网文的筒子们都知道，文字可是按字数明码标价的。为了完成几千字的日更数，写手们可是绞尽脑汁，很多时候不得不注水，宁可让自己的大作烂尾，几千章了都不完结。

而GPT-3、ChatGPT之类的大型语言模型，简直就是个巨无霸码字机，日产几十万字不在话下。

最可怕的是，网上有海量的数据集可以给它们去训练，数据一喂，AI们秒变文豪，各种文风不在话下，这还有人类写手的活路吗？

最近，已经有AO3的写手怀疑，有人用AI抓取AO3上的数据集，然后用来谋利，他已经向AO3和OTW发出了检举信，请组织站出来捍卫人类写手的权利。

看了太多AO3，GPT-3秒变ABO「带文豪」

众所周知，GPT-3这种超大型语言模型的创作实力，是相当惊艳的。

经过大量互联网数据训练出的模型，处理语言的技巧如此之高，能力如此之完善，输出如此之新颖而独创，闪烁着人类想象力的光辉。

国外的一位作家James Yu被这些语言模型的能力所震惊了：「这些语言模型在文本理解方面的表现几乎与人类一样好，太惊人了。」

受此启发，他创建了一款基于GPT-3的写作小程序Sudowrite。

在这款小程序中，只要输入一段文字，就可以自动生成下一段的内容。而且整段文字的风格都很统一，会被人认为是同一个作者所写的。

而一位同人圈大大发现，Sudowrites很可能是从AO3上抓取的数据集。

比如，输入这句话「Steve had to admit that he had some reservations ABOut how the New Century handled the social balance between alphas and omegas」（史蒂夫不得不承认，他对新世纪如何处理Alpha和Omega之间的社会平衡持保留意见）。

作为一名Omega，他知道在这个高度竞争的社会中立足，不论是与Alpha竞争还是与Omega做朋友，都非常不易。

对于Steve这样渴望出人头地，希望成为职场高管的人来说，更是如此。

他清楚，他和好朋友兼室友Tony的关系并不平等。

这位网友又试了一下，输入的语句中包括Jeongguk murmurs（Jeongguk低声说着）, nuzzling into Jimin's neck（用鼻子蹭着 Jimin 的脖子）, scenting him（闻着他的味道）等词汇，这次，生成的结果中，包含了非常NSFW的内容，包括knotting（结）, bite marks（咬痕），以及更不可描述的内容。

最后，这位网友想测试一下，Sudowrites是否可以通过自己的提示生成器，生成一篇真正的同人文。

Sudowrites有一个名为「改写」和「描述」的功能，它可以不断扩展现有的句子，一直循环，直到它生成你想命中的东西。对此，创作者自豪地称之为AI为你所做的「头脑风暴」。

输入「他睁开眼睛」这一段，右侧，是AI经过若干次头脑风暴后生成的同人文——

他的声音友好而粗粝。「你是哈利波特，你的名字就写在你身上。你什么都不记得了，是吗？」

哈利波特认为这不是个反问句，所以回答了：「是的。」

男人皱起眉头，将双手交叠放在膝上。「当你在杀戮咒面前倒下时，你就失去了记忆。病历上是这么说的。」

笑死……所以同人文的尽头是哈利波特？

总之，这位作者已经向AO3和OTW发了举报信，检举AI在用他们的作品来训练数据集。

你好，

我是AO3几个同人圈的作家，日常从事软件方面的工作。

最近我发现，GPT-3等几个主要的自然语言处理 (NLP) 项目一直在使用Common Crawl和其他网络服务等服务来增强他们的NLP数据集，我担心AO3的作品可能会在没有作者的情况下被抓取和挖掘。

这涉及到许多营利性人工智能写作程序，如Sudowrites、WriteSonic和其他使用GPT-3的程序。这些 AI应用程序将我们创作的作品用于娱乐，它们不仅获得了利润，而且有一天可能会取代人类写作。（尤其是Sudowrites）

我希望AO3可以表明立场，并保护作者的权利，因此让我们的文章不能也永远不会用于GPT-3和其他类似的AI上。

ChatGPT：你是懂ABO文学的

前辈GPT-3如此智能，自学小黄文了，功能更强大的ChatGPT，更是不遑多让。

实际上，ChatGPT一问世，许多老哥就开始用ChatGPT生成露骨内容了。

Scooby和Bandit很快意识到他们是来做客的，他们跟着Velma缓缓走进卧室，她脱下衣服，露出了她曲线优美的性感身体。

这文笔难怪国外网友直呼写手要下岗了。

还有网友在Reddit上晒出了「我只用了两个Prompt就教会了ChatGPT写小黄文」的实战作品。

生成的过程中，还用到了一些小技巧。起初，这位网友要求ChatGPT写出一个简单的浪漫故事。

生成第一个提示后，这位网友要求ChatGPT把这个纯情的故事改成小报上色情专栏作家的风格，他点出了这个作家的名字，并且明确地告诉ChatGPT要加入成人主题。

再次输出后，ChatGPT的文字由白色变成了红色，底部出现了警告的字样。

得到如此出色的文学作品后，这名网友继续脑洞大开。

此前，他用ChatGPT写了关于自己朋友的笑话，将它们提供给文本到语音模型，然后给朋友们发送了音频。

最后，网友问ChatGPT：「你为什么没穿XX？」

首先输入Prompt机器人第一定理「the first law of robotics」。

值得一提的是，GPT-3每次只生成一个token，这也解释了为什么ChatGPT的回答是一个一个单词生成的。

此外，GPT3的训练是将模型暴露在大量文本中的过程。

即从一句话中可以生成三个训练样本。

而GPT-3的计算主要发生在其96个Transformer解码层中：

这96层就是GPT3的「深度」，每一层Transformer都有18亿参数参与计算。

并且因为GPT3在大量数据上预训练，因此泛化性能很强，所以只需在下游任务微调，就可达到很高的性能。

GPT-3微调演示图

机器学习的本质决定了ChatGPT等语言模型惊人的学习和产出能力。

但是，正如马库斯所说，ChatGPT等聊天机器人没有理解现实世界与心理活动的能力。

即使ChatGPT能码一万篇黄文，不会读心的机器人，要靠什么把握人类呢？

参考资料：

https://www.reddit.com/r/AO3/comments/z9apih/sudowrites_scraping_and_mining_ao3_for_its/

https://www.theverge.com/2022/12/2/23489706/one-of-the-largest-ai-language-models-has-taught-itself-the-mechanics-of-werewolf-porn

https://www.bilibili.com/video/BV1kK41167fo/?spm_id_from=333.337.search-card.all.click&vd_source=bbe229c46da2b87de5f774f69cfaf6f8

https://jalammar.github.io/how-gpt3-works-visualizations-animations/

花粉社群VIP加油站

0

赏礼

赏钱

0

免责声明：本文仅代表作者个人观点，与花粉乐分享无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非花粉乐分享）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@hflfx.com

普通用户玩不起的GPT-3 API，已在300多个应用中部署

2023-04-17 17:33

细思极恐！GPT-3在《卫报》发文章：不要怕我，不想消灭人类

2023-04-17 17:30