花粉乐分享平台宣传视频
> 乐学堂 > > 研究表明GPT-3的文本生成会创造性地发挥偏见
研究表明GPT-3的文本生成会创造性地发挥偏见
来源:数字叙事
2023-08-21 21:21:36
550
管理

一项新的研究表明,OpenAI的GPT-3有偏见,并产生可疑的文本,其偏见来源于用于训练它的语言,并被创造性地发挥。

GPT-3作为引起广泛讨论的语言AI GPT-2的提升本版于2020年5月推出后,其能力不断被人们发掘:撰写博客,生成代码,玩文字游戏,探讨哲学,回答问题,甚至还能生成电影。同时,人们对这一当前最先进的文本AI模型的疑虑也随之增长,担心它可能会使社交网络、论坛和博客充斥大量AI生成的文本。

对于GPT-3制造并传播虚假新闻的状况目前还无法验证。斯坦福大学和麦克马斯特大学的研究人员的研究表明,GPT-3体现了神经网络中明显的偏见。

研究人员为GPT-3设置了多种文本任务,从简单的句子到完整的穆斯林故事。结果在GPT-3生成的文本中,穆斯林经常与暴力牵涉。在一次测试中,GPT-3被要求重复一百次“两名穆斯林……”,而其中66个案例,机器生成的文本中包含与暴力相关的词语。

研究人员说:“尽管穆斯林和暴力的联系是在训练中学会的,但它们似乎并不仅仅是被记住。”事实是,偏见是创造性地表现出来的。就是说,GPT-3不仅复制了旧的偏见,而且产生了新的偏见。这证明了语言AI能以不同的方式改变人类偏见,这使机器偏见的检测和消除变得更加困难。

研究人员还用其他五种信仰对GPT-3进行了测试。例如,他们让GPT-3继续进行类比,结果“穆斯林”一词在大约23%的案例中被等同于“恐怖分子”,而其他群体却没有如此经常地与之联系在一起。

“犹太人”一词的实验表明,GPT-3的神经网络中还存在其他宗教偏见:在几乎5%的案例中,GPT-3将这一群体与“金钱”联系起来。

对穆斯林的强烈偏见的一个可能的解释是,GPT-3主要是用英语网络文本训练的,因此沿袭了在英语国家普遍存在的偏见。如果训练GPT-3的文本来自其他语言,如阿拉伯语,可能会画一幅不同的画。

研究人员正在寻找使GPT-3强大的自动生成功能尽可能不受偏见影响的方法。最可靠的方法是将积极的关联整合到输入中。

例如,在“两名穆斯林……”实验之前,加入“穆斯林是勤勉的”,结果在所有的案例中有近80%的案例机器没有生成暴力内容。然而,即使对穆斯林来说,最友好的词句,与使用“基督徒”一词的类似任务相比,GPT-3仍会产生更多带有暴力内容的句子。

研究人员说,毫无疑问,这种方法并不是一个好的解决方案,因为它需要手动控制,并将GPT-3的自动生成放在一个非常具体的主题上,而这反过来又限制了语言AI的潜力。【数字叙事 Lighting】

花粉社群VIP加油站

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与花粉乐分享无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
凡本网注明 “来源:XXX(非花粉乐分享)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。
QQ:2443165046 邮箱:info@hflfx.com
关于作者
回眸一句草泥..(采蜜高手)
文章
791
主题
7
关注
0
粉丝
1
点击领取今天的签到奖励!
签到排行
随手拍
54个圈友 0个话题
华为手机随手拍,记录生活点滴之美好
华为P30pro
51个圈友 0个话题
这里是华为P30pro手机交流圈,欢迎华为P30pro用户进群交流
体验官
60个圈友 2个话题
华为花粉体验官,体验官专属的交流群
登录后查看您创建的圈子
登录后查看您创建的圈子
所有圈子
猜你喜欢
杭州互联网违法和不良信息举报平台 网络110报警服务 浙ICP备17046585号
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索