花粉乐分享平台宣传视频
> 乐学堂 > > ChatGPT “克星”出现,OpenAI 重磅发布全新 AI 鉴别工具,网友吐槽:失败率太高啦!
ChatGPT “克星”出现,OpenAI 重磅发布全新 AI 鉴别工具,网友吐槽:失败率太高啦!
来源:CSDN
2023-08-16 21:28:24
486
管理

整理 | 屠敏

出品 | CSDN(ID:CSDNnews)

ChatGPT 的实力,让众人为之疯狂,但也让外界感到害怕。

对于其创造者,OpenAI 一边在奋力升级 ChatGPT,让它的真实性和数学能力都大大提升;另一边开启“压制”模式,解使用者的后顾之忧,让 ChatGPT 的应用越来越正规。

这不,昨日,OpenAI 重磅推出了一款新的 AI 工具,用来识别 AI 生成的文本内容,并给出多种建议,帮助人类辨别内容的「真伪」。不过,OpenAI 自己也率先承认,这款工具是“不完美”的。

想要尝鲜的用户,可以通过以下链接了解详情:https://platform.openai.com/ai-text-classifier

新工具诞生

在公告中,OpenAI 表示,新款的 AI-Text-Classifier(AI 文本分类器)可以用来区分人类写的文本和来自各种供应商使用 AI 写的文本。

这款 AI 文本分类器是一个语言模型,它是基于同一主题下人工编写文本和人工智能编写文本对数据集上进行的微调。

在模型训练上,OpenAI 认为是由人类编写的各种来源收集了这个数据集,比如预训练数据和提交给 InstructGPT 的人类演示。

进而,OpenAI 再将把每个文本分为提示和响应。在这些提示下,研究人员从其和其他组织训练的各种不同的语言模型中产生了响应,以此来不断训练 AI 文本分类器。

OpenAI 表示,“对于我们的 Web 应用,我们调整了置信度阈值,以保持较低的误报率;换句话说,只有当分类器非常有信心的情况下,才会将文本标记为可能是人工智能写的。”

在使用上,和 ChatGPT 的方法一样,这款免费且基于 Web 的工具用起来也特别方便。只需要用户将文本内容复制到检测框中,系统就可以评估文本由 AI 系统生成的可能性。

它一共提供了五种判别结果:非常不可能是由人工智能生成的;不可能;不清楚;可能;非常可能。

新款 AI 文本分类器在识别大于 1000 字的文本样本和用英语描述的文本中呈现的效果最好。要想提高这款工具的准确性,官方建议输入的文本长度越多越好。相较而言,它在其他语言中的表现明显较差。

有些遗憾的是,它并不能区分人类和人工智能编写的计算机代码。

官方警告慎用:没想象得那么好

目前对于这款工具,OpenAI 并没有做出更多的原理介绍,主要原因或因为这款工具还并不成熟。

当下这款分类器还有一些局限性:

对于一些固定的标准答案、文本等非常容易预测的内容,AI 文本分类器无法可靠地识别出来。例如,不可能预测前 1000 个质数的列表是由人工智能还是人类写的,因为正确答案总是一样的。

AI 写的文本可以被二次编辑,从而躲过分类器的检测。

OpenAI 官方表示,该工具识别还不是特别准确。在实验中,其对英语文本内容进行了测试,AI-Text-Classifier 可以正确地将 26% 的 AI 内容正确识别,提供“可能是 AI 编写的”建议参考;同时,错误地将 9% 的人类编写内容识别为 AI 生成的,这就属于误判了。

一名教授做了道计算后称:当下,这个工具在实践中是相当无用

对此,来自洛桑联邦理工学院教授 Marcel Salathé 对这个比例进行了计算,用以判别新 AI 分类器工具到底有多大用处。

他举例道,假设一所大学有 1000 名学生被要求写一篇文章,其中 3% 的人试图作弊,用 ChatGPT 来生成文本。因此,在这个比例下,会有 30 个 AI 生成的文本和 970 个人类生成的文本。

在此背景下,该学校的一名老师听说了 OpenAI 的新人工智能检测工具,并通过这款工具来检测收到的 1000 篇文章。根据 OpenAI 提供的比率来计算:

在 970 个人类生成的文本中,9%(即 87 个)将被错误地标记为人工智能生成的。

在 30 个人工智能生成的文本中,26%(即 8 个)将被正确标记为人工智能生成的。

换句话说,老师最终可能会将有 87 8=95 个文本标记为人工智能生成的。事实上,其中只有 8 个是人工智能生成的。

Marcel Salathé 教授表示,当工具为老师提供一个肯定的(即可能是人工智能生成的)结果时,该文本实际上是人工智能生成的概率只有 8.4%。其中绝大多数实际都是人类生成的内容。相反,大多数人工智能生成的文本(30 个中的 22 个)会被标记为 "人类写的 "验证结果通过。

整体而言,Marcel Salathé 直言,举这个例子并不是对该工具进行贬低或批评。因为当一款工具被研发出来的早期,准确率需要在实验中不断迭代优化,这是一个必然的过程。

不过,他也呼吁,如果你是一名教师,并且你认为刚刚得到了一个处理人工智能生成的工具,请注意,在当前这个阶段,这个工具在实践中是相当无用的。

OpenAI 回应:正在改进

正因此,OpenAI 也特别强调了 AI-Text-Classifier 并不能可靠地检测出所有人工智能写的文本,仅是作为一个强有力的参考而存在,譬如用此工具鉴别学术论文等。

与此同时,OpenAI 也表示,面向教育工作者,AI 文本分类器在课堂上有一定的限制和影响,因为其已经为教育工作者开发了一个关于 ChatGPT 使用的初步资源(https://platform.openai.com/docs/chatgpt-education),其中概述了一些用途以及相关的限制和考虑。

目前这个分类器已经公开,面向更多的用户收集一些使用的反馈,OpenAI 称,未来会逐步分享一些改进的方法

写在最后

事实上,OpenAI 虽然提供了 ChatGPT 这样的工具,但是它并不是第一家提供识别 AI 生成内容工具的企业。

过去一段时间内,在 ChatGPT 被用于生成原创文章、故事、歌词、小说等场景时,早已引发教师、艺术家、设计者的不满,

为此,来自普林斯顿大学的学生开发了 GPTZero,其此前分享道,已有超过 95000 人尝试了他研发的 ChatGPT 检测功能的测试版,用户群体最盛的莫过于“教师”,他们有着令人难以置信的需求。另外,斯坦福大学也发布了 DetectGPT,用来判断文本是否由 AI 生成的。

如今 OpenAI 下场加入“反 ChatGPT”的战局中,也让不少网友评论道:

自己反自己,也相当于把竞争对手的路都给走了,就让别人无路可走去吧~~

万万没想到,作为大学生,还没用上呢,就彻底无望了......

毋庸置疑的是,有这样一款验证工具,确实可以减少很多行业的顾虑,尤其是对教育行业而言。你怎么看呢?欢迎留言分享你的看法。

参考:

https://digitalepi.substack.com/p/how-useful-is-openais-new-ai-detection

https://openai.com/blog/new-ai-classifier-for-indicating-ai-written-text/

花粉社群VIP加油站

1
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与花粉乐分享无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
凡本网注明 “来源:XXX(非花粉乐分享)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。
QQ:2443165046 邮箱:info@hflfx.com
关于作者
懒懒的阳光..(采蜜高手)
文章
528
主题
1
关注
0
粉丝
1
点击领取今天的签到奖励!
签到排行
随手拍
54个圈友 0个话题
华为手机随手拍,记录生活点滴之美好
华为P30pro
51个圈友 0个话题
这里是华为P30pro手机交流圈,欢迎华为P30pro用户进群交流
体验官
60个圈友 2个话题
华为花粉体验官,体验官专属的交流群
登录后查看您创建的圈子
登录后查看您创建的圈子
所有圈子
猜你喜欢
杭州互联网违法和不良信息举报平台 网络110报警服务 浙ICP备17046585号
1
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索