GPT-3 是一种新的文本预测算法,在科技界引起了很大的轰动。
我们请我们的 AI 极客 Atte Honkasalo 解释 GPT-3 的真正含义以及为什么我们都应该对它感到兴奋。
Atte是我们的数据和分析主管,也是 Q 背后的策划者,我们的预测性 AI 平台可以根据 300 多个不同的增长指标对 700,000 家公司进行扫描、排名和量化。
首先,什么是 GPT-3?GPT-3(Generative Pretrained Transformer)是OpenAI开创性的第三代文本预测算法,OpenAI是一家人工智能研发公司,得到了人工智能行业众多有影响力的公司、投资者和人士的支持。
基本上,您为它提供文本输入,它生成的文本输出与人类在相同上下文中编写的内容几乎没有区别。
虽然能够以这种方式预测文本并不是 AI 中的新现象,但 GPT-3 如此具有开创性的原因在于,它是第一个可以生成文本的预训练算法,该算法可以通过人类在任何语言中编写的内容。
上下文。根据输入,GPT-3 可以生成从法律文本到博客文章、短篇小说、歌曲、诗歌、员工备忘录,甚至可以实际运行的软件代码的任何内容。
GPT-3 如何工作?GPT-3 是一种非常复杂的预训练算法。
它已经对真正大量的文本进行了训练——该算法的训练语料库中有 50 万亿个单词,是 Wikipedia 中包含的数据量的五倍。
它使用多层深度的复杂神经网络模型,包含使用超过 1750 亿(175 * 10 9!)个参数的大量节点。
相比之下,去年发布的 GPT-2 只有 15 亿个参数。
这项技术的飞跃有多大?虽然我不会说这是一项改变世界的技术,至少现在还不是,但它是人工智能的一个数量级进步。
一个难题——生成可以传递给人类输出的文本——已经成为一个已解决的问题。
“一个难题——生成可以传递给人类输出的文本——已经成为一个已解决的问题。”
这种转变类似于我们已经解决的其他人工智能问题。
例如,10 年前,我们无法可靠地识别和分类图像中的对象。
计算机视觉问题已经存在了几十年(想想邮局和地址识别),但这部分在大约五年前随着卷积神经网络的兴起和 YOLO 或 RetinaNet 等预训练算法的兴起而得到解决。
今天,人工智能系统可以查看图像并判断它是人、动物还是物体。
然而,作为通往现实世界用例的漫长道路的一个例子,物体识别是自动驾驶中的一项关键技术,但要解决这个问题,需要的不仅仅是基础技术。
我们最近解决的另一个人工智能问题是探索,它不仅用于拼车和调度系统以寻找最有效的路线,还可以在玩家需要以某种目标导向方式移动的沉浸式电脑游戏中进行测试。
一个例子是古老的街机游戏,蒙特祖玛的复仇。
已经有可以玩这个游戏的寻路 AI 算法,但它们中的大多数在一两分钟后就失败了。
一种新的强化学习算法 Go-Explore 几乎可以永远玩这个游戏。
算法是否真的理解它的要求?它可以通过图灵测试吗?GPT-3 本质上是无意识的。
虽然它可以接近人类的反应,但基于其大量的训练数据,它根本没有任何理解力。
它也没有创造力——它可以写诗,但它不能创造新的或原创的诗歌。
虽然它可能会像人类一样做出反应,但它无法做出与人类相同的智力和直觉飞跃。
“GPT-3 本质上是无意识的。虽然它可以接近人类的反应,但基于其大量的训练数据,它根本没有任何理解能力。”
例如,如果你问它一个“正常”的问题,比如“哪个更大,大象还是老鼠?
” 它可以回答说大象更大。
但如果你问一个奇怪的问题,比如,“帝国大厦和铅笔哪个更大?” ——人类可以本能地回答,但在训练数据中没有上下文的东西——算法会猜测,并且经常会错误地回答,这表明它实际上并没有理解这个问题。
图灵测试调查人们是否可以检测到他们是在与机器还是人类交谈。
因此,有可能从 GPT-3 获得与人类几乎无法区分的响应,这使我们非常接近拥有可以通过图灵测试的 AI。
但我们还没有完全做到。
最近,Twitter 对 GPT-3 感到疯狂。对这项技术的炒作是否合理?编写预测文本的人工智能并不新鲜。
我们有可以以莎士比亚风格写作的 AI,可以生成代码的 AI,甚至可以生成 JS Bach 风格的音乐的 AI。
但这些 AI 都针对特定案例进行了训练。
他们不能在除了他们接受培训的环境之外的任何环境中工作。
GPT-3 适用于任何文本上下文,这是一项巨大的科学进步,是过去几年的主要进步之一。
对这一进展的炒作当然是有道理的。
“GPT-3 适用于任何文本背景,这是一项巨大的科学进步,是过去几年的重大进步之一。关于这一进步的炒作当然是有道理的。”
但炒作可能太过分了。
是的,您可以使用它来创建准确预测人们期望的文本——例如,连贯、合乎逻辑且看起来像真正的商业计划的商业计划。
但是不会涉及任何分析或理解。
这很像我有时在会议中对所讨论的技术一无所知时的回应方式。
轮到我发言时,我可能会说:“这很好,但规模大吗?
” 或“让我们后退几步。
” 这是一个适当的回应,但并没有说明我对这个主题的理解。这或多或少是该算法在类似情况下的响应方式。
GPT-3 为创始人和 VC 创造了哪些机会?我们真的只是在比赛的开始。
该算法处于私有测试阶段,最初的几家公司已经获得了 API 的访问权限,我们才刚刚开始看到该技术应用于实际问题。
展望未来,从科学研究和技术演示到实际产品和功能,将会是一场马拉松式的比赛。
法律文件和合同似乎是一个很好的初始用例,但还会有更多我们甚至还没有想到的用例。
“展望未来,从科学研究和技术演示到实际产品和功能,将会是一场马拉松式的比赛。”
另一方面,与视频一样,存在深度伪造的真正危险。
风险范围从欺骗教师的学校论文到更复杂的网络钓鱼诈骗和错误信息机器人。
通常,您可以从质量或语气中理解假文本,但使用 GPT-3 时,假文本可能会非常真实。
GPT-3 最初作为 API 发布,Open AI 很可能会监控有害用例。
但由于这项研究是公开的,因此它将变得司空见惯,并在未来扩散到有害的用例中。
这就是为什么我们需要寻找创新来确定文档是否是通过算法创建的。
纵观全局,GPT-3 有潜力在各行各业创造大量机会。
例如,公司可以将 GPT-3 用作生成文本的核心技术,并将其开发工作和资源集中在使其产品差异化的功能和特性上,而不是将开发工作集中在特定上下文的文本生成上。
最后,文本只是数据。
从这些数据中创造价值的东西——独特的产品特性和功能——才是最重要的。
GPT-3 可以消除障碍,使公司能够做以前根本不可能的事情。
花粉社群VIP加油站
猜你喜欢