自美国AI公司OpenAI于2022年11月30日发布全新通用型对话系统ChatGPT并免费开放网页端试用功能以来,经过短短5天,活跃人数就超过100万,2个月的活跃人数就达1个亿,打破了史上增长最快的消费者应用程序的记录。ChatGPT在写提纲、编邮件、优化语句、合成代码、修复Bug等要求下的内容生成,不仅效果优异,在完成速度上也有着优越的表现,展现了ChatGPT文本生成能力的强大应用场景。与之前推出的小冰、小度、Siri等对话机器人相比,ChatGPT的回复更为智能,大多数情形下能够结合上下文形成“有逻辑的对话”,实现了从“人工智障”到“强人工智能”的跨越性转变。
2023年3月15日凌晨,OpenAI再次推陈出新,发布多模态预训练大模型 GPT-4。OpenAI声称:“这是OpenAI努力扩展深度学习的最新里程碑。它接受图像和文本输入并进行文本输出,虽然在许多现实场景中它尚不如人类,但在各种专业和学术基准上已表现出与人类相当的性能”。这意味着生成式人工智能将不限于文本领域,借助人工智能直接生成图像、视频等素材的愿想正在逐步迈向现实。
ChatGPT的横空出世,使人工智能的发展进入全新的阶段。英伟达CEO黄仁勋表示“ChatGPT 相当于 AI 界的 iPhone 问世”。那么,ChatGPT由何而来,为何而生,又向何而去?在这个过程中,人工智能本身面临怎样的风险与挑战,又会对人类社会生态和就业环境造成怎样的影响?对这些问题的解答构成了本文的逻辑主线。
NO.1
由何而来——ChatGPT的发展历程
现有ChatGPT的问世并非一蹴而就,在此之前,OpenAI已为ChatGPT基础模型的构建进行了长达5年的筹备与测试。2018年OpenAI发布了第一代GPT(Generative Pre-trained Transformer)模型,利用Transformer的神经网络架构,通过在大规模语料库上进行预训练来生成自然语言文本,从此自然语言处理进入“预训练”时代。在接下来的几年里,OpenAI不断改进和扩展GPT模型,推出了GPT-2、GPT-3等版本。这些模型在生成自然语言文本方面不断取得新的突破,并引起了学术界和产业界的高度关注。其中,GPT-3模型已含有1750亿超大规模的参数,并且能够借助语境学习(In-context Learning),判断语句的褒贬。比如,输入“我觉得你很有趣,这句话的情感是——”,那么GPT-3直接能够输出结果“褒义”,这标志着人工智能开始具备对文字情感的感知能力。
基于GPT3.5 并加入监督数据微调得到的 ChatGPT,可以通过学习和理解人类语言,用对话的方式进行交流,这种形式不仅能够提升用户的交互体验感,而且能够根据用户反馈进行回答调整和细化,从而更好地理解和满足用户的具体要求。ChatGPT在对话、写作等多方面的优秀表现,掀起了预训练大模型的浪潮,学界和业界纷纷开始迅速启动并跟进研制自己的大规模预训练语言模型,以追赶新一代AIGC(AI Generated Content)的风口浪尖。与此同时,OpenAI也在不断改进GPT模型的训练和应用方式,除ChatGPT外,OpenAI还开发了一个能够根据文字描述生成相对应图像DALL-E的模型。
3月15日,GPT-4震撼发布,在文字输入篇幅、回答准确性等方面实现了质的跃升,还可以生成诗歌等创意性文本,实现风格变化。为了让人们直观感受GPT-4带来的全新升级,OpenAI的总裁和联合创始人Greg Brockman还亲自在YouTube上发布直播,实时演示Live Demo中GPT-4的强大功能——报税、写诗、代码自动纠错……GPT-4轻松解决了原本GPT3.5难以达成的任务目标。据悉,OpenAI用了6个月的时间改进ChatGPT的使用缺陷并使用对抗性测试程序对GPT-4进行迭代调整,从而在可控性和真实性等方面取得了有史以来的最佳表现。此外,GPT-4开始接受图像作为输入介质。比如,用户可以向ChatGPT发送冰箱内的食材照片并征求食材分类存放的建议,学生也可以发送专业题目的截图并要求ChatGPT给出参考答案。
ChatGPT迅速引爆了新一轮AI军备竞赛。谷歌于2023年2月7日宣布即将推出由LaMDA模型支持的对话式人工智能服务Bard,在此之后仅仅24个小时,微软迅速上线了基于ChatGPT 类技术的 New Bing,并计划将 ChatGPT 集成到 Office 办公套件中。除此之外,苹果、亚马逊、华为、阿里巴巴等企业也均明确表态正在进行类 ChatGPT 模型研发与布局。在这个有望超万亿元的AIGC超级赛道里,谁能引领技术先机,谁就将率先掌握定价权,迎来庞大的市场份额和商业空间。
NO.4
风险向内——ChatGPT带来的挑战
在ChatGPT不断迭代更新的同时,对AIGC产物所存在挑战的讨论也与日俱增。这一部分由ChatGPT当前的技术限制所引发,另一部分则是由人类对ChatGPT的不当使用所导致。本文以ChatGPT可能带来的隐私泄露、信息伪造和伦理道德风险为例,洞察AIGC的发展给人类造成的可能挑战和并尝试给出应对举措。
隐私泄露。用户在使用ChatGPT过程中,输入的文本内容可能会包含敏感信息,例如个人身份、财务信息等。若这些信息被 ChatGPT 收集和记录,那么就可能会被未经授权的第三方访问和使用,导致隐私泄露风险。此外,ChatGPT 可能会通过分析用户的对话历史记录,获得用户的喜好、兴趣和行为习惯等敏感信息。如果这些信息被滥用,就可能会导致用户的隐私泄露。为此,ChatGPT应当对用户输入数据进行加密,并设置数据保留期限,确保及时删除用户私密信息。同时,ChatGPT管理人员应当定期进行数据安全审计和风险评估,及时发现和解决可能存在的数据泄露问题。
信息伪造。由于ChatGPT不具有对错判断能力,也无法借助合理依据对生成内容进行可信度的验证,因此可能会生成虚假信息,例如伪造用户的对话内容、创建虚假新闻报道等,从而对公众造成误导。若这些虚假信息被ChatGPT快速合成并广泛传播,将造成网络虚假信息泛滥,网络用户将更加难以甄别这些信息的真伪。为此,ChatGPT未来应当持续提升对合成信息真伪的识别能力,并采用图像识别和语音识别等多种技术手段尝试过滤虚假信息。
伦理道德。由于训练数据的来源和质量参差不齐,ChatGPT可能会习得偏见和歧视性,并将这些特征表现在生成的文本中。例如,它可能会重复流行的性别和种族刻板印象,或者用含有歧视性的语言描述特定群体。为此,未来有必要建立更广泛和多样化的训练数据集,以减少数据源的偏见和歧视性。此外,可以使用一些技术手段来检测和修正ChatGPT生成的偏见和歧视性文本,尽量避免算法歧视问题的出现。
NO.6
拥抱未来——是机遇还是挑战?
尽管人工智能对会部分重复性高、创造性不足的行业及岗位造成一定的就业替代,但同样会激发全新的业态和岗位需求。普华永道于2018年1月发布报告《人工智能和相关技术将对中国就业市场产生什么净影响?》。报告指出,人工智能及相关技术在未来20年将取代中国现有约26%的工作岗位,但与此同时,随着生产效率和实际收入水平的提高,这些技术也会创造许多新的就业。对于中国就业的净影响,报告认为,人工智能将净创造约12%的新增岗位,相当于未来20年内增加约9,000万个就业岗位。
在人工智能机遇和挑战并行的时代,我们无法阻碍人工智能发展的热潮,拥抱人工智能未来、不断提升个人技能和创造力以应对不断变化的工作需求是最明智的选择。复旦大学计算机学院教授黄萱菁表示,未来一段时间内,ChatGPT还不足以完全替代某一个岗位,但将大大促进各个领域的生产效率:“在肉眼可见的未来,善用AI的人将和不用AI的人在工作效率上会产生巨大差距,因此我鼓励大家多去使用和熟悉与AI进行沟通。”
叶明
Ye Ming
管理学博士,长江产业经济研究院研究员。
曾获第二十二届“安子介国际贸易研究奖”、中国新兴经济体年会优秀论文二等奖、中国数量经济学年会优秀论文奖等。长江产经
智库
花粉社群VIP加油站
猜你喜欢