华安证券:尹沿技 王奇珏 胡杨 张天 金荣
ChatGPT引发的大模型时代变革,数据要素重要性提升
ChatGPT是由OpenAI研发的一种语言AI模型,其特点在于使用海量语料库来生成与人类相似的反应。初代GPT模型参数1.17亿,GPT2模型、GPT3模型参数分别达到15亿、1750亿。不断提升的参数量级,使得ChatGPT3当前已经能够应用在商业、研究和开发活动中。
当前此类参数体量庞大的模型,成为各大科技厂商研发的重点。大模型的基础为高质量大数据。ChatGPT的前身GPT-3就使用了3,000亿单词、超过40T的数据。此类大数据基础的前提为三部分1)有效场景下的采集数据;2)大数据的存储、清洗和标注;3)数据质量检验。
大模型发展之下,算力与网络设施建设成为刚需
算力:随着参数量和语料库指数级的扩容,ChatGPT类人工智能需要更充足的算力支持其处理数据,同时需要投入更多高性能的算力芯片来处理千亿级别参数量。英伟达的研究表示,GPT-3模型需要使用512颗V100显卡训练7个月时间,或者使用1024颗A100芯片训练长达一个月的时间。2012 年以来,人工智能训练任务中的算力增长(所需算力每3.5月翻一倍)已经超越芯片产业长期存在摩尔定律(晶体管数量每18月翻一倍)。
网络设施:以目前独家开放了ChatGPT调用能力的微软Azure为例,其AI基础设施由互联的英伟达 Ampere A100 Tensor Core GPU组成,并由Quantum infiniBand交换机提供强大的横向扩展能力。根据微软宣布,每台GPU服务器网络连接能力为400Gbps。服务器节点多、跨服务器通信需求巨大,网络带宽性能成为GPU集群系统的瓶颈,解决的方式包括增加单节点通信带宽与降低网络收敛比。由此带来光模块、交换机等网络设施需求。
下游应用场景丰富,多行业落地可期
1)“生成式AI (generative AI)”在互联网及元宇宙领域市场化空间较为广阔。基于现行的NLP算法发展程度及数据集规模,在不久的将来,生成式AI有较大可能在“智能客服”和“搜索引擎”进行增值,并有希望以“插件”的形式赋能现有的“生产力工具链(工程软件/音视频制作工具等)”。
2)人工智能在制造业的应用可分为三方面:a)智能装备:指具有感知、分析、推理、决策、控制功能的制造装备,典型代表有工业机器人、协作机器人、数控机床等;b)智能工厂:利用各种现代化的技术,实现工厂的办公、管理及生产自动化,典型的代表场景有协作机器人、智能仓储物流系统等;c)智能服务:指个性化定制、远程运维及预测性维护等,典型代表有工业互联网等。
3)人工智能在智能汽车领域的应用包括:a)智能驾驶依托人工智能技术,将从驾驶辅助发展至自动驾驶;b)智能座舱在人工智能技术的支持下,从出行工具演变为出行管家。
风险提示
国内大模型不及预期风险;行业竞争加剧风险;AI应用的伦理道德风险;芯片及芯片技术供应风险;商业模式变现与落地不及预期风险。
本文源自券商研报精选
花粉社群VIP加油站
猜你喜欢