7月7日,在2023世界人工智能大会“生成式AI与大模型:变革与创新”论坛上,启明创投携手未尽研究共同发布《生成式AI》报告。
报告显示,政府对于生成式人工智能的监管反应相当及时,各国也出现了不同的特点。中国在迅速推出生成式人工智能的监管办法并征求意见的同时,也在鼓励发展通用人工智能,北京、上海、深圳是最具雄心的第一梯队,均提出了较具雄心的人工智能科研、创新与产业目标。欧盟继续在监管和立法方面领先,一如其5年前率先推出GDPR。美国更在意人工智能技术的领先地位,正在形成以风险管理为原则的监管框架。
长期来看,人才对人工智能未来的影响,超过了算力。中国研究人员发布的论文在数量上已经超过了美国,但金字塔顶端,无论是研究还是创业,美国仍然占据明显的优势。在全球范围内,人工智能研究创新的重心正从高校转移至企业,美国拥有顶尖学者最多的前三大机构,分别是谷歌、微软与Meta,合计招揽了美国顶级学者的30%。中国仍以高校为主,仅阿里巴巴跻身前10。
2022年和2023年,是生成式人工智能技术取得突破的两年,报告经过梳理论文,发现生成式人工智能领域的一个突出特征,是研究与创新过程的密切结合,许多在企业内部实现,迅速推出用例和产品。这种研究与创业的一体化,初创企业和风险资本起到了重要的作用,而美国科技巨头和主要人工智能企业的研究投入与人才,包括一些底层技术的研究,这些年来已经超过了大学等研究机构。
有意思的是,报告还对行业未来作出了10大前瞻性预测——
大语言模型方面,2024年中国将出现比肩GPT-4的多语言通用大模型;超长上下文(Long Context)将引领下一次LLM技术突破;在出现更有前景的大语言模型之前,为实现垂直领域更好的效果,以下三种方式将共存:一是在不改变数据分布的情况下,利用更多通用数据进行通用大模型预训练,不特别引入行业数据,二是利用行业专属数据微调(Fine-Tuning)通用大模型,三是利用行业数据占比更高的数据集进行垂直模型预训练。
多模态模型方面,当前CLIP Diffusion的文生图模型是过渡态,未来2年内将出现一体化的模型结构;下一代Text-to-Image模型将具备更强的可控性,它将结合底层模型能力和前端控制方式,对模型的设计将注重与控制方式的结合;2025年之前,Video和3D等模态将迎来里程碑式的模型,大幅提高生成效果;以PALM-E为代表的具身智能(Embodied AI)展现出在机器人的感知、理解和决策等方向上的巨大潜力,但当前训练和可靠性存在较大挑战;短期内Transformer正成为多个模态的主流网络结构,但压缩整个数字世界的通用方法尚未出现,Transformer并不是人工智能技术的终点。
商业机会方面,3年内,颠覆式的AI应用的核心驱动力来自于底层模型的创新,两者无法解耦,模型的作用将大于产品设计的作用;当前生成式AI市场处于技术主导的早期阶段,存在千亿美元市值的平台型企业的机会。
题图来源:上观题图 图片编辑:雍凯
来源:作者:张杨
花粉社群VIP加油站
猜你喜欢