回顾人类历史,每一次工业革命的核心驱动力都在于解决了关键技术的通用性之后,实现生产方式的巨大变化和生产力水平质的飞跃,从而深刻影响到人类社会的发展。
同样,正在到来的第四次工业革命中,若想让作为生产要素的数据、作为生产工具的智能技术真正释放出强大的数字生产力,实现生产力范式的变革,解决AI等智能技术的通用性恰如打通“任督二脉”般关键,也即如何真正降低AI落地门槛、实现AI技术随取随用。
但这并非易事,不仅涉及到AI技术、平台的创新,更与AI应用、产业实践经验息息相关,绝非一朝一夕之功所能完成,更需要产业界伙伴的长期努力。
今天,在华为全联接大会2022中国站上,华为云正式发布了《预训练大模型白皮书》,并且全新推出了矿山、气象、OCR三个大模型、天筹AI求解器智能建模工具以及数字人大脑等共9项云服务,多管齐下推动AI产业化走向落地。
正如华为云EI服务产品部部长尤鹏所言:“华为云践行‘一切皆服务’理念,将AI等先进技术、经验和应用开放在云上,全方位帮助更多企业在数字化转型中利用好云的新能力,实现从‘上好云’到‘用好云’的跨越。”
AI落地需要这样的大模型“有多少智能背后就有多少人工!”--这虽然是人工智能领域近年来流行的一句揶揄之语,却也道出了AI落地在理想与现实之间的窘迫。
如今AI走向落地的确遇到诸多明显挑战:
模型专用特定领域属性明显,使得AI模型和应用开发存在大量碎片化的现象,在构建和训练模型上往往耗费大量资源;很多模型的数据质量参差不齐,数据样本少的情况比比皆是;模型精度不尽人意,训练效果差和训练周期长,导致模型在真实业务场景中实际效果差强人意。如何打破这种局面?业界普遍认为,预训练巨量模型的脱颖而出,正在努力改变这种局面。预训练巨量模型就像现阶段人工智能的一个集大成者,实现一个AI模型在多个场景通用、泛化和规模化复制,减少对数据标注的依赖,大幅降低AI开发与应用的使用成本,推动人工智能真正向着通用化、工业化、集约化发展。
例如,华为云的盘古大模型就是突出代表。盘古大模型由NLP(中文语言)大模型、CV(视觉)大模型、多模态大模型、科学计算大模型、Graph(图网络)大模型等多个大模型构成,其中,盘古NLP大模型是业界首个千亿参数的中文大模型。盘古大模型的问世是为了解决传统AI作坊式开发模式下不能解决的AI规模化、产业化难题。
如今,“预训练大模型”已经成为人工智能领域快速发展的热点方向。近年来,参数规模和模型性能不断创新高,颇有些唯“参数量至上”的趋势。但模型参数的多少并不是评判模型能力的最好标准,模型的长期规划、模型的鲁棒性以及行业落地实践才是决定“预训练大模型”能否成功的胜负手。
显然,华为云在“预训练大模型”的长远发展方面棋高一招。
据悉,自2021年4月正式发布以来,华为云盘古大模型已经发展出L0、L1、L2三大阶段的成熟体系持续进化。所谓L0是指NLP大模型、CV大模型等五大水平领域的基础大模型;而L1指行业大模型,比如气象、矿山、电力等行;L2指面向各行业中细分场景的模型,比如电力行业的无人机巡检等。
在本次大会上,华为云又正式发布了盘古矿山大模型、盘古气象大模型和盘古OCR大模型三个大模型。盘古OCR大模型解决了OCR领域算法普适性不强的问题,并将标注工作量降低90%;相较于以前的文字识别预训练模型,盘古OCR大模型在11项公开数据集中取得显著的精度提升,而且与原本领先的文字识别算法相比,盘古OCR大模型的精度平均提升5%以上。
华为云的盘古气象大模型也极具意义。众所周知,近年来极端天气频发,给全球经济和人们生活造成了极大破坏,利用人工智能技术来预测天气就成为大势所趋。华云盘古气象大模型支持秒级预测未来7天全球天气情况,相比传统预报算法,速度提升1000倍、精度提升20%。
例如,今年8月,华为云盘古气象大模型实现秒级预测台风“马鞍”的登陆时间与轨迹,平均准确率90%,远超业界。
华为云盘古矿山大模型则覆盖整个矿区的8大主要业务场景和1000多个细分场景,边用边学、自我进化,通过学习少量异常样本就能识别所有存在风险的异常情况,模型精度达98%,相比传统模型平均提升10个百分点,有效保障井下安全。
毫无疑问,“预训练大模型”的出现,是人工智能与大数据、大算力结合的必然结果,也是人工智能现阶段发展的必然趋势。但如何“预训练大模型”之路走的既稳又远,让大模型不断融入到行业场景乃重中之重。“华为云正在不断迭代盘古大模型的能力,也让盘古大模型一步步从实验室走向千行百业,成为AI开发的操作系统。”华为云EI服务产品部部长尤鹏如是说。
在平台层面,华为云发布了基于AI资产重用的AI落地新范式及其平台ModelArts Pilot。ModelArts Pilot具备“零代码开发”“丰富的模型资源”“自动化”和“持续进化”四项优势,支持AI应用自动生成,开发工作无需强依赖算法工程师。用户仅需要提供数据和需求描述,即可触发自动化流程,在调用API后仅需几行代码即可完成AI应用开发。
除了工具和平台外,华为云还致力于推动AI应用开发生态的成长与健壮,寄希望通过生态的力量来不断哺育开发者,降低AI开发难度和开发成本。为此,华为云推出了D-Plan生态伙伴计划,联合生态伙伴进行技术创新、项目交付、项目资产沉淀至平台并进行推广和复用,构建合作共赢的AI生态体系。
目前,华为云已经与行业ISV合作伙伴打造了9个行业场景Usecase,包括出行调度、销量预测、生产排程、货架识别、工业质检、游戏AI等。这些AI Usecase和5万多个AI资产都沉淀在华为云AI平台上,开发者可以随时利用AI资产库(算法、模型等)和方案来解决AI问题。
“事实上证明,云对于推动AI产业化极具价值。在华为云上,包括AI求解器开发环境和集成工具,只需4周时间就能完成AI应用开发,相比传统方式3-6个月时间,大幅提升了AI开发效率。” 华为云EI服务产品部部长尤鹏总结道。
《预训练大模型白皮书》为何值得关注不可否认,“预训练大模型”如今被视为解决各种AI挑战的重要路径,业界对于“预训练大模型”的研究和应用也呈现百花齐放的局面。但“预训练大模型”距离规模化商业应用,还有需要持续演进和发展,不仅包含技术的演进,更包含商业模式的进化。
为此,华为云在本次大会上正式发布了《预训练大模型白皮书》,将华为云在大模型领域的研究与落地经验进行总结。由华为云人工智能领域首席科学家、IEEE Fellow、国际欧亚科学院院士田奇带领的盘古大模型研发团队认为,“预训练大模型”将成为未来AI计算的“操作系统”,向下管理AI 硬件,向上支撑AI 算法,将使得AI 开发更加规范化、可复制。
《预训练大模型白皮书》从人工智能发展趋势的角度详细剖析了大模型的由来、现状和未来趋势,并结合盘古大模型的五大模型、应用案例等介绍了大模型的应用情况,对于各行各业的企业CIO、开发者们普及大模型的价值与作用大有裨益。
例如,《预训练大模型白皮书》有两个重要判断:其一、在下一个划时代的计算模型出现以前,大模型将是人工智能领域最有效的通用范式,并将产生巨大商业价值;其二、对大模型的研究,将可能启发下一个通用计算模型。
另外,《预训练大模型白皮书》并未一味神化“大模型”的作用,而是从客观角度认为“预训练大模型”存在着局限性,即数据集越大、模型越大,提升同等精度所需要的代价就越大。为此,《预训练大模型白皮书》也探索了大模型落地的新思路,即针对小样本、长尾分布场景,云训练大模型与预置工作流配合往往能达到很好效果。
数字化是一道必答题。华为云希望让技术不难选、不难用,让企业从‘上好云’到‘用好云’,尤其是从多方位推动AI产业化,真正帮助千行百业的用户释放数字生产力,从而实现跨越式发展。
花粉社群VIP加油站
猜你喜欢