4月7日晚,阿里云大模型“通义千问”启动邀测。至此,包括百度、阿里、京东等大公司均已公开发布大模型产品。北青报记者了解到,目前尚有多个公司已有或正在研发类ChatGPT产品,分析认为,未来一段时间内,各公司将会密集布局相关产业和应用,4-5月将是产品密集发布期。
百度首发“文心一言”大模型
百度是国内首个公布对标ChatGPT产品的大厂。3月16日,百度发布了大语言模型、生成式AI产品文心一言。百度创始人、董事长兼首席执行官李彦宏展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。
ChatJD 落地应用路线图,包含一个平台、两个领域、五个应用。1个平台:ChatJD智能人机对话平台,即自然语言处理中理解和生成任务的对话平台,预计参数量达千亿级。2个领域:零售、金融,得益于京东云在零售与金融领域10余年真实场景的深耕与沉淀,已拥有4层知识体系、40多个独立子系统、3000多个意图以及3000万个高质量问答知识点,覆盖超过1000万种自营商品的电商知识图谱,更加垂直与聚焦。5个应用:内容生成、人机对话、用户意图理解、信息抽取、情感分类,涵盖零售和金融行业复用程度最高的应用场景,在客户咨询与服务、营销文案生成、商品摘要生成、电商直播、数字人、研报生成、金融分析等领域将发挥广泛的落地价值。
商汤将于4月10日发布最新进展
商汤方面宣布将在4月10日下午举办技术交流日活动,分享人工智能技术的前沿进展,据悉,这次将公布其在大模型方面的最新情况。
商汤科技方面负责人曾表示,商汤早在2021年上市时便提出“一平台 四支柱”的战略定位,其中“一平台”就是指SenseCore AI大装置这一AI基础设施,它也是对于算法模型,特别是大模型开发提供重要的算力基础。
商汤SenseCore AI大装置完成2.7万块GPU的部署并实现了5.0 exaFLOPS的算力输出能力,目前可最多支持20个千亿参数量大模型(以千卡并行)同时训练,最高可支持万亿参数超大模型的训练。商汤称,SenseCore已支持了超过10个大模型训练项目,包括语言、文生图、视觉、多模态模型。
商汤科技CEO徐立表示,商汤作为专注人工智能企业,未来首先将在大基础设施领域,为行业提供更好的算力基础赋能。在此基础上,商汤科技也将提供完整的框架,来赋能下游的行业应用。
旷视布局大模型已有4、5年时间
旷视也早已在大模型方向有所布局。据旷视科技CEO印奇介绍,大模型这个方向是确定性的。“不是因为今天热门了才做,我们已经做了有四五年的时间了。”
他表示,认知智能大模型为人工智能技术和应用带来了重大机遇与历史意义。认知智能大模型改变了信息分发获取模式、革新了内容生产模式、在万物互联时代实现全新人机交互方式,也将为科研工作、个人工作生活辅助、编程等带来全新变革。结合讯飞持续深耕的业务赛道,认知智能大模型在智慧教育、人机交互、智慧办公、AIGC、企业数字化、工业互联网等领域可能会带来新的应用创新思考。例如在智慧教育领域,认知智能大模型可覆盖“教、学、考、评、管”的全链路场景,在学习评测、学情分析、个性化推荐等方面助力精准教学;在当下火热的AIGC领域,通过在文本、图像、音视频的创作上不断创新,认知智能大模型可以驱动AIGC的质量不断提升、成为未来内容生成的主力。
为了进一步提高大模型在细分行业的实用性,讯飞已实行了“1 N认知智能大模型”攻关计划。其中,“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”则是应用于教育、医疗、人机交互、办公等多个行业领域的专用大模型版本。
刘聪介绍道,在5月6日,讯飞“1 N认知智能大模型”也将正式发布,“N”个场景的示范性应用产品也将随之呈现。“我们希望为打造中国的认知智能大模型贡献自己的力量。”
文/北京青年报记者 温婧
编辑/田野
【版权声明】本文著作权(含信息网络传播权)归属北京青年报社所有,未经授权不得转载
花粉社群VIP加油站
猜你喜欢