图源:知乎
此外,这款传说中的产品可以实现的功能不止于知识回答,还包括AI绘画、代码生成、小说续写、文案撰写、写诗作词。
媒体向阿里巴巴内部人士证实,目前公司确实在研发相关产品,并已经处于内测阶段。据透露,目前该款产品的命名还没有最终确定。
早在2022年9月,达摩院曾发布过“通义”大模型系列。据透露,阿里版ChatGPT,正是基于通义大模型体系进行融合升级。
据报道,推出的通义大模型底座基于统一学习范式OFA等底层技术打造,具备了能搞定多种任务的“大一统”能力:不引入新增结构,单一模型即可同时处理图像描述、视觉定位、文生图、视觉蕴含、文档摘要等10余项单模态和跨模态任务。升级后,更是可以处理超过包括语音和动作在内的30多种跨模态任务。
但据知情人士透露,打造中文ChatGPT的生态,这个定义对于阿里来说可能窄了一点。相比之下,阿里更希望能引领中文大模型的发展趋势。
四、字节跳动语言图像双管齐下,组建大模型团队2月23日,从多个独立信源处获悉,字节跳动在大模型上已有所布局,分别在语言和图像两种模态上发力。字节跳动相关技术负责人对此回应:技术中台在这些领域有探索,还很初期,不成熟。一名知情人士透露,语言大模型团队由字节搜索部门牵头,目前团队规模在十数人左右。图片大模型团队则由产品研发与工程架构部下属的智能创作团队牵头。
值得注意的是,字节跳动有不少AI产品,比如:剪映,就是一款视频智能生成工具。
五、京东:“产业版”ChatGPT2月10日,京东云官微发布,京东云将推出“产业版”ChatGPT,产品名字叫:ChatJD。并公布ChatJD的落地应用路线图“125”计划。
1个平台:ChatJD智能人机对话平台2个领域:零售、金融5个应用:内容生成、人机对话、用户意图理解、信息抽取、情感分类图源:通信产业网
六、华为首个多模态千亿AI大模型本周发布华为近日宣布,4月8日将推出其最新的盘古大模型4,称“将是超过任何其他类似应用的最先进、最强大的自然语言处理应用”。根据华为云官网显示,华为即将上线的“盘古系列AI大模型”分别为:NLP大模型、CV大模型、以及科学计算大模型。其中,盘古“NLP大模型”是被认为最接近人类中文理解能力的AI大模型,而盘古“CV大模型”首次兼顾了图像判别与生成能力。
1.大模型规模华为盘古大模型的规模相对较小,仅拥有1200亿个参数;而GPT-3则有1750亿个参数,是目前最大的自然语言处理模型。因此,在某些任务上,GPT-3可能在表现上更为突出。
2.训练数据虽然盘古模型拥有的参数少于GPT-3,但是华为在训练时使用了大量的中文文本,包括不同类型的文本数据,如百科、新闻、小说、行业专业文本等。这种多样性的数据来源使得盘古模型拥有更广泛的知识和语言能力,对于中文应用来说具有很大的优势。
3.模型用途华为盘古大模型主要应用于中文的文本生成、问答、翻译等任务。而GPT-3则可以应用于英文和其他语言的文本生成、翻译、自然语言推理、问题回答等任务。由于应用领域不同,两者在某些任务上的效果也有所不同。
七、网易:教育版ChatGPT模型“子曰”将开放内测早在2月9日,网易有道方面透露,有道AI技术团队已投入到ChatGPT同源技术(AIGC)在教育场景的落地研发中,目前该团队已在AI口语老师、中文作文批改等细分学习场景中尝试应用。
同时,公司有望尽快推出相关的demo版产品,该产品的面世将标志着AIGC技术在国内互联网教育场景的首次着陆。
网易有道专为教育类场景自研的类ChatGPT模型“子曰“将于近期开放内测。
①在教育内容的数据方面,网易有道在语言学习方面有着较为深厚的积累,2007年网易便推出了有道词典,这让网易积累了较多的语言学习数据,为“子曰”提供了良好的培育土壤。
②在算力方面,针对教育垂类,成本将有所下降。有道词典笔P5产品已升级至NPU方案,相对CPU版本模型推理速度提高了数倍,实现了“一目十行”的识别效率;在模型大小增加15倍的基础上,AI引擎的精确度也获得了大幅提升。且网易有道在AI算法方面也处于国内较为领先的地位,不过有道“子曰”的最终效果能够达到何种程度目前尚不得而知。
八、360:demo版被戏称“红孩儿”“搭不上ChatGPT这班车的企业会被淘汰。”周鸿祎与张朝阳在一档栏目中如是说,而日前,360版本的GPT已经被红衣教主“抱出来让大家看看”。
3月29日,在数字安全与发展高峰论坛上,周鸿祎发布了360版“ChatGPT”。
从现场演示来看,360版GPT确实已经具备一定的推理能力,但在回答问题时,仍需要多次提问、提醒才能得出让人比较满意的答案。
图源:网络
此外,周鸿祎还表示360很快便会推出智能办公产品,并加上类 ChatGPT的能力,这一点和微软office软件的发展方向也是类似的。
此前,360称,目前360搜索是中国搜索引擎的Top 2,市场份额为35%,但截至目前仅作为内部业务自用的生产力工具使用,且投资规模及技术水平与当前的ChatGPT 3相比还有较大差距,各项技术指标只能做到略强于ChatGPT 2。由于训练数据源及应用方向的原因,在中文环境下的实际效果强于ChatGPT 2。
同时,360在数据资源端有丰富的多模态大数据积累和相关语料、尤其是中文语料,相较于国外同行落后的是预训练大模型和有效的多模态数据清洗与融合技术。公司有充足的资金储备可用于购买大规模算力,在继续深入自行研发的同时,不排除寻找强有力的合作伙伴,以开放的心态搭建多方共享平台、补足短板,快速缩小差距。
周鸿祎曾表示,360的人工智能战略用四个字形容就是“两翼齐飞”,先占据应用场景,同步全力发展核心算法技术。
九、光年之外:广纳AI人才,并购一流2月13日,原美团联合创始人王慧文,发了一条“英雄帖”,称要出资5000万美元,打造中国的OpenAI(ChatGPT主体公司),同时为自己的新事业招募人才。
第二天,北京智源人工智能研究院副院长刘江在朋友圈发文表示,已经决定加入王慧文的光年之外团队。
并称,将帮助王慧文打造中国AI大模型梦之队,对标OpenAl,打造中国自己的ChatGPT和基础大模型。
图源:微博
接着,搜狗输入法之父马占凯,发表微博称加入光年之外。
最近披露的消息是,光年之外与国产AI框架一流科技(Oneflow)将达成并购意向。目前该消息已被证实,尚在谈判中。
可以看出,无论是框架层面、模型算法层面,还是AI产品层面,人员正在齐备,光年之外的类ChatGPT产品雏形正在慢慢清晰。
十、中国版ChatGPT的困境摆在中国ChatGPT面前的问题,还不仅是硬件和训练成本。
数据语料库并不完备。一方面是在英文网站和搜索引擎内中文信息与资料并不全面,这就会造成所训练的模型对于中英文问题的回答质量并不一致。另一方面,国内互联网如百度、微信、360、科大讯飞等在简体中文之外获取的信息有限,而像知乎、微博等网站,同样缺乏非简体中文的内容全面性。
此外,在自然语言理解方面,中文的多义性有天然的高门槛,而像ChatGPT这类产品背后是整个互联网庞大的语料库,对于国内平台来说自然无法避免合规性的问题,因此除了自然的理解与回到用户的各种刁钻问题,中国版ChatGPT也需要比国外同类产品更严格的审核机制,甚至在早期可能还需要人工审核的存在。
最后,目前的AI简单粗暴的植入互联网产品的方式,并没有形成变革性的应用场景,也没有改变用户与产品之间的交互方式,也没能提高产品服务的效率,无法体现AI的实际价值。
正如李开复在发圈入局时所言,“我认为AI2.0不仅仅是个高能聊天工具,也不仅仅是图文创作的AIGC生成,Co-pilot和如今看到的应用都还只是AI2.0能力的开端。”
到底谁能在AIGC领域率先封王,我们拭目以待。
参考链接:https://www.163.com/dy/article/HTF097KM0511U9HQ.html
https://new.qq.com/rain/a/20230403A09Y9C00
https://mp.weixin.qq.com/s/7KCyf2jRAARwC03Bx8cIUw
https://juejin.cn/post/7198496671129419832
https://zhuanlan.zhihu.com/p/607467305
来源: 51CTO技术栈
花粉社群VIP加油站
猜你喜欢