说实话,在大伙们的印象中,AI 可能并不是阿里的第一金字招牌。
但其实根据差评君所知,最近几年阿里攒了不少狠货,不管是平头哥的 AI 芯片、阿里云的 AI 云服务,还是达摩院的 AI 算法,他们还创建了国内最大的 AI 模型服务社区 “ 魔搭 ”。。。
这么来看,阿里在人工智能领域,其实还是有不少底子的,甚至可以说是个有软有硬的全能选手。
所以在百度之后,阿里成为第二个拿出大模型的选手,也就不足为奇了。
再加上,一直有消息说阿里曾研发出世界首个突破 10 万亿参数的 AI 大模型。。。emmmm
所以差评君也是撸着火锅、嗑着瓜子,随时准备见识一下阿里大模型的斤两。
这不,机会就来了!在阿里 GPT 出现的第一时间,差评君还真想法子整到了通义千问的测试账号。
咱废话也不多说了,为此,我们特邀了两位“ 差评 AI 友谊赛 ”老朋友 ChatGPT 和文心一言。
接下来就是真正的考验时刻了!
其实作为大语言模型的基本特性,非常重要就是学习能力,这也是它和搜索引擎们的本质区别。简单来说就是“ 你能教、它能懂,并且根据你教的给你想要的 ”。
所以我们在基本测试之上,还设置了一个特殊赛:“ 925 测试 ”。在“ 925 测试 ”里,我们给了一套自定义标签,在这套标签逻辑里:
正面描述的句子会被标记成“ 925 ”,反面描述的句子会被标记成“ 2359 ”,我们试着让AI们自己理解学习这个逻辑。
而且,我们还在和通义千问的更多对话里发现,它在一些词汇的谨慎度上做得相当不错。比如这个例子里,我们把正面描述定位成“ 丑 ”、负面描述定义成“ 美 ”。
通义千问能理解这个逻辑,但在随后的回答里,它依旧遵循了大模型内部关于“ 美 ”“ 丑 ”的标准进行评判。
说实在的,虽然在经过了几波 GPT 们的冲击,这次通义千问还是给我带来了不少惊喜的。
而且,我们简单用了一段时间后也发现,目前通义千问的潜力显然没有被挖掘完全。
在很多没有展示的测试里,通义千问在第一次回答里是错误的,可如果你多尝试生成两次,就能奇妙地发现它是能回答正确的。
我们猜测这是它的权重并没有被调教好,而在关于正确答案的赋权上,是个非常快速就能迭代更新的,一旦不断迭代量变,很快就能引起质变。
所以等后期通义千问开放使用后,大家一定不要吝啬点赞反对,这能帮助 GPT 们更快地进化,更好地服务大众。
而在 AI 大模型的落地上,阿里似乎有种后发先至的势头。
不少差友们可能已经看到了,前几天,我们已经评测过通义千问轻量版在天猫精灵上的演示应用,虽然是一个定制化轻量版,但可能是因为多了联网,两者使用起来几乎一样。
更强的是例如我让它推荐杭州的美食,它不仅和我认真地聊了起来,甚至还真的想要帮我去订一个外卖。。。
这么看起来,我几乎已经能看见通义千问重塑我们生活的样子了。
这两天,通义千问背后的负责人,阿里云智能CTO周靖人接受采访时说,通义千问模型只是“ 一个中间态 ”,“ 不是起点也不是终点,是个既定路线上的节点。”
这想象空间就太大了。假如再把格局打开一点,AI 借助像水电一样的云计算,会不会把我们想到想不到的行业,都重新升级一遍呢?
这么看来,前段时间我们聊过的组织架构大调整,现在想想,怕不就是为了云服务和 AI 布局?
站在这个历史性的时刻上,虽然我看不清未来到底是什么样子,但我很期待它的到来。
花粉社群VIP加油站
猜你喜欢