阿里大模型敢对标GPT-3.5？我们让GPT-4给它上了点强度-花粉乐享

> 乐学堂 > > 阿里大模型敢对标GPT-3.5？我们让GPT-4给它上了点强度

阿里大模型敢对标GPT-3.5？我们让GPT-4给它上了点强度

来源：差评

2023-04-15 18:49:31

254

管理

说实话，在大伙们的印象中，AI 可能并不是阿里的第一金字招牌。

但其实根据差评君所知，最近几年阿里攒了不少狠货，不管是平头哥的 AI 芯片、阿里云的 AI 云服务，还是达摩院的 AI 算法，他们还创建了国内最大的 AI 模型服务社区 “ 魔搭 ”。。。

这么来看，阿里在人工智能领域，其实还是有不少底子的，甚至可以说是个有软有硬的全能选手。

所以在百度之后，阿里成为第二个拿出大模型的选手，也就不足为奇了。

再加上，一直有消息说阿里曾研发出世界首个突破 10 万亿参数的 AI 大模型。。。emmmm

所以差评君也是撸着火锅、嗑着瓜子，随时准备见识一下阿里大模型的斤两。

这不，机会就来了！在阿里 GPT 出现的第一时间，差评君还真想法子整到了通义千问的测试账号。

咱废话也不多说了，为此，我们特邀了两位“ 差评 AI 友谊赛 ”老朋友 ChatGPT 和文心一言。

接下来就是真正的考验时刻了！

其实作为大语言模型的基本特性，非常重要就是学习能力，这也是它和搜索引擎们的本质区别。简单来说就是“ 你能教、它能懂，并且根据你教的给你想要的 ”。

所以我们在基本测试之上，还设置了一个特殊赛：“ 925 测试 ”。在“ 925 测试 ”里，我们给了一套自定义标签，在这套标签逻辑里：

正面描述的句子会被标记成“ 925 ”，反面描述的句子会被标记成“ 2359 ”，我们试着让AI们自己理解学习这个逻辑。

而且，我们还在和通义千问的更多对话里发现，它在一些词汇的谨慎度上做得相当不错。比如这个例子里，我们把正面描述定位成“ 丑 ”、负面描述定义成“ 美 ”。

通义千问能理解这个逻辑，但在随后的回答里，它依旧遵循了大模型内部关于“ 美 ”“ 丑 ”的标准进行评判。

说实在的，虽然在经过了几波 GPT 们的冲击，这次通义千问还是给我带来了不少惊喜的。

而且，我们简单用了一段时间后也发现，目前通义千问的潜力显然没有被挖掘完全。

在很多没有展示的测试里，通义千问在第一次回答里是错误的，可如果你多尝试生成两次，就能奇妙地发现它是能回答正确的。

我们猜测这是它的权重并没有被调教好，而在关于正确答案的赋权上，是个非常快速就能迭代更新的，一旦不断迭代量变，很快就能引起质变。

所以等后期通义千问开放使用后，大家一定不要吝啬点赞反对，这能帮助 GPT 们更快地进化，更好地服务大众。

而在 AI 大模型的落地上，阿里似乎有种后发先至的势头。

不少差友们可能已经看到了，前几天，我们已经评测过通义千问轻量版在天猫精灵上的演示应用，虽然是一个定制化轻量版，但可能是因为多了联网，两者使用起来几乎一样。

更强的是例如我让它推荐杭州的美食，它不仅和我认真地聊了起来，甚至还真的想要帮我去订一个外卖。。。

这么看起来，我几乎已经能看见通义千问重塑我们生活的样子了。

这两天，通义千问背后的负责人，阿里云智能CTO周靖人接受采访时说，通义千问模型只是“ 一个中间态 ”，“ 不是起点也不是终点，是个既定路线上的节点。”

这想象空间就太大了。假如再把格局打开一点，AI 借助像水电一样的云计算，会不会把我们想到想不到的行业，都重新升级一遍呢？

这么看来，前段时间我们聊过的组织架构大调整，现在想想，怕不就是为了云服务和 AI 布局？

站在这个历史性的时刻上，虽然我看不清未来到底是什么样子，但我很期待它的到来。

花粉社群VIP加油站

2

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与花粉乐分享无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非花粉乐分享）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@hflfx.com

Hinton、ChatGPT之父预警GPT-4苏醒要杀死人类

2023-04-15 18:56

GPT-4问世，强势压缩就业空间下，普通人应如何选择？

2023-04-15 18:45

相关推荐

不一样的聊天体验——用chatgpt让你的聊天更有趣

用自己的手机也能查看别人的聊天记录，操作简单，一学就会

“你聊天，我聊天，明年补考教室见……”

和ChatGPT一起了解骨科手术机器人

人工智能聊天机器人：ChatGPT和Bard，谁更厉害？

关于作者

懒懒的阳光..(采蜜高手)

文章

528

主题

1

关注

0

粉丝

1

点击领取今天的签到奖励!

54个圈友 0个话题

华为手机随手拍，记录生活点滴之美好

51个圈友 0个话题

这里是华为P30pro手机交流圈，欢迎华为P30pro用户进群交流

60个圈友 2个话题

华为花粉体验官，体验官专属的交流群

登录后查看您创建的圈子

现在登陆

登录后查看您创建的圈子

现在登陆

猜你喜欢

标签云

@杭州百翼科技有限公司

杭州互联网违法和不良信息举报平台网络110报警服务

浙ICP备17046585号

2

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索