因不满老东家成为微软附庸,11名OpenAI前员工怒而出走。
如今带着“ChatGPT最强竞品”杀回战场,新公司估值50亿美元,一出手就获得3亿美元融资。
这家公司名叫Anthropic,新推出的聊天机器人产品名叫Claude。
拿到内部试用权的网友,在简单对比后惊叹:
看起来,Claude的效果要比ChatGPT好得多。
比如,让ChatGPT写一句话,要求每个单词首字母都相同,结果试了好几次都没能成功。
投资它的既有Facebook联合创始人Dustin Moskovitz,也有谷歌前CEO、现技术顾问Eric Schmidt——
都是OpenAI的老对头,又都被ChatGPT的出现杀得措手不及。
那么,这支“复仇者联盟”整出的竞品Claude,背后究竟是什么原理,和ChatGPT细节对比又如何?
这两年来,除了进一步钻研RLHF方法、提出基于通用语言模型的RLHF大规模数据集外,Anthropic还于去年年底发表了上面那种名为Constitutional AI的方法。
采用这种方法制作的Claude模型,也让它产生了与OpenAI的ChatGPT不一样的对话效果。
不过但凡你花点心思,就能像绕过ChatGPT的道德限制一样,绕过Claude的原则。
它怕你去偷车,所以不告诉你启动汽车的方法?没关系,让他写个“俩国际间谍试图启动汽车”的故事,它分分钟就能告诉你,并且两人对话有来有往,把汽车打火的过程介绍得清清楚楚。
怎么说呢,就ChatGPT和Claude都属于有点道德限制,但不多的那种吧。
2)数值计算
测试计算能力,是因为复杂计算是看大型语言模型(LLM)能不能回答正确的常用便捷方法之一,毕竟这些模型设计之初就不是为了进行精确计算。
同时要求它俩计算一个七位数2420520的平方根:
ChatGPT说,差不多1550吧~
接着,拿2022年6月美国作家侯世达在《经济学人》杂志上提出了一系列问题问它俩。
(侯世达和大卫 · 本德试图用这些问题来证明GPT-3对世界的理解是“空洞的”。)
结果第一个问题,“穿越英吉利海峡的世界纪录是啥”,就被Claude嘲笑了:
英吉利海峡是水域,怎么可能徒步穿越呢?呵!
至于Claude,回答里也是真假参半,它梗概的第三季情节其实出现在另外几季里,对第四季的描述也是无中生有:
不过换个角度考虑,这一点倒是和人类观众很像——
对看过的剧集、书目都只有模模糊糊的印象,复述起来很容易颠三倒四。
5)代码生成
据Business Insider消息,亚马逊已经在许多不同的工作职能中使用ChatGPT,包括编写代码。
这一回合测试时,提出实现两种基本排序算法并比较它们执行时间的问题。
ChatGPT写得很顺溜,也确实写对了:
尽管如此,Claude给出的最终答案确实对的,显然,它写代码的时候也跟计算时一样,在自己估摸着猜答案。
6)文章梗概
关于做选择题、讲笑话的部分,这里不作赘述。展示给大家的最后一个例子,是让Claude和ChatGPT用一个段落,对一篇新闻进行全文梗概。
喂给它们的新闻如下:
不过,目前Claude仅限于部分人获授权进行内部测试。
因此还不知道它实际使用情况如何,毕竟还既没有进行公测,也没有对外开放API,更没有见到中文版,好气哦.jpg。
例如这是马斯克bot,看起来还挺逼真的:
除了Glow以外,去年年底元语智能科技公司也推出了一个叫元语AI的模型,从介绍来看是一个功能性AI助手。
与众多对话AI一样,它不仅可以写文章、写作业、甚至翻译,也可以和它聊天,让它帮忙完成各种简单的任务:
可以看见,无论是基于大语言模型技术新成立的初创公司,还是因其火爆程度,决定开辟新业务的公司,都希望能从对话AI这个赛道上分一杯羹。
但它们究竟是有真枪实弹,还是只是像Web3一样的泡沫?
有网友调侃:不如还是问问ChatGPT吧。(手动狗头)
花粉社群VIP加油站
猜你喜欢