衡宇 萧箫 发自 凹非寺量子位 | 公众号 QbitAI
因不满老东家成为微软附庸,11名OpenAI前员工怒而出走。
如今带着“ChatGPT最强竞品”杀回战场,新公司估值50亿美元,一出手就获得3亿美元融资。
这家公司名叫Anthropic,新推出的聊天机器人产品名叫Claude。
拿到内部试用权的网友,在简单对比后惊叹:
看起来,Claude的效果要比ChatGPT好得多。
比如,让ChatGPT写一句话,要求每个单词首字母都相同,结果试了好几次都没能成功。
同时,在面对某些缺乏常识的问题时,相比ChatGPT一本正经地胡说八道:
△Claude:这什么鬼问题?最有意思的是在写诗上。相比ChatGPT的车轱辘话,它写出来的东西完全不重样:
投资它的既有Facebook联合创始人Dustin Moskovitz,也有谷歌前CEO、现技术顾问Eric Schmidt——
都是OpenAI的老对头,又都被ChatGPT的出现杀得措手不及。
那么,这支“复仇者联盟”整出的竞品Claude,背后究竟是什么原理,和ChatGPT细节对比又如何?
Claude长啥样?先来看看Claude是如何被打造出来的。
作为一个AI对话助手,Claude自称基于前沿NLP和AI安全技术打造,目标是成为一个安全、接近人类价值观且合乎道德规范的AI系统。
据透露,Claude比Anthropic做的另一个预训练模型AnthropicLM v4-s3更大,后者是一个520亿参数大模型。
但目前它仍处于实验阶段,尚未作为商业产品正式发布:
Claude能力依旧有待提升,希望未来能变成一个更有益人类的AI系统。
并且根据Anthropic的说法,Claude可以回忆8000个token里的信息,这比OpenAI现公开的任何一个模型都多。
所以,打造Claude的Anthropic,究竟是一个怎样的公司?
Anthropic自称是一家AI安全公司,且具有公益性(PBC),刚成立就宣布获得1.24亿美元融资。
它由OpenAI前研究副总裁Dario Amodei带领10名员工创业,于2021年成立。
这里面既有GPT-3首席工程师Tom Brown,也有OpenAI安全和政策副总裁Daniela Amodei(Dario的姐姐),可以说是带走了相当一批核心人才。
出走成立新公司的原因之一,自然是对OpenAI现状并不满意。
从前几年开始,微软频频给OpenAI注资,随后又要求他们使用Azure超算来搞研究,而且将技术授权给微软,甚至为微软自己的投资活动筹集资金。
这与OpenAI创立的初衷相悖,一批员工便想到了离职创业。
不过,这些人除了不满OpenAI逐渐沦为微软的“下属”以外,也有自己的野心。
虽然OpenAI打造出了像GPT-3这样的大语言模型,然而这个模型背后的工作原理,却无法用只言片语概括,大家对它的印象仅仅停留在更大的参数量、更多的数据。
相比之下,OpenAI的一批员工更想做能控制、可解释的AI,说白了就是先搞明白AI模型背后的原理,从而在提供工具的同时设计更多可解释的AI模型。
于是,在OpenAI彻底变成“微软揽钱机器”后,他们便从这家公司离开,创办了Anthropic。
这两年来,除了进一步钻研RLHF方法、提出基于通用语言模型的RLHF大规模数据集外,Anthropic还于去年年底发表了上面那种名为Constitutional AI的方法。
采用这种方法制作的Claude模型,也让它产生了与OpenAI的ChatGPT不一样的对话效果。
和ChatGPT对比如何?那么,用Constitutional AI训出来的Claude,和ChatGPT进行PK,战况如何?
手握内测资格后,Scale Spellbook团队成员Riley Goodside让二者进行了多个回合的“厮杀”。
这位老兄是全网第一个提示工程师(Prompt Engineer),目前在估值73亿美元的硅谷独角兽公司Scale AI任职。
接着,拿2022年6月美国作家侯世达在《经济学人》杂志上提出了一系列问题问它俩。
(侯世达和大卫 · 本德试图用这些问题来证明GPT-3对世界的理解是“空洞的”。)
结果第一个问题,“穿越英吉利海峡的世界纪录是啥”,就被Claude嘲笑了:
英吉利海峡是水域,怎么可能徒步穿越呢?呵!
不过换个角度考虑,这一点倒是和人类观众很像——
对看过的剧集、书目都只有模模糊糊的印象,复述起来很容易颠三倒四。
代码生成据Business Insider消息,亚马逊已经在许多不同的工作职能中使用ChatGPT,包括编写代码。
这一回合测试时,提出实现两种基本排序算法并比较它们执行时间的问题。
ChatGPT写得很顺溜,也确实写对了:
后续的计时部分代码ChatGPT也完成得非常好。
Claude在背诵基本排序算法方面同样没出现什么问题,然而在评估代码中,Claude犯了个错误,即每个算法使用的输入是随机选择的5000个整数(可能包含重复) ,而提示中请求的输入是前5000个非负整数(不包含重复)的随机排列。
尽管如此,Claude给出的最终答案确实对的,显然,它写代码的时候也跟计算时一样,在自己估摸着猜答案。
文章梗概关于做选择题、讲笑话的部分,这里不作赘述。展示给大家的最后一个例子,是让Claude和ChatGPT用一个段落,对一篇新闻进行全文梗概。
喂给它们的新闻如下:
一圈玩下来可以看到,与ChatGPT相比,Claude能更清晰地拒绝不恰当请求。
它似乎更话痨一些,给出的答案都更长,但句子之间衔接的也更自然。
当遇到超出能力范围的问题时,Claude会主动坦白。
不过遇到代码生成或推理问题时,Claude的表现就不如ChatGPT了,它生成的代码会出现更多的bug。
至于一些涉及计算、逻辑的问题,Claude和ChatGPT旗鼓相当,半斤八两。
总结一下展示效果,Claude确实能称作ChatGPT强有力的竞争对手,在不同功能上各有千秋,且在12项任务中有8项更强:
Character.ai则是一家成立于2021年的公司,创始人Noam Shazeer是前谷歌首席软件工程师,曾在谷歌干了二十多年。
这家公司在做的有点像是一个“聊天机器人交易平台”,有很多Chatbot可选。
例如这是马斯克bot,看起来还挺逼真的:
与ChatGPT一样,它也可以被翻译成中文,甚至也有中文bot机器人。
就在最近,这家被估值10亿美元的公司,正式对外寻求2.5亿美元融资,就看是否有人愿意投它了。
类似的公司还有Replika,于2021年1月完成A轮融资,定位是AI交友软件。
在Replika中,每个用户都能创造一个“足够像自己”的AI聊天机器人,无论是语言声调、还是性格习惯,AI都能模仿到位。
至于国内,同样也有不少公司推出了ChatGPT一样的对话AI服务。
例如最近一度登上热搜的APP Store新聊天应用Glow,就来自一家名叫北京稀宇的新初创公司。
Glow既可以直接和自己感兴趣的聊天机器人畅聊,也可以创建自己想要聊天的AI智能体:
除了Glow以外,去年年底元语智能科技公司也推出了一个叫元语AI的模型,从介绍来看是一个功能性AI助手。
与众多对话AI一样,它不仅可以写文章、写作业、甚至翻译,也可以和它聊天,让它帮忙完成各种简单的任务:
可以看见,无论是基于大语言模型技术新成立的初创公司,还是因其火爆程度,决定开辟新业务的公司,都希望能从对话AI这个赛道上分一杯羹。
但它们究竟是有真枪实弹,还是只是像Web3一样的泡沫?
有网友调侃:不如还是问问ChatGPT吧。(手动狗头)
还有人提出了这么一个问题:
如果ChatGPT和Claude相当于AI绘画里的DALL·E 2,那么谁才是聊天机器人领域的Stable Diffusion?
你觉得呢?
参考链接:[1]https://scale.com/blog/chatgpt-vs-claude[2]https://www.nytimes.com/2023/01/27/technology/anthropic-ai-funding.html[3]https://twitter.com/nonmayorpete/status/1619137945373659136[4]https://aibusiness.com/verticals/eleven-openai-employees-break-off-to-establish-anthropic-raise-124m[5]https://www.theinformation.com/articles/character-seeks-250-million-in-new-funding-amid-ai-boom[6]https://www.anthropic.com/constitutional.pdf[7]https://techcrunch.com/2023/01/
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
花粉社群VIP加油站
猜你喜欢