花粉乐分享平台宣传视频
> 乐学堂 > > 大模型111人:谷歌和OpenAI的人才战争
大模型111人:谷歌和OpenAI的人才战争
来源:量子位
2023-05-04 23:12:31
269
管理

衡宇 发自 凹非寺

量子位 | 公众号 QbitAI

当我们围观ChatGPT炸开的多场激战时,还有什么是暗流下激战的?

今天要关注的,不是违背“非盈利”初心的OpenAI,也不是商业模式面临颠覆的谷歌搜索。把目光从公司层面挪开,看向另一场已经白热化的战争——

借着的ChatGPT燎原之势,2月中旬同一天的30分钟内,就有2位谷歌大脑大模型人才先后官宣入职OpenAI,其中之一Jason Wei是思维链(chain-of-thought,CoT)的最早一作。

大模型交锋背后,谷歌和OpenAI的人才战争打得正酣。和动辄上亿美元的投融资同样重要,AI人才也是兵家必争的财富。

但其实,AI人才流动、被抢夺,早开始在ChatGPT搅动漩涡之前。

GPT系列:8人联创新公司,成谷歌对战ChatGPT一步棋

势如破竹的ChatGPT,积攒了OpenAI从GPT一路迭代至InstructGPT的技术经验与实力。

ChatGPT基于OpenAI的GPT-3.5创造。2018年和2019年,OpenAI分别推出了1.17亿参数的GPT-1和15亿参数的GPT-2;2020年,大力出奇迹的GPT-3问世,训练参数达到1750亿,涌现出一些人脑独特的能力,引起轰动;而后又在2022年初推出全新的InstructGPT模型,只要13亿参数,效果就比GPT-3更好。

《纽约时报》披露,原本下一代GPT-4在OpenAI内部几乎准备就绪,只待发布;去年11月中旬,高层突然宣布新任务:两周后发布免费聊天机器人应用,代号“Chat with GPT3.5”,这就是今天见到的ChatGPT。

51位作者,其中2人参与3次论文创作

GPT系列共发表了4篇论文,51位作者参与其中。

作者名单中出现最频繁的是Alec Radford和Ilya Sutskever两位,均参与GPT-1到3的论文创作。前者是OpenAI的ML研究员,也是indico.io的联创,谷歌学术上他被引用最多的研究是DC-GAN;后者更为人所熟知,OpenAI联创之一,也是OpenAI首席科学家,主导了GPT系列以及DALLE系列模型的研发。

另有5人在GPT系列论文中2次贡献了自己的力量:

关于Anthropic的最新消息让这家“复仇者联盟”愈发走到人们熟悉台前。月初,谷歌向它投资3亿多美元(约合人民币20.3亿元),拿下后者约10%的股份。交易条款要求,Anthropic需要从谷歌云计算部门购买计算资源。这恰好与3年前,OpenAI接受微软高达10亿美元的注资,将微软定位独家云提供商所呼应。

换句话说,Dario Amodei带着Anthropic走上了3年前所不齿的OpenAI的老路,接受金主爸爸提供的算力来进行技术开发。现如今,Anthropic最新估值50亿美元,除谷歌外,已有的投资人包括Facebook联创Dustin Moskovitz,谷歌前CEO、现技术顾问Eric Schmidt等人。

以及,现有5名LaMDA论文作者进入Character.AI就职。

Character.AI的创始人Noam Shazeer是谷歌前首席软件工程师,不仅参与了LaMDA的研究,还是Transformer论文作者之一。杜克大学本科毕业后,2000年年底,Noam Shazeer加入谷歌,是谷歌最重要的早期员工之一。虽然中途一度离职,但截至他2021年10月离职创办新公司,共在谷歌工作了17年又5个月。Character.AI的现任总裁也是LaMDA论文作者,Daniel De Freitas,加入谷歌前,他曾在微软Bing做软件工程师。

实际上,LamDA论文发表时,Noam Shazeer和Daniel De Freitas都已经从谷歌离职,开始筹备Character.AI了。据报道,Character AI已经创建了一个基于LaMDA的神经语言模型聊天机器人Web应用程序,能够生成类似人类的文本响应并参与上下文对话。

人才大战里的华人面孔

今年年初,大模型人才的跳槽愈发频繁。从谷歌加入OpenAI的谷歌大脑4人之一中,包括华人顾世翔(Shane Gu),谷歌大脑日本团队前成员,剑桥大学博士,本科在多伦多大学师从三巨头之一Hinton。去年5月,只要加上一句“让我们一步一步地思考”就能让GPT-3做数学题的准确率暴涨61%这事,就是顾世翔参与的研究发现。

这里要着重提2个人。一位是美籍华人Ed Chi,1973年出生,现为谷歌杰出科学家,早年以应用资讯气味理论预测网站可用性而闻名。

从美国明尼苏达大学双城分校取得硕士学位后,Ed Chi于1997年至2011年期间,在帕洛阿尔托研究中心(PARC)担任研究科学家。2011年,Ed Chi以高级研究科学家的身份从PARC离职,成为谷歌的一名研究科学家。2012年,他担任任人机交互领域最负盛名的学术会议CHI的技术项目联合主席。2017年,Ed Chi被提升为谷歌首席科学家。

革命性科技浪潮背后,人才频繁流动

梳理后不难看到,谷歌和OpenAI虽为大模型重镇,但人才流动其实是很寻常的事。仅仅在本文涉及的人员里,GPT-2论文四作和Transformer论文一作和共同创办的Adept,不到半年就亮出了新公司的首个大模型ACT-1;Anthropic更是凭借对话机器人Cluade成为谷歌和OpenAI大战中的一把利刃。

△大模型人才从OpenAI和谷歌出走后,创立的AI初创公司

总体而言,爆炸性的ChatGPT让大模型背后的人才更加收到世人关注,对这些人来说,ChatGPT带来的风口也是他们必须迎头面对的挑战。

由此提出一个思考:做类ChatGPT产品,中国的优势在哪里?

很大程度上,构筑大模型堆参数、堆数据的大力出奇迹之道,其实是中国团队向来擅长的事情。但不可否认,小公司负担不起高昂的天价成本,大公司需要综合考虑整体战略,种种因素,从不同角度成为一个中国版ChatGPT诞生的外在桎梏。

如此一来,破除外在束缚需用巧力。在算法、数据等都存在差距的现实条件下,人才,或许能成为这场轰轰烈烈全球擂台赛里的破局点。大模型背后的每一个参与者和理念、数据、技术拥有同等的重要价值。中国不缺人,更不缺人才,从GPT系论文和LaMDA论文背后的华人作者数量更可以看到AI人才的实力,人才的聚集能形成人才规模核心竞争力。

The battle of AGI never ends!埋头研究,伸手抢人的现象,已经在国内出现。想招人的,想找工作的,都可以开始准备了。

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

花粉社群VIP加油站

2
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与花粉乐分享无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
凡本网注明 “来源:XXX(非花粉乐分享)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。
QQ:2443165046 邮箱:info@hflfx.com
关于作者
北辰吖(采蜜高手)
文章
506
主题
0
关注
0
粉丝
1
点击领取今天的签到奖励!
签到排行
随手拍
54个圈友 0个话题
华为手机随手拍,记录生活点滴之美好
华为P30pro
51个圈友 0个话题
这里是华为P30pro手机交流圈,欢迎华为P30pro用户进群交流
体验官
60个圈友 2个话题
华为花粉体验官,体验官专属的交流群
登录后查看您创建的圈子
登录后查看您创建的圈子
所有圈子
猜你喜欢
杭州互联网违法和不良信息举报平台 网络110报警服务 浙ICP备17046585号
2
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索