GPT-4全网首个测评来了！逻辑性、创造性，你想知道的我们都测了-花粉乐享

> 乐学堂 > > GPT-4全网首个测评来了！逻辑性、创造性，你想知道的我们都测了

GPT-4全网首个测评来了！逻辑性、创造性，你想知道的我们都测了

来源：清博智能

2023-04-16 13:23:01

282

管理

3月15日凌晨1点，OpenAI宣布推出GPT-4，在功能和一致性方面取得了前所未有的成果。（官网链接：https://openai.com/product/GPT-4）

【公众号后台回复“GPT-4”可获取OpenAI的英文原版报告论文与中文翻译稿】

除了GPT-4，OpenAI还发布了其开源软件框架Evals—— 一个可以对AI模型进行众包测试的软件框架，可以用来开发和运行评估GPT-4等模型，同时检查其性能。使用Evals，开发人员可以使用数据集生成提示，测量OpenAI模型的生成质量，并比较不同数据集和模型的性能。

基于GPT-3.5的ChatGPT常常爆雷出错，但GPT-4提供的信息会更加准确。

对GPT-3.5和GPT-4提同样的问题，但答案显然不同：

例如：让GPT-3.5和GPT-4列举泰山名人

ChatGPT-4：

图为GPT-4对自己优化方向的预测

OpenAI自己认为GPT-4仍然有误差，并有一定的风险。其工作人员在推特上发帖称：“GPT4和GPT3.5之间的差异可能不会像普通用户所宣传的那样夸大。”

AI竞争逐渐白热化。谷歌宣布了自己的文本生成模型PaLM的API和新的开发工具，该模型的功能与OpenAI的GPT类似。谷歌也在进一步测试旗下的Bard聊天机器人，以与ChatGPT竞争，并表示将使用底层技术来改进搜索。

同时，GPT-4已被集成在多邻国、Notion等应用中，用户们将很快就能体验到最新版的GPT-4。AI对日常生活、工作、生成的渗透越发可见，我们期待看见未来有更多革命性进展，那会为人类想象力的发挥提供更广阔的空间。

作者：永光排版：骆伟玲

图片源于Q仔互联网冲浪所得，若有侵权，后台联系，Q仔滑跪删除~

花粉社群VIP加油站

2

赏礼

赏钱

0

免责声明：本文仅代表作者个人观点，与花粉乐分享无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非花粉乐分享）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@hflfx.com