ChatGPT知识-ChatGPT在人类考试中的表现如何？ChatGPT-4有什么变化？

ChatGPT在人类考试中的表现如何？ChatGPT-4有什么变化？

ChatGPT是由OpenAI开发的一种语言模型，由于它能够在各种情况下产生类似人类的反应，在过去的一年中变得非常受欢迎。

事实上，ChatGPT已经变得如此强大，以至于学生们现在都在用它来帮助他们完成作业。这促使美国几个学区阻止设备在其网络上访问该模型。

ChatGPT在人类考试中的表现如何？ChatGPT-4有什么变化？

来看看ChatGPT有多聪明呢? 在2023年3月27日发布的一份技术报告中，OpenAI对其最新型号GPT-4进行了全面介绍。这份报告中包含了一组考试结果，已经在上面的图表中显示了。

——GPT-4 vs. GPT-3.5的比较

为了测试ChatGPT的性能，OpenAI模拟了各种专业和学术考试的测试运行。这包括SAT律师资格考试以及各种大学预修课程(AP)的期末考试。

成绩是以百分位数来衡量的，百分位数是基于每种考试类型的考生最近获得的分数分布。

百分位评分是一种将一个人的表现与其他人的表现进行排名的方法。例如，如果你在考试中排名在第60百分位，这意味着你的得分高于60%的考生。在图形中显示了测试结果。

正如我们所看到的，在大多数这些考试中，GPT-4（2023年3月发布）比GPT-3.5(2022年3月发布)要强大得多。然而，它在AP英语和竞争性编程方面却无法提高。

GPT-4有什么变化？以下是GPT-4比GPT -3改进用户体验的一些领域。

1）互联网接入和插件

GPT-3.5的一个限制因素是，它无法访问互联网，只接受了截至2021年6月的数据训练。

有了GPT-4，用户将可以访问各种插件，使ChatGPT能够访问互联网，提供更多最新的响应，并完成更广泛的任务。这包括来自Expedia等第三方服务的插件，这些插件可以让ChatGPT为你预订整个假期。

2) 视觉输入

虽然GPT-3.5只能接受文本输入，但GPT-4也具有分析图像的能力。用户可以要求ChatGPT描述一张照片，分析一张图表，甚至解释一个表情包。

3)更长的文本

最后，GPT-4能够处理大量文本，并使对话持续更长时间。作为参考，GPT-3.5处理的最大值为4,096个标记，大约相当于3,000个单词。GPT-4有两种版本，一种有8,192个标记(6,000个单词)，另一种有32,768个标记(24,000个单词)。

◎欢迎参与讨论，请在这里发表您的看法、交流您的观点。