ChatGPT在人类考试中的表现如何?ChatGPT-4有什么变化?

ChatGPT是由OpenAI开发的一种语言模型,由于它能够在各种情况下产生类似人类的反应,在过去的一年中变得非常受欢迎。

事实上,ChatGPT已经变得如此强大,以至于学生们现在都在用它来帮助他们完成作业。这促使美国几个学区阻止设备在其网络上访问该模型。

ChatGPT在人类考试中的表现如何?ChatGPT-4有什么变化?

来看看ChatGPT有多聪明呢? 在2023年3月27日发布的一份技术报告中,OpenAI对其最新型号GPT-4进行了全面介绍。这份报告中包含了一组考试结果,已经在上面的图表中显示了。

——GPT-4 vs. GPT-3.5的比较

为了测试ChatGPT的性能,OpenAI模拟了各种专业和学术考试的测试运行。这包括SAT律师资格考试以及各种大学预修课程(AP)的期末考试。

成绩是以百分位数来衡量的,百分位数是基于每种考试类型的考生最近获得的分数分布。

百分位评分是一种将一个人的表现与其他人的表现进行排名的方法。例如,如果你在考试中排名在第60百分位,这意味着你的得分高于60%的考生。在图形中显示了测试结果。

正如我们所看到的,在大多数这些考试中,GPT-4(2023年3月发布)比GPT-3.5(2022年3月发布)要强大得多。然而,它在AP英语和竞争性编程方面却无法提高。

GPT-4有什么变化? 以下是GPT-4比GPT -3改进用户体验的一些领域。

1)互联网接入和插件

GPT-3.5的一个限制因素是,它无法访问互联网,只接受了截至2021年6月的数据训练。

有了GPT-4,用户将可以访问各种插件,使ChatGPT能够访问互联网,提供更多最新的响应,并完成更广泛的任务。这包括来自Expedia等第三方服务的插件,这些插件可以让ChatGPT为你预订整个假期。

2) 视觉输入

虽然GPT-3.5只能接受文本输入,但GPT-4也具有分析图像的能力。用户可以要求ChatGPT描述一张照片,分析一张图表,甚至解释一个表情包。

3)更长的文本

最后,GPT-4能够处理大量文本,并使对话持续更长时间。作为参考,GPT-3.5处理的最大值为4,096个标记,大约相当于3,000个单词。GPT-4有两种版本,一种有8,192个标记(6,000个单词),另一种有32,768个标记(24,000个单词)。

上一篇:横须贺市在政府业务中应用ChatGPT 为日本首例下一篇:学习ChatGPT,但是你懂怎么用它吗?

相关文章

ChatGPT:自媒体的双刃剑,方便与挑战并存  (2023-10-18 16:56:7)

ChatGPT在教育领域的应用占比高达23%  (2023-10-18 15:31:25)

ChatGPT的5个超实用提问公式,助力自媒体运营文案和短视频创作  (2023-10-18 9:41:57)

ChatGPT4如何运用多模态功能来编写网站代码?  (2023-10-14 13:20:41)

为什么说chatgpt会彻底改变教育呢?  (2023-10-14 7:25:3)

ChatGPT热潮消退,全球AI总龙头英伟达被遭微软砍单!  (2023-10-13 18:19:27)

ChatGPT是一种福利还是危机?人工智能的双刃剑  (2023-10-13 15:59:51)

chatGPT是一个平台级创业机会,如何实现财富暴增?  (2023-10-13 8:43:43)

ChatGPT已应用于科学研究,让GPT-4得出P≠NP的结论  (2023-10-12 19:44:37)

ChatGPT4的代码解释器如何自动进行线性回归分析?  (2023-10-12 14:31:36)

发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。