大模型行业竞争:超越GPT-4的真相与未来发展展望

【】每当有新版本的大模型发布时,业界总是热衷于引用第三方榜单数据,拿自家大模型和GPT-4一起"跑个分",声称已经在某些指标上实现了超越,以此来证明自己的大模型技术实力。

但在近日百度董事长李彦宏和内部员工的一场交流中,捅破了大模型行业跑分的"窗户纸"。"每次新模型发布,都要和GPT-4o做比较,说我的得分已经跟它差不多了,甚至某些单项上得分已经超过它了,但这并不表明和最先进的模型就没有差距了。"

他进一步解释道,模型之间的差距是多维度的。一个维度是能力方面,不管是理解能力、生成能力、逻辑推理能力还是记忆能力等这些基本能力上的差距;另一个维度是成本方面,有些模型虽能达到同样效果,但成本高、推理速度慢,其实还是不如先进模型。

"还有就是对于测试集的over-fitting,每一个想证明自己能力的模型都会去打榜,打榜时他就要猜别人到底在测什么、哪些题我用什么样的技巧就能做对,所以从榜单或者测试集上看,你觉得能力已经很接近了,但到实际应用中还是有明显差距的。"李彦宏说。

而对于大模型行业常常提到的"领先12个月或者落后18个月",他认为也没有那么重要。因为每个公司都处在完全竞争的市场环境中,不管做什么方向都有很多竞争对手。"如果你能永远保证领先对手12~18个月,那是天下无敌的,不要觉得12—18个月是很短的时间,哪怕你能保证永远领先竞争对手6个月,那就赢了,你的市场份额可能是70%,而对手可能仅为20%甚至10%的份额。"

他判断,未来大模型之间的差距可能会越来越大。因为大模型的天花板很高,现在距离理想情况还相差非常远,所以模型要不断快速迭代、更新和升级;需要能几年、十几年如一日地投入,不断满足用户需求,降本增效。网页链接

(第一财经)

上一篇:中国人工智能快速崛起:李彦宏与哈佛商业评论对话引发的思考下一篇:利用ChatGPT打造小红书爆款文案的技巧与方法分享

相关文章

特斯拉搁置新厂建设,如何解读其对未来产能和市场的影响?  (2024-10-25 21:5:36)

如何利用ChatGPT1分钟做好思维导图?  (2024-10-21 14:44:7)

OpenAI推出名为GPT-4omini的迷你AI模型,该款模型设计有哪些亮点?  (2024-10-19 8:59:46)

如何利用AI工具制作生成人物视频课程,11节中英双语教程分享  (2024-10-7 17:52:35)

人工智能助推国家实现长远发展,更是我们生活中的好帮手  (2024-9-28 0:57:58)

李开复呼吁:中国亟需自主AIChatGPT,促进技术普及和投资  (2024-9-24 22:7:42)

文心一言与ChatGPT先来了一个测试对比  (2024-9-11 9:1:57)

比尔盖茨发布最新预言,称GPT4已超越人类  (2024-9-3 21:58:22)

国外的Chatgpt、谷歌Bard和国内的AI优缺点对比  (2024-8-29 5:18:43)

AI技术革新:从大型到紧凑模型的转型之路  (2024-8-26 21:58:7)

发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。