大模型行业竞争:超越GPT-4的真相与未来发展展望
【】每当有新版本的大模型发布时,业界总是热衷于引用第三方榜单数据,拿自家大模型和GPT-4一起"跑个分",声称已经在某些指标上实现了超越,以此来证明自己的大模型技术实力。
但在近日百度董事长李彦宏和内部员工的一场交流中,捅破了大模型行业跑分的"窗户纸"。"每次新模型发布,都要和GPT-4o做比较,说我的得分已经跟它差不多了,甚至某些单项上得分已经超过它了,但这并不表明和最先进的模型就没有差距了。"
他进一步解释道,模型之间的差距是多维度的。一个维度是能力方面,不管是理解能力、生成能力、逻辑推理能力还是记忆能力等这些基本能力上的差距;另一个维度是成本方面,有些模型虽能达到同样效果,但成本高、推理速度慢,其实还是不如先进模型。
"还有就是对于测试集的over-fitting,每一个想证明自己能力的模型都会去打榜,打榜时他就要猜别人到底在测什么、哪些题我用什么样的技巧就能做对,所以从榜单或者测试集上看,你觉得能力已经很接近了,但到实际应用中还是有明显差距的。"李彦宏说。
而对于大模型行业常常提到的"领先12个月或者落后18个月",他认为也没有那么重要。因为每个公司都处在完全竞争的市场环境中,不管做什么方向都有很多竞争对手。"如果你能永远保证领先对手12~18个月,那是天下无敌的,不要觉得12—18个月是很短的时间,哪怕你能保证永远领先竞争对手6个月,那就赢了,你的市场份额可能是70%,而对手可能仅为20%甚至10%的份额。"
他判断,未来大模型之间的差距可能会越来越大。因为大模型的天花板很高,现在距离理想情况还相差非常远,所以模型要不断快速迭代、更新和升级;需要能几年、十几年如一日地投入,不断满足用户需求,降本增效。网页链接
(第一财经)
相关文章
特斯拉搁置新厂建设,如何解读其对未来产能和市场的影响? (2024-10-25 21:5:36)
如何利用ChatGPT1分钟做好思维导图? (2024-10-21 14:44:7)
OpenAI推出名为GPT-4omini的迷你AI模型,该款模型设计有哪些亮点? (2024-10-19 8:59:46)
如何利用AI工具制作生成人物视频课程,11节中英双语教程分享 (2024-10-7 17:52:35)
人工智能助推国家实现长远发展,更是我们生活中的好帮手 (2024-9-28 0:57:58)
李开复呼吁:中国亟需自主AIChatGPT,促进技术普及和投资 (2024-9-24 22:7:42)
文心一言与ChatGPT先来了一个测试对比 (2024-9-11 9:1:57)
比尔盖茨发布最新预言,称GPT4已超越人类 (2024-9-3 21:58:22)
国外的Chatgpt、谷歌Bard和国内的AI优缺点对比 (2024-8-29 5:18:43)
AI技术革新:从大型到紧凑模型的转型之路 (2024-8-26 21:58:7)
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。