AI技术革新:从大型到紧凑模型的转型之路
AI 开发人员已经开始转向紧凑的 AI 模型——它们更便宜、更经济
科技巨头和初创公司正在转向更小、更高效的人工智能模型,以降低成本和提高生产力。与GPT-4等“老大哥”不同,这些模型可以在较少的数据量上进行训练,并专门解决特定问题。
图片来源:Copilot
Microsoft、谷歌、苹果以及 Mistral、Anthropic 和 Cohere 等初创公司越来越多地转向人工智能的中小型语言模型。与 OpenAI 的 GPT-4 等大型模型 (LLM) 不同,这些模型使用超过 1 万亿个参数,估计开发成本超过 1 亿美元,紧凑模型在较窄的数据集上进行训练,成本可能低于 1000 万美元,同时使用不到 100 亿个参数。
Microsoft 是 AI 领域的领导者之一,推出了一系列名为 Phi 的小型模型。根据该公司首席执行官萨蒂亚·纳德拉(Satya Nadella)的说法,这些模型比ChatGPT的免费版本小100倍,但同时几乎可以同样有效地处理许多任务。Microsoft首席商务官优素福·迈赫迪(Yusuf Mehdi)指出,该公司很快意识到,运营大型人工智能模型的成本比最初想象的要高,这促使Microsoft寻找更具成本效益的解决方案。
其他科技巨头也没有被排除在外。谷歌、苹果以及 Mistral、Anthropic 和 Cohere 都发布了他们的中小型模型版本。特别是苹果公司,计划使用这种模型直接在智能手机上本地运行人工智能,这应该会提高速度和安全性。同时,智能手机上的资源消耗将降至最低。
专家指出,对于许多任务,例如总结文档或创建图像,大型模型可能完全是多余的。谷歌 2017 年关于人工智能的开创性文章的作者之一伊利亚·波洛苏欣 (Ilya Polosukhin) 形象地将使用大型模型完成简单任务比作去坦克上的商店购买杂货。“计算 2 + 2 不应该要求 Quadrillion 运算,”他强调说。
公司和消费者也在寻找降低生成式人工智能技术运营成本的方法。总部位于特拉维夫的人工智能公司AI21 Labs的联合创始人Yoav Shoham表示,小型模型在转换为金钱时可以回答问题,成本仅为大型语言模型的六分之一。
有趣的是,小型模型的主要优势在于能够针对特定任务和数据集对其进行微调。这使他们能够以较低的成本在专业领域高效工作,例如仅在法律行业。
然而,专家指出,公司不会完全放弃LLM。例如,苹果宣布将 ChatGPT 集成到 Siri 中以执行复杂的任务,Microsoft计划在新版本的 Windows 中使用最新的 OpenAI 模型。爱尔兰的Experian和美国的Salesforce等公司已经转向使用紧凑型聊天机器人AI模型,并发现它们提供与大型模型相同的性能,但成本要低得多,延迟也更低。
向小型模型的转变是在大型、公开可用的人工智能模型进展缓慢的情况下发生的。专家将此归因于缺乏高质量的培训新数据,总的来说,指出了该行业发展的新重要阶段。
相关文章
Sora:人工智能在视频编辑中的跃迁 (2024-8-24 17:48:46)
数据标注在ChatGPT中的重要性 (2024-8-23 14:54:34)
元保保险AI大模型赋能,引领保险业技术革新潮流 (2024-8-17 14:20:8)
比ChatGPT更“智能”的日常入侵者?揭秘餐桌上的隐形威胁 (2024-8-16 10:5:57)
头条AI创文权限开启,如何用AI写作获取流量? (2024-8-12 10:28:35)
AI技术停滞?ChatGPT4.0发布一年来的市场反应与未来展望 (2024-7-19 11:42:36)
教你如何用ChatGPT写出一篇万字论文 (2024-7-7 13:34:26)
ChatGpt3.5和4.0的区别,它俩的差距到底有多大? (2024-6-30 13:50:6)
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。