开源人工智能模型崛起,追赶ChatGPT和谷歌,它好在哪
发布时间:2023-05-26 | 发布者: 东东工作室 | 浏览次数: 次5月18日消息,谷歌和OpenAI正在开发专有的人工智能模型,但免费的开源模型也在激增。谷歌员工称,公司面临的压力越来越大,如果不推出更多开源模型,就可能在这场人工智能竞赛中落伍。此外,有传言称OpenAI正准备发布新的开源语言模型。那么,开源模型的优势到底在哪里呢?
以下为翻译全文:
今年2月,Meta向学术界提供了一批高级机器学习模型,它们能够理解自然语言对话。这一举措引发了人工智能开发的热潮。仅仅几周时间,学者们就将这些模型转化为开源软件,并且推出了可以替代ChatGPT和其他专有人工智能软件(专有软件在使用和修改上有限制)的免费产品。
加州大学伯克利分校计算机科学教授扬·斯托伊察(Ion Schmidt)表示,免费人工智能模型目前在性能方面已经与谷歌和OpenAI的专有模型“相当接近”,大多数软件开发人员最终将选择使用免费模型。斯托伊察还使用了Meta的技术来开发一个关键的开源人工智能模型。
如果斯托伊察的观点是正确的,那么开源人工智能将会颠覆谷歌、OpenAI、微软等公司的商业计划。任何人都可以以很低的成本获得强大的人工智能工具,Meta也可以从中获得回报。
斯托伊察等人利用Meta的研究成果开发了Vicuna,这是一个开源语言理解模型,已在今年3月发布。Vicuna使用了ChatGPT的数据,这些数据来自于某一网站上用户与OpenAI聊天机器人的对话记录。开源人工智能的快速进步,以及Vicuna的出色表现,引起了谷歌高级工程师卢克·塞诺(Luke Sernau)的警告。他告诫同事们,如果公司继续专注于专有软件以追赶OpenAI,公司将面临落后的风险。
塞诺在一份内部备忘录中写道:“如果有一个高质量的、没有使用限制的免费替代品,谁还会愿意购买我们有使用限制的产品呢?”他还称开源人工智能的发展已经“超越了我们”,因此“谷歌应该成为开源社区的领导者”,并“放弃对我们模型的某些控制”。(他没有回应本文的评论请求。)
这份备忘录引起了整个行业的共鸣,包括一些谷歌员工。虽然塞诺可能夸大了开源人工智能的能力,低估了其成本和其他风险,但大多数人工智能从业者都同意备忘录的一个结论——Meta将从发布其模型中获益。Meta在内部使用人工智能模型进行内容推荐和广告定位。随着开发人员改进Meta发布的模型,Meta也将能够将这些改进纳入其内部人工智能中。
4月份的一次分析师电话会议上,当被问及公司的人工智能战略时,Meta首席执行官马克·扎克伯格(Mark Zuckerberg)表示:“如果行业对我们正在使用的基本工具进行标准化,那就更好了,我们可以从其他人的改进中受益。”
UC伯克利大学研究生郑怜悯参与开发了Vicuna,他说,Meta发布的模型被统称为LLaMA,不能直接用于商业用途。但Meta向研究人员提供了足够的信息,以便创建类似的模型,用于商业应用。
谷歌对其AI软件并没有完全专有。早在ChatGPT出现之前的2020年,谷歌就发布了开源语言模型T5,使开发人员能够构建可以执行翻译和编写摘要等任务的软件。随后,谷歌又发布了更先进的版本Flan-T5。但根据斯托伊察和其他从业人员的说法,Meta发布的软件带来了显著的改进,超越了谷歌模型所能达到的水平,这让工程师更倾向于使用基于Meta软件的模型。
OpenAI的开源模型
据知情人士透露,OpenAI正在准备公开发布一款新的开源语言模型,对于想在开源人工智能领域发挥更大作用的谷歌来说,这可能会增大压力。目前还不清楚OpenAI是否打算通过开源软件抢回Vicuna或其他基于Meta模型开发的软件的势头。但它不太可能发布与GPT相互竞争的模型。OpenAI估值达到了270亿美元,这主要取决于其更有商业价值的专有模型而非开源模型,尽管GPT的前两个版本是开源的。OpenAI的发言人未回复置评请求。
像Vicuna这样的开源模型,训练成本可能只要几百美元,用户可以选择避免向软件开发商支付高昂的费用。。与此相比,谷歌、OpenAI和微软一直在销售其专有模型,企业可以用它们来实现自动化客户服务、概述医学研究或生成营销文案等各种用途。去年,微软开始销售其投资了数十亿美元的OpenAI模型,而谷歌和亚马逊今年开始向外部开发人员销售其模型。
但是,最近几周,越来越多的开源替代方案涌现。除了基于Meta软件的Vicuna之外,工程师还可以选择来自德国非营利组织LAION以及包括Databricks和Stability AI在内的初创公司的其他模型。斯托伊察创建了一个网站,试图衡量这些开源模型与OpenAI的GPT-4等专有模型的质量。(斯托伊察共同创立了Databricks,该公司销售可使数据科学家使用人工智能的软件。)
据斯托伊察表示,与开源软件相比,谷歌仍然有两大优势。他说,如果谷歌利用其用户数据库,它的模型在某些专门用途上的表现可能会更好,比如内容推荐,而这些数据是外人无法访问的。(不过谷歌发言人澄清说,该公司不会利用现有的用户数据来培训其基础人工智能模型。)
此外,斯托伊察指出,谷歌在管理大规模计算机基础设施方面拥有丰富的专业知识,这意味着能够以更低的成本运行人工智能软件模型,包括为其云客户提供服务。上周,谷歌宣布了Bard模型一系列改进,这是谷歌回击ChatGPT的解决方案。
同时,OpenAI从大量用户与ChatGPT的互动中收集数据,抢占了改进人工智能软件的先机。此外,这家公司还与微软达成了一项私下协议,可以使用微软的计算基础设施。
开源的人工智能软件可以让更多公司使用专有数据来解决自己的问题。斯托伊察举例称,一家航空公司可以利用其数百万客户服务通话的记录来创建自动响应。彭博社在三月份表示,他们使用自己的数据来训练机器学习模型,以更好地理解金融信息。此外,据Vicuna开发者在Discord服务器上的消息,工程师一直在尝试将其用于创意写作和编程。
斯托伊察表示,他和同事们正在努力增加Vicuna模型中的计算次数,以提高它在推理任务中的能力,例如编写代码。Vicuna的开发团队是天空计算实验室的一个分支,该实验室位于伯克利,每年从微软、谷歌和亚马逊等上市公司那里获得数百万美元的预算,每家公司大约提供50万美元。
开源人工智能软件曾挫败OpenAI的野心。去年4月,OpenAI发布了Dall-E 2,这是一款用文本描述生成原始图像的人工智能程序。然而,名为Stable Diffusion的开源替代方案迅速崛起,在人工智能领域掀起了惊涛骇浪,甚至连OpenAI的员工也大吃一惊。最终,Dall-E-2并没有成为这个领域的霸主。
“我有理由相信,大语言模型也将遵循同样的模式。”斯托伊察说。(小小)