人工智能研究人员表示,开放式法学硕士并不像声称的那样开放

2025-04-16 02:38来源:本站

  computer code

  康奈尔大学(Cornell University)、Signal Foundation和Now Institute的三位人工智能研究人员在《自然》(Nature)杂志上发表了一篇观点文章,认为知名的开放式法学硕士(llm)并不像它们的创造者声称的那样开放。

  David Widder, Meredith Whittaker和Sarah West在他们的论文中指出,仅仅向公众提供源代码并不能使LLM开放。这是因为它不提供对底层训练数据的访问,并且因为很少有开发人员拥有独立训练llm所需的资源。

  在过去的几年里,像ChatGPT这样的法学硕士已经变得非常受欢迎,而且随着它们的成熟,它们的受欢迎程度只会越来越高。伴随着这种流行而来的是恐惧——许多人,无论是外行还是专业人士,都开始怀疑人工智能的研究将走向何方。它会导致隐私的丧失吗?工作吗?是否会变得无法分辨图片或视频是真实的,还是由神经网络系统生成的?

  没有人知道这些问题的答案,但作为回应,法学硕士的创建者们试图通过将他们的模型免费向公众开放,使他们的努力对用户社区更加透明。任何选择访问法学硕士制作者的网站的人都可以查看或下载代码。他们还可以更改代码,并按照自己的意愿使用它。但是,这篇新论文的作者问,这样的行为真的能让法学硕士开放吗?

  他们强烈认为答案是否定的,因为法学硕士的源代码与计算机程序(如文字处理器)的源代码是不一样的。当您下载文字处理程序的代码时,您就拥有了按原样使用它、更改它或做任何您想做的事情所需要的一切。

  当你下载一个法学硕士,你有代码,你可以修改它,如果你想,但你不能修改底层知识,作者指出。这是由于制造商进行了培训。当用户下载代码时,他们并没有得到这些,而且大多数人不能运行他们自己的训练方案——这需要大量的计算能力。

  此外,作者认为,目前所有开放的法学硕士都有三个主要因素影响开放性——第一个是透明度。一些制造商让一切都透明,而另一些则不然。例如,羊驼3的制造商只允许用户通过应用程序编程接口(api)使用他们的系统。作者称这种做法为“开放性清洗”。

  第二个因素是可重用性——开源代码的可用性如何?这取决于它是怎么写的。第三个因素是可扩展性,即用户如何修改代码以满足他们的需求。

  作者的结论是,除非用户能够开放访问能够训练LLM的硬件、易于访问的数据和/或免费访问最初用于训练LLM的底层数据,否则开放的LLM将不会真正开放。

三九点资讯声明:未经许可,不得转载。