大家好,欢迎来到IT知识分享网。
最近,GitHub上线了一款AI编程工具——GitHub Copilot
开发人员只需要在编辑器内输入想要的逻辑的注释,GitHub Copilot就能立马自动写出代码。
此外,它还能自动填充重复代码、自动测试等功能。
这一款产品一上线,立即引起了业内外的震荡,这下程序员的生产效率又要上一个台阶了!
但与此同时,它也引来了不小的争议。
根据官方介绍,GitHub Copilot接受了数十亿行公开代码的培训,并遵循GPL协议。
GPL协议的核心是开源,开源并不意味着可以被随意使用,它仍然是有版权的,而且代码版权不仅指复制粘贴,还包裹了其衍生作品。
那么问题来了,像GitHub Copilot这样的使用了大量公开代码进行训练的AI,所自动生成的代码,或者GitHub Copilot本身,是否属于衍生品呢?
由此许多开发者认为,GitHub Copilot基于公开代码的训练,其实是在未遵循开源许可证的情况下,肆意抄袭开源代码。
有一名较为激进的开发者,为了抗议GitHub在未经授权的情况下,任意使用受版权保护的源代码,作为其产品的训练数据,宣布弃用GitHub,而使用其他代码托管平台。
一名开发者更是嘲讽道:“GitHub抓取了你的代码,他们还打算在进一步训练后,向你收取使用费。看着人们为自己的工作和时间被一家价值数十亿美元的公司所利用而欢呼,真是令人失望。”
到底GitHub Copilot可不可以算成属于投喂给训练模型数据的衍生品?
这是一个很有意思的问题。
如果不算,那将意味着类似GitHub Copilot的做法成为了一种手段,可以通过这种手段肆意使用GPL代码,无需遵循其许可协议。
如果算,也就是说机器学习生成的作品,属于开源代码的衍生作品,那么GitHub Copilot也可以被认为是衍生作品,问题就大了。
在GitHub Copilot早期的开发过程中,近300名员工曾经在日常工作中使用它。
这300名员工,很有可能将GitHub Copilot生成的代码使用在GitHub网站以及所有软件中。这样一来,是不是可以认为GitHub也是一个开源项目?
除了法律问题,还涉及到机器学习的伦理问题。
举一个例子,如果我自己写的代码开源了,但是不希望被机器学习纳入训练数据,该怎么办呢?在不被纳入训练数据的同时,我还希望与别人分享自己的源代码,是否可以实现?谁来保障我的权益?
前段时间315曝光的人脸识别摄像头被滥用与营销的事情还历历在目,随着人工智能行业的不断发展,终将产生一些问题和矛盾,对现行的法律法规提出挑战,如何面对新的挑战,也成了一个当下迫切需要解决的问题。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/75052.html