首页
法学研究所概况
国际法研究所概况
研究人员
科研成果
学术活动
法学刊物
法学教育
图书馆
工作平台
搜索

 

English

日本語

한국어

如何用算法保护版权
杨延超
字号:

摘要:人工智能时代,算法对于版权保护发挥着越来越重要的作用。算法保护甚至贯穿于版权保护的全过程,从版权确权、到版权授权,到版权侵权比对,再到版权侵权损害赔偿等各个环节。相比较传统的诉讼保护,算法保护则更注重事前救济,旨在于利用代码来划分版权人与社会公众的自由边界,甚至它还可以实现侵权不能的特殊效果。与诉讼保护相比较,算法保护具有降低成本、提升效率的独特优势。不仅如此,算法保护还催生出版权产业一系列创新的商业模式,从而极大推动版权产业发展。最后,在强化算法保护的同时,还需正视算法在当下发展的局限性,理性对待算法在在版权产业中客观作用;并在这一过程中厘清法律、人与算法的边界,从而为科学建构人工智能时代的版权保护体系提供理论准备。

关键词:算法版权;人工智能;区块链

 

一、版权与算法

 

人类社会历经了从纸质版权到电子版权的历程。绝大多数作品都可以被电子化,而电子化后的作品又恰恰可以被计算机阅读和理解,这一切也使用作品和算法这两个概念实现了高度契合。本文所谈及的算法是由数学公式、计算机代码、大数据等要素共同组成的有机体;其中,数学公式系运算的方法,计算机代码系实现算法的工具,而大数据又是实现算法的基础;三者共同趋动算法实现各种功能。

在人工智能时代,算法已倍受社会关注,但它并不是一个全新概念,事实上,计算机的运算从来都离不开算法;只是,在相当长的历史时期,受制于数学科学、计算机硬件、数据样本等要素的影响,算法的应用仅被局限在少部分领域;然而,随着大数据时代到来以及计算机运算能力的提升,算法催生了各个领域的巨大变革,传统由人来完成的工作正在越来越多地被算法替代。

本文立足于探讨算法对于版权保护方面重要意义及由此可能带来的产业变革。虽然产业界还鲜有学者和文章提炼“算法保护”概念和理论,但与之相关的应用却是越来越多,诸如“电子水印技术”、“区块链取证”、“人工智能侵权比对”等。与算法保护相对应的另一个重要概念是“诉讼保护”,一直以来,它也是传统版权保护的一个重要方式,直至今天,“打假”、“防盗版”、“维权”等依然是很多版权法务部的重要职责。与诉讼保护相比较,算法保护具有如下特征:

第一,它所依赖的主要力量是技术,而非诉讼制度,诚如电子水印、人工智能算法比对、区块链取证,正是算法与计算机计算的发展才真正趋动了版权的算法保护;而且,随着算法提升,算法保护还将呈现出更加多元的模式。

第二,算法保护主要是事前保护,由此也省去了后续的取证、诉讼等成本,从这一意义上讲,算法保护能够极大降低版权保护的成本。

第三,算法保护在本质上系利用算法替代了法律,由此在权利人与公众之间重新界定了自由空间;在这一空间内,任何主体的自由系被算法牢牢界定的,诚如网盘的大小、下载的速度、是否享有阅读的权限等,这一切都被算法明确界定,任何主体都只能在这样的自由空间内活动,而无法突破这种自由;即使那些不畏惧法律制裁的胆大妄为者同样无法突破这种自由。法律同样限定了人的自由,但这种自由更多还是存在于法治理念上;事实上,当行为人违反法律规定的自由时,法律也只能通过事后制裁的方法对其进行处罚;显然,算法保护还可以达到侵权不能特殊效果;而这些都是诉讼保护无法实现的。

那么,基于算法保护所具有独特优势,其在版权产业发展过程中到底能发挥哪些作用,其对版权产业的商业模式又将产生怎样的影响,也成为当下亟需研究的问题。

 

二、算法保护版权的路径实现

 

当下,作品创作、传播、使用,甚至侵权的整个过程都已经被高度数字化:首先,作品被电子化之后,作品的内容便可以被输入计算机并被计算机阅读和理解;其次,作品创作完成后,大多数作品又是通过互联网传播和使用;同样,侵权作品也免不了需要通过互联网来传播。这一切使得算法与版权这二个概念高度契合,从这一意义上讲,算法保护近乎贯穿于版权保护全过程:

首先,借助算法保护可以实现版权确权。在整个知识产权体系中,各国版权法大都奉行自动保护原则,而并非像专利和商标那样实行登记注册保护原则[1]。因此,版权登记并非系国家授权,而仅仅作为一个原创的证明,即作为申请人系作者的一种证据。申请人可以借助算法完成原创证明,其典型的方法有二类:第一,通过在图片中植入电子水印的方法来证明原创,其中的电子水印尤如作者植入作品当中的密码,一旦当有侵权者未经许可使用该图片,原创者使可以通过解码电子水印来证明自己便是原创。第二,通过将作品哈希值上传区块链的方法来证明原创,此种方法所利用的恰恰是区块链所建构的不可篡改的信用。考虑到区块链的分布式存储又特别耗费能源,一般上传到区块链上的并非系作品本身而是作品的哈希值。当然,在哈希值唯一时亦可证明作品唯一,因此,上传哈布值同样可以起到证明作品未经篡改的作用。

事实上,借助算法达到证明原创的逻辑,还需要借助“时间”的概念。算法本身并不能直接告诉法官,谁(原告还是被告)就是原创;无论是在作品上打上电子水印,还是将作品的哈希值上传到区块链上,都无法直接得出申请人就是原创作者的结论。因此,算法保护所能实现的证明逻辑是:在历史上的某个时间点,申请人对一个特定的作品(哈希值可以将作品特定化)进行过某种操作,如上传到区块链上,同时记录了原创人。然而,当其他人却无法证明在此时间点(或者更早之前)做过类似操作,那么,从概率上,申请人系原创的可能性将会被大大提高。在版权确权问题上,算法保护正是基于上述逻辑路径实现证明目的的。

其次,借助算法保护可以实现版权授权。作品本身具有“无形性”的特征,版权人可以授权众多用户同时使用作品。在授权协议中还可能会涉及作品的使用方式、使用时间、使用范围等;依据授权协议,使用者则不能超越授权范围使用作品,否则就需要承担违约责任。长期以来,版权授权的工作主要由版权人或者其代理人完成,当然,一个更为高效的方法则是,让算法完成版权授权的全部工作。根据用户的行为,算法可以为用户进行画相,并且依据画相结果准确判断用户类型(如其属于普通用户还是VIP用户),进而决定是否授权用户使用权限以及使用权限的具体范围。这种版权授权的算法与金融领域的贷款授信的算法类同。借助算法实现版权授权,还不受时间的限制,并且使用者也只能按照算法所确定的方式、范围来进行使用。

当下,借助算法实现作品授权已经成为版权产业中越发普遍的方式。在涉及算法授权的情况下,还存在两种服务模式的选择:一种是利用网站实现版权授权,在这种情况下用户登录网站即可接受服务;另一种则是借助用户终端实现版权授权,这种情况下,用户需要下载终端方才可以接受服务。相比较而言,后者更有利用于实现对授权作品的有效控制,用户所有对作品的使用都被限制在终端范畴,从而可以有效防止被再次复制给他人的侵权能可能性,如此算法控制比较有利于类似于影视作品的授权。采用网站式提供服务,用户在下载作品到桌面后,算法便无法再直接控制该作品;但是其好处在于比较简单,即用户不需要下载即使使用,对于音乐等不需要下载直播播放的作品更为合适。

最后,借助算法保护实现版权侵权救济。版权的侵权救济总体上可以分为事前救济与事后救济。所谓事前救济,即是通过算法实现在侵权之前的预防,即在作品正式出版发行前即可通过人工智能算法对作品的侵权可能性进行分析和预测,算法针对即将发布的作品要进行类似于编辑一样的审稿;只不过,它的数据分析能力要远胜于人类;从而可以提供关于侵权可能性更有价值的参考。对于侵权可能性较大的作品自然会被禁止出版发行,从而也直接预防了侵权的发生。侵权分析机器人也成为未来版权产业平台科学管理的重要工具。当然,侵权分析机器人并不能绝对防止侵权发生,在很多场景下,侵权人可能会借助自己的服务器直接发布侵权作品,在这种情况下,权利人又只能通过事后救济来维权了。算法在版权的事后救济过程中同样发挥着重要作用,具体而言,又包括如下几个方面:

其一,借助算法发现侵权事实。互联网海量信息之下,单独依靠人力来发现侵权事实,这将是一项十分浩大的工程;借助算法则可以在海量数据中快速寻找和监测侵权事实。版权侵权更主要表现为对于作品非法传播和利用,这恰好又可以落入算法的能力范畴;这也使得利用算法来判断侵权与否能够实现更好的效果。

其二,借助算法实现侵权举证。在发现了侵权事实的情况下,还需要进一步收集侵权证据;进而在庭审诉讼过程中向法官出示。传统情况下一般系通过公证方式来固定证据,公证在本质上系通过国家背书的方式达到证明效果,但其成本高、程序繁琐,使之在很多场景中难以应用:第一,需要批量取证或者简单的版权侵权案件,基于获赔数额的考虑,如果取证本身的成本过高,原告方甚至可能会放弃维权;第二,在紧急情况下的证据固定,如果不立即取证,证据可能会灭失,公证也难以实现取证目的。相比较而言,算法取证则极大程度弥补公证的不足,一方面它减少当事人取证成本;另一方面,它也极大提升了取证效率。在这一方面,区块链技术取证具有广阔的应用前景。区块链本质上属于去中心化的分布式记账方式,一旦将证据的哈希值存储在区块链上,便可以建构出不可篡改的逻辑,正是这一逻辑帮助实现了区块链取证的证明效力;当然,区块链取证欲达到不可篡改的证明逻辑,还需要以其结点众多,无法被控制作为逻辑前提。针对区块链举证的优势,最高人民法院也在其司法解释中进一步明确了区块链举证的效力。[2]

3.借助算法进行侵权比对。算法在侵权比对中也发挥重要作用。要证明作品侵权,自然需要对侵权作品与原创作品进行比对;二者相似程度越大,其构成侵权可能性也越大。当然,对于简单的文字作品或者美术作品,通过肉眼识别即可作出大致判断;然而,对于计算机软件作品、篇幅较长的文字作品等大型复杂作品,仅仅依赖肉眼是难以作出有效比对的;由此,就需要算法在侵权比对中发挥重要作用。当然,算法在这里并非替代法官直接作出侵权与否的结论,而是借助算法对两部作品在哪些部分、多大程度上构成近似进行说明,进而帮助法官科学作出侵权与否判断。

4.借助算法计算损害赔偿。一旦确定版权侵权,自然会涉及到赔偿额的计算。与有形财产侵权不同,版权侵权难以证明权损失的具体数额。为此《著作权法》还设定了法定赔偿制度,即可以在定范围内由法官自由裁量。按照修订后的《著作权法》,对于难以证明损失的著作权侵权案件,法官有权在五百-五百万元之间自由裁量。[3]较大自由裁量空间旨在于赋予法官一定程度灵活审判权,但同时也带来了同案是否同判的争议。事实上,任何一位法官的经验再丰富也不可能记住过往的所有判例,更无法抽象出过往判例的所有特征。然而,算法却可以在这一过程中发挥重要作用。借助算法的案例画像功能,可以帮助法官勾勒出与本案相类似的过往案例侵权赔偿的判决情况,为法官同案同判提供有力参考,进而帮助法官在法定赔偿制度框架下最大程度实现科学判决。

 

三、算法保护还催生了版权产业新模式

 

算法保护不仅仅是在诸多场景下取代了传统的法律保护,它甚至还能激发出版权产业发展过程中的诸多商业模式:

(一)算法保护与付费下载

电子书产业,借助算法保护,书商们不仅可以实现只有付费用户才能下载电子书;还可以实现电子书在下载后的用效控制,包括仅限用户在自己的后台阅读,而无法将电子书复制到其他存储设备当中,这也使得其他人难以免费获得电子书;从而增加电子书的销量。类似的商业模式还被广泛用于音乐、游戏、电影等付费下载领域;[4]简言之,上述版权产业之所以得到蓬勃发展,完全受益于算法保护。事实上,仅有《著作权法》的规定,缺乏了算法保护,上述商业模式系难以成立的。可以想象,在缺少算法保护的时代,付费内容下载系需要使用者与平台之间通过协议来确定权属,使用者在获得作品后,极有可能将其再复制给其他用户;在这种情况下,如果平台采用诉讼的方式进行维权是不现实的,其所需要付出的维权成本已远远高于其维权收益;因此,也就可以理解,《著作权法》的相关规定并未能直接催生出具体的盈利模式;恰恰是算法保护才催生出一系列付费下载的商业模式。

(二)算法保护与数据库授权

身处在人工智能时代,有关数据权利的问题一直倍受社会关注。与此同时,数据产业发展的多重变数,使数据相关权利存在诸多争议。我国《著作权法》虽有相关规定,表明有独创性的数据库可能会受到汇编作品的保护[5],然而对于何为独创性的数据库,同样是一个存在诸多争议的问题;尤其是随着人工智能算法提升,它甚至可以在非结构化的数据中寻找规律;这使得对于数据库独创性的要求越来越低;那么,在这一背景下数据库又应当如被保护?类似问题还难以找到有效的法律依据。实践中出现的类似判例,法院大都通过“反不正当竞争法”作为判决依据,[6]这实质是在法律上回避了数据权利的问题;而通过具体问题具体分析的思路来解决纠纷。可以理解,大数据权利固化还需要更多人工智能时代的法律实践,有关数据权利的立法也将是一个漫长的过程。事实上,在解决数据权利的问题上,算法保护发挥了至关重要的作用。通过对数据库加密的方法,进而保证了只有授权的用户者可以使用数据;即使在数据权利还没有最终得到法律确认的情况下,算法保护也实现了数据库建设者与使用者之间边界设定。

(三)算法保护与无版权作品利用

作品可能在以下两种情况下失去版权:第一,缺少独创性要件的作品,比如单纯的事实消息没有版权[7];第二,过了版权保护期的作品。[8]依照版权法相关规定,对于无版权的作品,任何人均可无偿使用,因此仅从《著作权法》规定出发,针对没有版权的作品,似乎再难实现盈利之功效。然而,针对无版权作品,算法保护则提供了另类商业模式设计方案,无论其作品是否有版权,算法均可以将其有效保护起来,甚至只有授权付费用户才能使用相关作品;对于未付费用户虽然可以通过其他途径找到无版权作品,但这势必增加其搜索成本;此外,基于算法的比对分析还可以进一步彰显算法的优势,从一意义上讲,在版权产业发展过程中,即使针对没有版权的作品,算法本身同样可以催生出诸多商业模式。

 

四、结语

 

人工智能时代,权利保护格局的一个重要变化就是从诉讼保护走向算法保护。算法保护甚至还将催生着版权保护及其商业模式的重大变革。在版权保护领域,人类社会也势必将经历了从“人的独立保护”到“人与算法合作进行保护”,再到算法相对独立保护的历程。从严格意义上讲,当下还处于人机合作的算法保护阶段,算法固然有其保护版权的优势,但它还无法完全替代人实现对版权的全面保护;尤其是涉及到需要剖析作品的内涵、思想以及价值判断时,机器还难以具备类似人一样的思想。尽管像Bert等新兴的自然语言处理技术已极大发展,甚至OpenAI GPT-3在自然语言处理当中已经使用到了1750亿个神经元[9];但当下的算法总体上还处于一维维度;而对于作品和版权的全面理解又恰恰需要算法的多维思维才能真正实现。因此,有必要正视算法对版权保护的效用,切不可过分夸大算法的作用;甚至还有必要进一步深入研究在版权保护过程中,人与算法的边界,从而构建出未来社会完整、系统、科学的版权保护体系。

还需指出,算法保护绝不局限于版权领域,即使针对有形财产,算法保护同样可以发挥积极作用。手机在设定加密保护的情况下,即使拿到了手机也没有办法正常使用手机;甚至在当手机丢失时,还可以通过云服务定位系统(手机生产商提供)寻找该手机当前所在位置。[10]随着智能驾驶时代的到来,算法保护还应广泛应用于汽车管理和保护中。芯片和算法越来越多植入到产品当中,又催生了算法保护的广泛应用,共享单车、共享充电宝以及无人售卖机等,同样也在基于算法设计完成财产的管理与保护。即使对于纯粹的物理产品(内容没有嵌套芯片和算法)的保护,算法保护同样也具有一定的适用空间。当然,对于此类物品的算法保护,并非系直接通过对其远程操控、定位、警报设置来实现的;而是通过视频算法来实现对其进行保护,即通过物品环境、周边人物行为等要素进行判断,进而实现对于财产的保护。[11]算法保护或将成为未来社会最重要的财产保护方式,对于它的研究只能算是刚刚开始,一切还有待接下来的进一步深入研究和实践。

 

注释:

[1]《专利法》第三十九条“发明专利申请经实质审查没有发现驳回理由的,由国务院专利行政部门作出授予发明专利权的决定,发给发明专利证书,同时予以登记和公告。发明专利权自公告之日起生效。”

第四十条“实用新型和外观设计专利申请经初步审查没有发现驳回理由的,由国务院专利行政部门作出授予实用新型专利权或者外观设计专利权的决定,发给相应的专利证书,同时予以登记和公告。实用新型专利权和外观设计专利权自公告之日起生效。”

《商标法》第二十二条第一款“商标注册申请人应当按规定的商品分类表填报使用商标的商品类别和商品名称,提出注册申请。”

第三十三条“对初步审定公告的商标,自公告之日起三个月内,在先权利人、利害关系人认为违反本法第十三条第二款和第三款、第十五条、第十六条第一款、第三十条、第三十一条、第三十二条规定的,或者任何人认为违反本法第四条、第十条、第十一条、第十二条、第十九条第四款规定的,可以向商标局提出异议。公告期满无异议的,予以核准注册,发给商标注册证,并予公告。”

[2]《最高人民法院关于互联网法院审理案件若干问题的规定》第十一条第二款“当事人提交的电子数据,通过电子签名、可信时间戳、哈希值校验、区块链等证据收集、固定和防篡改的技术手段或者通过电子取证存证平台认证,能够证明其真实性的,互联网法院应当确认。”

《最高人民法院关于加强著作权和与著作权有关的权利保护的意见》第二条“允许当事人通过区块链等方式保存、固定和提交证据,有效解决知识产权权利人举证难问题。”

[3]《著作权法》第五十四条第二款“权利人的实际损失、侵权人的违法所得、权利使用费难以计算的,由人民法院根据侵权行为的情节,判决给予五百元以上五百万元以下的赔偿。”

[4]例如网易云音乐软件、腾讯视频等平台,只提供软件内下载的选择,只允许在本平台使用下载作品。

[5]《中华人民共和国著作权法》第十五条“若干作品、作品的片段或者不构成作品的数据或者其他材料,对其内容的选择或者编排体现独创性的作品,为汇编作品,其著作权由汇编人享有,但行使著作权时,不得侵犯原作品的著作权。”

[6]例:北京市高级人民法院民事判决书(1997)高知终字第66号;浙江省杭州市中级人民法院(2018)浙01民终7312号案件判决书。

[7]《中华人民共和国著作权法》第五条“本法不适用于:

(一)法律、法规,国家机关的决议、决定、命令和其他具有立法、行政、司法性质的文件,及其官方正式译文;

(二)单纯事实消息;

(三)历法、通用数表、通用表格和公式。”

[8]《著作权法》第二十二条“作者的署名权、修改权、保护作品完整权的保护期不受限制。”

第二十三条“自然人的作品,其发表权、本法第十条第一款第五项至第十七项规定的权利的保护期为作者终生及其死亡后五十年,截止于作者死亡后第五十年的12月31日;如果是合作作品,截止于最后死亡的作者死亡后第五十年的12月31日。

法人或者非法人组织的作品、著作权(署名权除外)由法人或者非法人组织享有的职务作品,其发表权的保护期为五十年,截止于作品创作完成后第五十年的12月31日;本法第十条第一款第五项至第十七项规定的权利的保护期为五十年,截止于作品首次发表后第五十年的12月31日,但作品自创作完成后五十年内未发表的,本法不再保护。

视听作品,其发表权的保护期为五十年,截止于作品创作完成后第五十年的12月31日;本法第十条第一款第五项至第十七项规定的权利的保护期为五十年,截止于作品首次发表后第五十年的12月31日,但作品自创作完成后五十年内未发表的,本法不再保护。”

[9] Floridi, L., Chiriatti, M. GPT-3: Its Nature, Scope, Limits, and Consequences. Minds & Machines 30, 681–694 (2020)

[10] S. J. Alsunaidi and A. M. Almuhaideb, "Security Methods Against Potential Physical Attacks on Smartphones," 2019 2nd International Conference on Computer Applications & Information Security (ICCAIS), Riyadh, Saudi Arabia, 2019, pp. 1-6

[11] Kim, J.S., Yeom, D.H., Joo, Y.H. et al. Intelligent unmanned anti-theft system using network camera. Int. J. Control Autom. Syst. 8, 967–974 (2010)

 

作者:杨延超,中国社会科学院法学研究所科技与法研究中心主任、研究员,中国社会科学院大学教授。

来源:《中国版权》2021年第4期。