小
中
大
摘要:在数字经济的大背景下,数据具有越来越重要的价值,在数据类型化分析的基础上,由企业所持有的去 (个人)标识化、经加密、加工挖掘、具有(交换)价值与技术可行性的数据更具价 值。然而在 “个人—企业”数据二元结构中,由于人们预设了二者之间可能存在 “零和博弈”,因而 使企业数据产权设定等问题陷入僵局。在现有理论与实践基础上,应搁置相应企业数据产权争议,并设立企业数据的利用与分享准则,比如在基于公共利益需要的特定领域、消费者福利、数据企业的整体生态建构以及数据标准化等等,进而设立数据生产者权利,并构建数据利用的权能体系安排,以实 现数据尽其用与法的安定性。
关键词:企业数据;数据权属;数据标准化;数据生产者
一、引 言
在数字经济时代,数据成为越来越重要的生产要素,基于算法而形成的大数据能够进一步增强人们的洞察力和决策力。如同任何物品一般,只有物尽其用,才能物有所值。数据亦是如此。当下大量数据经基础交易而由企业等数据持有主体掌握,通过运用算法产生新的数据集合结果,由于制定法与实践中对数据分享与流动并未设定相应规则,甚至实践中更多是一种限制倾向,因此这些数据可能并未被充分利用,其价值也尚未“被检验”或“被衡量”。尽管数据正当利用畏葸不前,但数据“地下利用”与“黑产”却猖獗难抑,近年来多场数据大战,也给行业发展与司法实践带来多重挑战,确定企业对数据可能享有的权利并建立相应利用准则极为紧迫。就目前学界与实务界而言,有关企业数据能否利用、可利用的数据类型、数据权属确定是否具有可行性、数据利用之有偿或无偿、数据利用或分享中的主体权利边界等一系列基础性问题尚未形成共识,观点与学说竞艺,理论与实践逐鹿。尤其是,受制于数据权属应追溯至来源主体的惯性思维影响,个人数据基于隐私与敏感信息保护而占最优地位,并获得最为强力的保护,即便是在交易过程中所生成的非敏感数据转移到其他主体之后,也仍然难以在权属问题上作出绝对划分,并始终成为难以逾越的思维鸿沟。故此,为充分实现数据价值与利用效率,现阶段对于诸多可能形成僵局的未决问题是否可考虑暂且搁置,而对“数据利用向何处去”这一元命题进行再追问。
二、数据权属界定之困境
隐私、信息与数据三者之间的关系犹如传说中的戈尔迪乌姆之结(Gordian Knot),几者交错难辨,谁能解开这个结,谁就能成为“亚细亚之王”。这几个概念在被反复不断区分之中界定内涵、外延以及寻找边界。一个信息可能形成多种数据,一种数据也可能是多种信息统计的结果,二者可能是“一对多”、“多对一”以及“多对多”的关系。最具挑战的是,数据本身也极具复杂性,基于信息在内容层上的设定性、特殊性与局限性,使得相关数据在内容与类型区分上具有相当的复杂性与难度。从目前讨论来看,数据都被当作一个整体,当讨论其运用或权属之时,或着眼于其物理状态、或聚焦于其转换形态、或强调其利用价值等等,不一而足,故此对其在不同场景的讨论就鲜有共识或较难达成共识,从而呈现一种观点与学说竞争的局面。有论者已尝试将数据从物理层、符号层和内容层作一层阶划分,从而将数据文件权利创设等研究向前推进一步。然而,即便是数据文件,其价值与交换价值仍然是由内容层的信息或数据本身所决定,也仍然无法解决当下数据利用等问题。鉴此,首先探讨可供社会与企业分享利用的数据类型这一前提性问题极为必要,既是对数据实践问题进行探讨与建构,也是对学术界学说竞争的一种澄清与回应。
(一)企业可利用或共享之数据类型
已故图灵奖获得者吉姆·格雷(Jim Gray)提出的数据密集型科研“第四范式”,将大数据科研从第三范式(计算科学)中分离出来单独作为一种科研范式,是因为其研究方式不同于基于数学模型的传统研究方式。社会应用领域则会对数据类型化和分析结果赋予一定价值判断,将数据分为个人数据、企业数据与公共数据,敏感数据与非敏感数据,原始数据与加工数据,基础数据与增值数据等等。基于这些对数据所进行的描述性与价值判断类型划分,对于企业而言,目前最具争议的主要集中在“基于原始的用户数据在去除个人身份属性之后的数据产权问题”,即经授权采集的个人数据归属,以及经匿名化处理并通过算法而得出新数据集的利用等问题。前述有关企业数据权属学说之争也主要基于对个人数据与企业数据之间关系的不同认识。
在技术运用与价值判断类型基础上,限缩与集中至几乎最无争议的程度,目前对于企业数据而言,最为关注的即——去(个人)标识化、经加密、加工挖掘、具有(交换)价值与技术可行性的数据——之利用问题。易言之,对于简单的数据整合、不符合交换价值标准以及技术上无法对接匹配的数据,即便加入劳动要素,都不应在被共享或利用之列。本文如下所讨论的企业数据,也完全限定于此种类型,不再赘述。之所以将其进行如此界定,主要在于,数据相较于其他性能一体化之“物”而言,其最大特征为——不同特性与体量之数据,能够形成不同的数据集合等分析结果,人们对这些分析结果的评价和判断可能完全不一。而数据之所以能够承托起数字经济,主要在于其价值体现在基于技术驱动而产生的颠覆式结构再造,基于此种“结构创新”意义上的数据挖掘,从而形成新的洞察能力,产生新的商业价值与社会价值,尤其是可能在最大程度上实现消费者福利最大化与公共利益。也正是在此意义上,数据才可能既是产品,又是原材料与生产要素。因此本文所探讨的,不是笼统的企业数据,而是仅指上述被框限的企业数据类型,而且是从一种结果意义上的产品角度和生产要素角度讨论数据利用及其权利边界。
(二)数据权属争论
近年来学界与实务界展开了一系列有关企业数据权属与权利创设的激烈争论。无论是企业原始取得说,还是新型财产权说、知识产权说、数据资产说,目前已有思路基本上是从对数据持有主体的激励角度,比如“实现为数据生产者和所有者创造价值,同时不给社会增加外部性风险”,“企业数据财产权虽然具有权利之名,但其结构实为一种极为复杂的法律秩序安排”,等等,诸学说与观点的出发点都是充分考虑“数据尽其用”,主张以私权或“准私权”的方式对数据给予一种绝对权意义上的、具有支配权特征的权利定性。易言之,在“权属”的争论上,人们仍然更加注重“归属”。然而,诚如有论者所指出的,“数据经营者所处理利用的数据集合之主要构成部分就是可社会化的个人信息。”就具体交易而言,例如,A消费者在B网购平台上购买商品,对于B平台而言,如若进行一种数据利用假设,其在完成相应交易或提供相应资金产品之后,可根据A的相关数据,经过匿名化处理并利用算法,形成新的数据图集,比如地域、年龄段、购物频次、偏好、付款方式、资金能力、在该平台上所享信用额度,以及此类个体或群体特征,包括购物偏好、退换货、消费信贷类产品使用情况等,以此来考虑风险评估与营销策略等。个体基于在先交易而将个人数据提供给平台企业,这些数据即便被脱敏,是仍然属于个体还是企业。这一问题争论已久,目前尚无定论。
数据“归属”多诉诸于产权或财产权模式构建,有论者从法经济学视角,运用一种通用理论与模型,就产权初始分配侧重于交易费用、成本—收益、外部性等考量因素,将企业数据解释为一种物权客体,认为对大数据确权则进行“制度禀赋难度低与改进成本小”,同时又可“抑制制度负外部性、降低交易费用”。此类观点的前提或模型也许是正确的,但结论却过于主观与武断,因为在“个人—企业”数据关系中,目前尚未有任何实证研究表明,赋予企业产权会使制度实现最优,并且成本最小。因为数据确与其他标的物不同,人们始终无法切断个人数据与企业数据之间的联系,在企业数据产权的可能收益与个人隐私或敏感数据利益之间,似乎仍是一种“零和博弈”而非“正和博弈”之价值预设。同时,尽管个人利益在价值、理论与观念上居于最优地位,但是很难或者至少现阶段无法证明赋予企业数据产权在现实中也会最大化有利于个体。尤其是,现实中个体处于对数据失去控制权之状态,如若企业不能恪守相应数据保护义务,个人权益则存在被侵害之虞,而法律也从不会赋予强者一种最强力的绝对化产权。
如若从企业数据权利派生于个人数据权利这一观点来看,其立基于“知情同意原则”。但是该原则却在当下被不断批评与反思。有论者认为,知情同意原则奠基于“小数据时代”,当人类步入大数据时代,知情同意原则陷入重重困境。事实上,实践中传统知情同意框架几乎面临穷途末路,隐私保护效率低下,用户权利几近架空,因为大数据技术的复杂性导致数据主体无法真正理解隐私风险而可能作出非理性选择。因此,在“个人—企业”两造关系中,固守个体知情同意原则,过于僵化二者之间的关系,似并不符合实践需要。有论者另辟蹊径,建议在个人信息使用方面进行一种利益平衡测试,从而引入利益豁免机制。也有论者认为,应在用户隐私与获得服务与资源之间实现当前情景最优的选择。但无论如何,讨论企业数据之时,都无法不考虑个人数据的使用限度与千丝万缕的联系与影响。因此,在个人与企业二者之间关系尚未辨明之前,这也使得目前诸多讨论可能总会陷入一种“死循环”。那么,又将如何寻找出路与解决方案呢?
(三)争议搁置与出路
尽管存在上述争议,但是技术、产业要发展,就必然无法忽视企业数据的作用与价值。但如若始终踌躇于“数据归谁所有”这一问题上,企业数据利用可能始终无法突破,也无益于纾解上述僵局。事实上,从目前利益博弈、监管空间等角度来看,赋予企业数据产权的可行性都并不高。因此,可否考虑搁置概括的企业数据产权问题的讨论,而依相关准则建立企业数据利用机制,在当下可能更为可行。此种准则的建立,并不适用于所有企业数据,而主要集中于上述去(个人)标识化、经加密、加工挖掘、具有(交换)价值与技术可行性的企业数据。因此,从正向增益角度而言,对其进行利用会在相当程度上实现企业数据的价值,从负面作用角度而言,经过系列处理,似乎并不会减损目前状态下的个人数据利益。
另外,企业数据利用规则之所以迟迟无法建立,除上述个人与企业所形成的僵局而言,在某种程度上也是因为目前数据可供分享与利用之“标准”并不明确甚至缺失,比如对数据分享利用之内容、技术与定价标准,以及现行法是否存在适用空间等都讨论得并不充分。故此,搁置目前企业数据产权争论,从数据利用的外部环境、产业以及数据定价等角度,似是目前较为可行的出路。
三、利用准则的考量因素
在个人信息保护“达摩克里斯之剑”始终高悬的大背景下,创设非个人数据利用规则之时,无论如何进行价值与利益衡量,充分保护个人信息都是“底线”与终极价值,不容撼动。但是企业持有并深度挖掘更大价值数据亦为社会现实所需。在上述困境之下,企业数据分享与利用规则之建构并非易事,应考量多重目的与多元化因素。数据之利用在于激励创新,但是“激励”一般系为经济学价值主旨,对于法学而言,尽管对主体之“激励”也是创设制度与规则的考虑因素之一,但最终都要回归到公平、正义、法的安定性等基本价值与范畴。易言之,即便是一种理想状态——自产生“激励”而始至创设“权利”而终,其间仍存在诸多重要因素与价值衡量。
目前实践中已存在大数据交易,据有学者调研显示,目前大数据交易平台的交易形式大致分为综合数据服务平台和第三方数据交易平台两种。在该类平台上的交易,其数据的所有权,包括原始数据和加工处理之后数据的所有权等分配问题就成为数据交易过程中的难点。上述实践中所反映的难点问题又回到学界所持续争论的一系列问题上。殊值重申的是,如下所讨论的数据类型即为本文第一部分所框定的——去标识化、经加密、加工挖掘、具有(交换)价值与技术可行性的数据。在构建相应规则之时,目前宜从某些领域、消费者福利和产业生态等角度考虑设立相应规则。
第一,基于公共利益需要的特定领域。从大数据本身特性考察,有学者指出,“一般而言,企业收集和处理大数据,不是按学者们经常描述的‘从数据到信息再到知识和智慧’的研究思路,而是走‘从数据直接到价值’的捷径。”可见,运用大数据而产生的价值是直接且显而易见的。对于整个社会而言,最重要的即在于可利用大数据用于社会统计以较广范围内预防风险与危害。比如,2009年Google预测了流感趋势,使公共卫生机构获得了有价值的数据。事实上,“预测是大数据应用的核心,也是挖掘的价值所在。寻找基于大数据的预测方法,在数据采集、数据存储、数据分析以及数据可视化能够准确应用,必须清晰大数据的预测特征和预测范围。”可见,对于社会而言,大数据的预测价值更为显著。当然,大数据也并不能因此被“神化”,在2011-2013年间,Google的流感趋势开始走下坡路,它高估了流感流行趋势超过50%。因为大数据尽管存在一定特征,但同时也可能是一种缺陷,比如,相关数据是实样而非抽样、具有效率但却并非精确、具有关联性却非因果关系等。因此,大数据应充分被利用,但同时也应甄别使用,其主要作用仍在于增加人们的判断力与洞察力,而非完全依赖于数据的客观呈现。事实上,尽管企业是基于经营目的而进行大数据统计,但对于个体消费行为、所购买产品、信用行为等集中度的相关数据统计,可在相当程度上从社会总体角度作出一定判断。比如,可根据药品或卫生用品的销售量而预测流行疾病的类型与集中爆发区域,根据零工或临时工作从业者数量以及所选择的行业集中度而对社会保障作出判断,随着网购成为目前最为主要的商品购买方式,对于相应购买力统计的数据可作为社会经济总体预测的重要考量因素,以及根据个体在平台企业上的信用行为等,可对其信用程度作出一定判断。因此,这些企业数据可供公共卫生、环境保护、社会保障、社会经济总体预测、征信等公共利益领域所利用,从这一角度出发,应设立相关数据分享或利用规则,从而实现数据的更大价值。
第二,增进消费者福利的场景化利用。在整体社会经济秩序中,消费者利益与福利无疑是处于最高位阶的,在数字经济时代更是如此——消费者应获得更好的商品与服务。事实上,在现阶段,当平台企业掌握更多与消费者的消费行为相关数据之时,其可以通过算法对商品需求偏好、选择倾向、退换货情况等进行分析计算,从而为消费者提供更充分的选择并促进商家改进服务。比如,近两年流行的“用户画像”,则是一种个性化、有针对性的分析。即通过收集、汇聚、分析个人信息,对某特定自然人个人特征,如职业、经济、健康、教育、个人喜好、信用、行为等方面作出分析或预测。这也是在某种程度上为消费者提供更有针对性的最优服务的基础。此种“用户画像”在《信息安全技术个人信息安全规范》(第3.7条)之中也有所规定。可见,从数据利用之初衷考察,增进消费者福利与利益是始终追求的目标。然而,在充分利用数据统计优势之同时,也不能忽视其可能带来的负面作用与风险。比如,近年来有关平台对消费者的“差别定价”甚至“歧视性定价”,则将数据与算法的负面作用放大,这也对大数据时代经营者应如何恪守诚信义务提出更多要求。值得一提的是,德国目前对数据企业掌握用户数据并进行精准广告推送持否定态度。2019年2月7日,德国反垄断监管机构联邦卡特尔办公室(Feder Cartel Office)裁决Facebook滥用其市场主导地位,在用户不知情或不同意的情况下收集用户信息,侵害了用户权益。同时该机构官员称,Facebook利用用户数据向客户进行广告推送并获益,对于一个具有市场主导地位的企业,应当遵守德国和欧洲相关法律规定。2018年12月,在剑桥分析事件(Cambridge Analytical)中,Facebook违反哥伦比亚特区《消费者保护程序法》(Consumer Protection Procedures Act)被起诉,该案中,Facebook平台上一个名为“thisisyourdigitallife”的第三方应用程序通过平台获取了Facebook用户个人数据(其中包括约7000万美国用户),这些数据被非法收集并随后被出售。因Facebook在本次事件中被认为对于用户数据被非法收集和出售负有管理上的疏忽与过失,Facebook面临来自多国监管机构以及作为本次事件的“受害者”的相关数据主体的多重追责。可见,尽管数字经济时代可以进一步增进消费者利益,但是其副作用也显而易见。故此,根据实践发展,设定场景化利用准则的同时,应设定好数据持有主体的义务,以更好保护个体数据权益。
第三,数据持有企业的整体生态建构。数字经济时代不仅颠覆了消费者的观念与行为方式,对企业的决策方式、商品服务提升也产生巨大影响甚至是决定性作用。管理学大师西蒙在20世纪80年代计算机时代到来之时就指出,“企业里制定非程序化决策的传统方式——包括大量的人工判断、洞察和直觉观察——还未经历过任何较大的革命。可是在目前,我们可以看到在一些基础研究方面,比如,在探索式问题解决方面,和过去二十年来已经在进行的人类的思维过程的模拟等方面,这种革命正在形成。”而在数字经济时代,在充分掌握数据之时,企业的判断力、洞察力、决策力都会有更大提升,此种思维革命也更为显著。此前,Google广告获得巨额收入经常被引用作为大数据相关分析的成功案例,美国Wired杂志主编Chris Anderson在他的著名文章《理论的结局》(The End Of Theory)的结尾发问:“现在是时候问这一句了:科学能从谷歌那儿学到什么?”同时,由于各企业所形成的大数据统计相对独立,所作判断未必全面,因此,设立相应分享利用规则,在总体上能进一步增进消费者福利与促进形成产业良性生态。事实上,任何产业发展过程中,都必然有“排头兵”与发展相对劣势企业,而除了传统意义上的商品与服务优势之外,数据占有与利用优势无疑会使企业在数字经济时代形成新的发展方式。一方面,如本文开篇所提及的近年来数据持有企业之间的各种数据大战也足以说明问题,倘若不建立企业之间的数据有偿分享或利用规则,此种混乱格局仍将持续,不正当竞争、甚至地下黑灰产都会戕害企业发展良性生态;另一方面,产业的总体提升,必然是所有企业主体尽可能最大化发展,而数据作为目前发展的关键性因素之一,其如能在本产业不同主体之间流动,必然有利于提升整个产业发展水准与良性生态。因此,建立一种企业数据利用分享规则与生态,也是当下的重要价值选择。
第四,可利用与分享数据本身的标准化。通常而言,一个可能被有偿分享或交易的“物”(准物、类似于物)或商品只有具有稀缺性以及价值属性,才可能被市场认可并被允许交易,同时其应具有交换价值与市场预设的价格标准,即能够被定价,亦能够具有公认且相对公允的交易价格。事实上,当下关于企业是否享有数据权属等问题的争论,在相当程度上是对数据本身能否利用以及其是否具有相对公允的对价的质疑。房屋、汽车等有体物以及无形财产等等基本上均具有公认交易价格,因其具有可抽象的价格认知标准。但是作为各数据持有者所采集、加工的数据,其所形成的数据文件可能不尽相同,其交易障碍之一即可能无法形成具有共识的交易价格标准。在此意义上,建立一种大数据“对价”标准体系,可以说是将数据利用与分享具体“落地”的重要问题。如本文开篇所述,之所以对数据权利众说纷纭,主要在于对“何为数据”存在认识差异,而这一命题又可具化为多重要素与标准,非常重要的一点即数据倘若分享、转让与流动,将如何设定一种“对价”。易言之,经过加工等数据可以成为分享、转让的客体,但并非所有的加工数据都具有交换价值,只有真正意义上实现一般意义上且公认的“价值增值”的数据才能成为客体。
数据定价与其他物之定价不同,比如同种类数据,不同来源的数据具有不同价值,这在医疗数据中尤为突出;同时不同数据在不同使用者看来,也是价值各异。尽管人们在不断强调数据的价值,但是由于并没有建立数据利用分享的基本规则,因而数据持有主体基本上也都敝帚自珍,在“数据生态中,参与各方由于利益博弈,往往造成数据割据并进而形成数据孤岛现象。在此情形下想要获取真正有价值的数据并非易事。”有论者对当下金融科技发展过程中的数据交易进行研究时提到,“数据交易系统通过交易网络获得一种具象结构,交易主体根据各自不同的信息集进行决策,其基本逻辑内核是每个交易主体都按照自己设定的收益目标以及掌握的信息选择收益最大化的交易。”因此,数据本身的标准问题也是当下应确立的基本问题之一。有学者认为,成熟的无形资产价值评估通常有三种方法:重置成本法、收益现值法和市场比较法。但是这几种方法很难准确量化数据资产的真正价值,宜根据数据资产所属行业特点、数据资产特征、应用环境、商业模式等多角度综合分析数据资产价值维度,通过提取量化指标,建立适合不同行业、不同属性的数据资产价值评估模型。传统的效用价格论、成本价格论等定价模型并不适用。因此也有学者分别提出基于竞标机制的鲁宾斯坦模型、定价函数基本机构、动态调整定价、从资产期权价值评估大数据资源价值、应用程序之间通过市场机制的数据交易算法等。因此,在数据类型化的基础上,数据交换价值与价格之确定是构建数据分享、利用规则的重要前提与基础。
诚如有论者指出,对法律规范中的价值关系,可将其分解为社会行为的事实属性和社会主体的共同需求这两个基本要素,以及这两个基本要素之间的满足关系。对“社会需求”要进行话语上的“框定”,将其转化成一种制度性、规范性的“立法需求”表达。更为紧迫的是,尽管当下并没有创设法定的数据利用规则,但是却并未杜绝现实中大量的“数据私下交易”现象,甚至其中绝大多数是爬取个人数据的违法行为。因此,与其让大量“地下交易”存在,不如将其合法化,设定利用规则,确定权利、义务边界,如此也更能明晰法律责任。诚如凯尔森所指出,“当社会成员遵循特定的行为模式达到一定时间,在社会群体中便产生一种信念,认为人之行为应遵循此模式。”因此,建立一种行为模式既能保证数据充分流动利用,又能在数据产业发展实践中趋利避害,应从相应认识开始,才能实现一种事实上的一体遵循。从目前制定法的适用空间来看,在数据共享转让方面,《网络安全法》第42条规定,“网络经营者不得泄露、篡改、毁损其收集的个人信息;未经被收集者同意,不得向他人提供个人信息。但是,经过处理无法识别特定个人且不能复原的除外。”在《信息安全技术个人信息安全规范》第8.2条中,实际上已经在一定程度上允许信息控制者共享、转让经去标识化处理的个人信息。在该安全规范最新修订草案中,仍然保留此条,并未修改。根据该条,原则上共享、转让个人信息需征得个人信息主体同意,但“共享、转让经去标识化处理的个人信息,但确保数据接收方无法重新识别个人信息主体的除外”。“举重以明轻”,既然共享、转让去标识化处理的个人信息尚且未被禁止,那么,对于去标识化、加密、加工挖掘、具有(交换)价值与技术可行性的数据,建立一种利用与分享制度,在现行法之下也具有相当的空间与可能性。
四、企业数据权能配置
在当下数字经济时代,数据体量之大、范围之广、价值之高,已成为公认事实。倘若不充分利用,则对社会与经济发展无益;当下企业间对数据的不正当竞争甚至恶性竞争也同时说明, 无论是正向价值的激励还是负面影响的抑制,构建数据利用与分享规则都十分必要。然而,企业数据利用中所涉权能之分配组合与相应权利,亦是理论与实践中的难点与重点。
(一)权能配置的基本方式
虽然本文主张搁置企业数据权属争议,但是一旦利用规则建立,就不可避免地要探讨其中的“权利”或“权能”边界。易言之,如果说上述问题讨论是在认识与理解“何种企业数据类型有可能被利用”以及“企业数据应否利用”等问题,那么此处我们要讨论的是,“数据到底如何利用”的问题。若从数据本身特性、现实需求与场景化特征等方面考察,所谓相应权利或权能,即对数据之占有、使用、生产加工、收益、处分(有限制)等权能。就这些权能的具体内涵而言,占有、使用、生产加工等比较容易界定与辨别,而“收益”,此处仍指传统意义上的类似于财产权意义上的有偿与获得利益,处分也是一种类似于所有权权能中的处分,只不过囿于数据来源与个人利益保护至上等因素限制,类似于传统物权的绝对权/支配权意义上的完全“处分”权能基本并不存在,而是一种针对具体情况与场景的有限制的处分。因此,在上述数据利用准则的范围与限度内,将数据的不同权能进行分拆、组合与配置,以充分实现物尽其用并创设可行规则与路径。
在讨论上述企业数据利用基本准则的基础上,针对不同使用目的与利用方式,可能会形成不同的权能配置方式(参见下表)。
利用形式 |
占有 |
使用 |
生产加工 |
收益 |
处分 (有限制) |
公共利益需要 |
√ |
√ |
√ |
× |
× |
消费者福利 |
√ |
√ |
√ |
× |
× |
产业生态构建 |
√ |
√ |
√ |
√ |
√ |
表数据利用准则下的权能配置
其一,在公共卫生、社会保障、社会经济总体预测、征信等公共利益领域使用相关数据之时,由于其使用目的主要是为了社会总体预测、进步,主要是在企业与公权力部门或相关企业之间分享利用相关数据,因此对于相应企业数据,企业享有占有、使用、生产加工等权能,而并不能获得利益,也就是说并不享有“收益”权能,但是基于公允原则,相关企业可基于一定标准获得一定成本性补偿。
其二,在消费者福利优化的场景化领域,实际上更是企业为实现自身服务提升之目的,因此享有占有、使用、生产加工等权能,如涉及在企业之间利用分享数据,则由下一个问题,即在企业之间进行数据利用分享这一问题而吸收合并。
其三,对于企业间或同业的整体生态建构而言,企业数据被利用分享之时,企业对数据享有占有、使用、生产加工、收益、处分(有限制)权能。由于提供数据的企业对数据进行了相应生产、加工,有劳动因素加入,并且从分享利用数据之后的使用目的来看,更多是为商业利益,因此,此种分享利用数据持有企业可享有相应收益,但此种利用分享并非广泛、大规模交易,仍应限定在确需在某些行业进行整体生态建构的情形。同时,由于决定向哪些企业分享利用数据,更多可依赖于数据持有企业的自主判断,不存在强制分享利用情形,因此在某种程度上,企业可享有有限制的处分权能。此种将权能配置进行区别对待,才更能凸显利用准则之公允与合理性。
(二)数据生产者权利
对于企业数据利用,实际上更强调数据价值体现于加工与处理之后,在上述权能安排基础上,我们可以发现,对于企业而言,其可能享有一种新的“身份”——数据生产者,并似可创设整合为一种权利形态。如有论者指出,从现有的众多大数据定义来看,大数据不仅包括数据本身,同时还包括大数据处理技术,甚至包括大数据引发的人类思维模式、行为模式和商业模式变革。因此,强调企业数据,更是在讨论企业如何生产有利用价值的数据。这关涉整个生态链以及经济、社会的方方面面。
欧盟在2017年发布的《建立欧盟数据经济》(Building aEuropean Data Economy)报告中指出,委员会打算支持创建一个共同的欧洲数据空间——一个具有规模的无缝数字领域,以使基于数据的新产品和服务得以开发。作为创新和增长的关键来源,数据应尽可能多地用于再利用。同时在《建立欧盟数据经济公众咨询总结报告》中提到,多数受访者认为对于数据的生产与分析,应创设生产主体对数据的所有权或许可权。也即,对于“非个人的和计算机生成的匿名化数据”,欧盟提出创设“数据生产者权利”的设想,即该权利可以是排他性的财产权,数据生产者有权分配或许可他人使用其数据,并独立于其与第三方之间的合同关系。对此,也类似于有论者所提出的,“数据处理者享有经个人数据主体同意基于基础数据进行加工编辑分析而产生的增值数据所有权。”因此,本文所使用的“数据生产者权利”更多借鉴了欧盟的提法。
事实上,在数据采集、加工、利用等过程中,“加工”是最为核心的环节,如果将这个过程所形成的数据特性截成不同的横断面,则加工是对所采集数据的加工,而加工也恰是新数据(集)的生产,这也就是业界通常所说的“数据是一种生产要素”,所生产的数据(集)或其他形态结果,进而可形成一种基于上述权能配置组合的权利形态。
殊值辨识的是,数据的生产加工事实上与一般物的生产加工相似却又存在一定差异,对于制造一般物品而言,原材料在物权上均归属于生产者,而数据生产过程中的非结构化数据等“原材料”则多来源于个人在先基于一定交易或接受服务等行为而提供,此种“原材料”无法完全解释为归属于数据生产者。因此,对于数据生产者而言,在生产出相应数据之后,即便欧盟提出创设数据生产者的所有权或许可使用权的设想,但这种权利只能说是享有一种排他性的占有、使用、收益,而在分享、利用或处分之时,则应遵循一系列准则,比如本文前述所提出的基于数据使用目的要求与数据标准化等前提。因此,无论于价值选择抑或现实需要,在整个数据利用体系之中,建立数据生产者权利均十分必要。
五、结 论
由于人们预设了个人数据与企业数据之间可能存在“零和博弈”的前提,因而在企业持有因在先交易而采集的个人数据的利用与权属上争论不休,并陷入一种完全僵局状态。即便存在争论,数据价值仍不容忽视,宜顺应数字经济时代的发展创新而加以利用。在辨别数据类型化的基础上,对于企业持有的去(个人)标识化、经加密、加工挖掘、具有(交换)价值与技术可行性的数据,应搁置目前有关数据产权的相关争论,而构建相应利用与分享制度。就可能设立的一系列数据利用与分享准则而言,包括基于公共卫生、社会保障、经济、征信等特定领域的公共利益需要,促进消费者福利,实现产业良性发展生态,并设定数据标准化以及定价标准。这些准则设立了企业数据利用分享的“门槛”,从而使只有真正达到技术要求与利用要求的企业才能实现数据流动与分享。对于能够生产挖掘出有价值数据的主体应创设数据生产者权利,从而实现数据利用的权能配置,以实现数据之于人类社会发展的更大价值。
作者:姚佳,中国社会科学院法学研究所副编审,法学博士。