【作者】刘建臣(山东大学法学院助理研究员,法学博士)
【来源】北大法宝法学期刊库《华东政法大学学报》2024年第6期(文末附本期期刊目录)。因篇幅较长,已略去原文注释。
内容提要:我国决策层已决定通过三权分置的思路保护数据,且正在研究数据登记的新方式。在此背景下,数据知识产权登记的地方试点立法正火热开展。但立法进程的科学性依赖于两个前置性条件的成就:数据产权在立法层面将以财产权形式确立,数据知识产权在数据产权的体系中有一席之地。只有在完成双重前提论证的基础上,方可探究登记制度的具体设计。梳理试点省市立法文本可以发现,其对登记对象、审查模式和部分配套制度等重要内容均存在认识分歧。在登记对象的确定思路方面,鉴于数据知识产权可用以实现数据产品经营权的立法表达,应将其限定为合法来源、衍生数据和商业价值,并对公开数据和非公开数据均开放登记。在审查模式的选择依据维度,考虑到数据内在的高信息成本,宜仅采取版权模式下的形式审查方案。在配套制度的安排方面,立法者应当秉持与赋权模式相匹配且有助于促进数据交易流通的双重价值取向,承认独立处理例外、限定公开范围并采纳登记生效主义。
关键词:数据知识产权;登记对象;审查模式;信息成本;配套制度
目次 一、问题的提出
二、登记对象的确定思路
三、审查模式的选择依据
四、配套制度的设计安排
五、结语
在当今的数字经济时代,作为关键生产要素的数据对经济发展的带动效应日益增强。如何围绕数据的生产和利用设计相适宜的保护方案,进而释放数据经济的潜能,极其考验各国决策者的智慧。我国决策层已在《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称《数据二十条》)的顶层设计中明确表示将为数据提供赋权保护,即在公共数据、企业数据和个人数据分级分类的基础上,通过“三权分置”的赋权思路实现数据生产、流通和利用中的利益分配,以构建数据要素的基础制度。
不过,《数据二十条》中的赋权方案仅为决策层侧重于数据价值链实现过程的宏观经济政策描述,而非规范具体的法律表达。为完成由政策精神向法律机制的转化,我国学界近年来已围绕数据确权贡献诸多颇具洞见的研究成果。目前,学界提供的落地方案大致可归纳为传统财产权说、新型财产权说、新型知识产权说、个人信息权说、反不正当竞争说、商业秘密说和非财产权说等,而不同学说内部又呈现出具体实现路径的分野。整体而言,学界目前相对主流的观点为应当通过新型财产权的方式保护数据,但该学说内部在保护对象、权能设置和权利限制等方面仍有分歧。
理论共识的欠缺或致国家层面的数据产权立法久未出台,但这并未妨碍地方立法的先行先试。我国目前绝大多数省市均已出台地方层面的数据立法,深圳甚至直接规定了《数据二十条》所未明确界定的三权分置之具体内容。其实,在市场运行维度,数据确权旨在实现的激励数据生产和促进数据交易流通均依赖一套完备的登记制度,《数据二十条》第3条和第15条也强调“研究数据产权登记新方式”和“健全数据要素登记及披露机制”。个中缘由在于,已登记的数据具有政府公信力的背书,可作为具有初步效力的权属证据,以节省数据流通中的交易成本。司法实践的最新立场也已承认数据知识产权登记证书对财产权益的初步证明效力。因此,登记制度的构建既关涉对中央顶层设计的有效落实,又通过产权的映射关系向市场传递出数据交易的起始信号。在此背景下,国家知识产权局已于2022年11月授权8个试点省市作为首批地方试点,并于2023年12月新增9个省市作为第二批试点,以探索数据知识产权登记工作,为将来中央层面的统一立法积累经验。
然而,该等举措在立法进程的科学性维度似有冒进之嫌。数据知识产权登记制度的探索虽有必要,但实则依赖于两个前置性条件的成就:第一,数据产权在立法层面将以财产权形式确立;第二,数据知识产权在数据产权的体系中尚有一席之地。该等前提的实现可为数据知识产权登记的制度设计提供价值指引,而忽略该等前置条件的轻率立法则易出现方向性偏差。对试点省市立法文本的梳理表明,其对数据知识产权的登记对象、审查模式和部分配套制度等重要内容均存在认识分歧。
当前试点省市正火热开展数据知识产权登记的制度探索,但如果其未能准确理解制度构造背后的法理依据,径行选择不适合的制度安排,则会徒增制度设计和运行的错误成本,造成立法资源的错配和浪费。有鉴于此,本文以首批试点省市的立法文本和实践为研究对象,在澄清前述前置性条件的基础上揭示试点省市前述分歧所涉的理论基础,以填补“实践先行、学理后置”的立法沟壑。
登记对象对应着数据知识产权的客体,其关涉整项登记工作的核心,因此需要格外慎重对待。在确定思路方面,应在准确理解《数据二十条》赋权方案的基础上,厘清数据知识产权在三权分置体系中的结构性定位,再依据知识产权法的价值取向确定登记对象的具体要件。
(一)三权分置方案的内涵
《数据二十条》主要使用了经济学话语,如产权本身就是一个典型的经济学概念。在此意义上,其建构的三权分置方案,即数据资源持有权、数据加工使用权和数据产品经营权,并非规范具体的法律表达,仍需通过立法加以转化,而准确理解其要旨对科学合理地完成该转化过程至关重要。
首先,就数据资源持有权而言,《数据二十条》将其描述为“数据处理者对依法依规持有的数据进行自主管控的权益”。自主管控的法学内涵为,数据处理者有权防止他人侵扰或干涉其对数据资源的自主管控力,即他人不得未经许可非法获取、干扰、篡改或破坏数据。因此,持有类似但不等同于民法上的占有,其更强调消极防御权能,而非积极利用。在此意义上,深圳方案理解的数据资源持有权包括“管理、使用、收益和处分权能”未能如决策者期待的那般“跳出所有权思维定式”。此外,在术语方面,《数据二十条》有意区分了数据资源与原始数据,其在保护数据资源持有状态的同时,又提出“审慎对待原始数据的流转交易”,因此其有意避免将二者等同对待。在解释层面,由于《数据二十条》系根据数据价值的实现过程来界定权利,而数据资源持有权对应数据的采集和预处理阶段,其客体应涵盖原始数据以及对原始数据进行初步资源化处理但尚未形成数据产品的数据集合。
其次,与数据资源持有权的消极防御属性不同,数据加工使用权更侧重于权利人的积极使用权能,以满足其对所持有数据的加工使用需求,是故其客体同样为原始数据和数据集合。在权利内容方面,《数据二十条》将其界定为“数据处理者使用数据和获得收益的权利”,据此数据处理者既可自己从事数据处理行为,亦有权许可他人如此行事,并以此获益。鉴于数据具有无体性,权利人无法仅通过物理占有获得类似有体物的事实排他力,因此数据加工使用权亦可排除他人未经许可的使用。在权利配置维度,对于无法通过物理占有获得事实排他力的客体而言,权利人自身的使用与排除他人未经许可的使用实则为权利内容的一体两面,知识产权的权利配置即为例证。
最后,关于数据产品经营权,《数据二十条》仅笼统提及数据处理者对“经加工、分析等形成数据或数据衍生产品”享有许可他人使用的权利。与前两项权利相比,该项权利的客体已发生质变,其指向对原始数据和数据资源进行实质性处理所得的、具有独立价值的衍生数据。原始数据和衍生数据是一组相对概念,前者为经自行收集或基于他人授权而获得的未加工数据,而后者指通过算法对原始数据进行深度计算、分析和整合后所得的系统、可读取、有实用价值的数据或数据集合。在侧重点上,原始数据强调数据未经加工,数据集合则表明数据已经过汇集,而衍生数据突显数据已经过实质处理。在著名的“淘宝诉美景案”中,淘宝在收集用户行为痕迹所产生的原始数据基础上,通过使用算法进行深度分析、过滤、提炼和整合而形成的趋势图、排行榜和占比图指数型“生意参谋产品”,即为典型的衍生数据。不过,《数据二十条》所界定的权利范围过窄,仅包括传统财产权使用权能中的许可他人使用。此外,权利人还具有自用、处分和免受他人干涉的价值诉求,而这亦需要在立法转化中予以体现。
须承认的是,《数据二十条》中的三权分置方案并非清晰确定,其间仍有较多模糊交叉之处。例如,由于数据产品经营者同样具有稳定持有数据产品并免受他人侵扰和干涉的利益诉求,那么究竟该保护系通过扩大数据资源持有权的客体以延及数据产品,抑或是需要另行在数据产品经营权中增设持有权能,不无疑问。又如数据加工使用权和数据产品经营权是否暗含了处分权能,抑或是因处分权能难以为二者所吸收需另行确认,殊值检讨。不过,尽管《数据二十条》中的三权分置的方案仍有待厘清,但学界对法律转化的总体方案已形成相对明确的共识,即通过有限排他权的方式在立法层面确认。换言之,数据产权以财产权形式体现在将来的中央立法中较为可能,这也为决策者推行数据知识产权登记完成第一处前提铺垫。
(二)数据产权体系中的数据知识产权定位
在理解《数据二十条》权利配置思路的基础上,数据知识产权在数据产权体系中的定位就相对清晰。在概念维度,数据知识产权并非现行知识产权法对数据保护路径的简单叠加,而是一项具有独有保护对象和权利内容的新型财产权。在三权分置的方案中,本文认为其更适合用以转化数据产品经营权,原因在于知识产权的客体与作为衍生数据的数据产品具有内核一致性。
作为知识产权客体的无体性信息,可二分为创造性信息成果和标志性信息成果。二者的区别在于,前者的客体要件要求信息成果本身须具有创造性,即创造性具有构成要件的法律意义,如作品和集成电路布图设计所要求的独创性、专利所要求的创造性和植物新品种需具备的特异性;而后者的客体要件对商业标志本身的创造性不作法律评价,仅施加识别性的要求,这意味着无创造性但具有识别性的标志亦可成为商标权的客体。在现行的法律谱系中,也仅有知识产权法通过客体创造性的要求以筛选出值得保护的信息成果,以为社会创新的持续产出提供制度激励,同时将不符合客体要件的信息成果置于可为他人自由使用的公共领域,以力求在原始创新与累积创新间达到精妙平衡。
数据产品同样具有创造性的内在要求,其以原始数据和经预处理的数据集合为处理对象,在算法的作用下通常将无序无规律可循的数据资源,整合提炼为具有内在规律和实用价值的衍生数据,从而形成具有创新增量和独立价值的数据产品。尽管《数据二十条》仅将数据产品粗略界定为经加工分析所得的衍生数据,但立法者在将政策语言转化为法律文本时,势必会面临一项价值判断:究竟要求何种程度的加工分析,或者说要求何种高度的创造性,方可实现决策者期望的“强化优质供给”。如果立法者期待市场中流通更多高质量高创造性的数据产品,那么自然需要设置相应的创造性要求,同时拒绝对未达到创造高度的数据集合提供数据产品经营权的保护,以实现该项权利与持有权和加工使用权的精细区分,不过这并不妨碍数据处理者依然可受到另外两项权利的保护。当然,为鼓励数据的外溢效应和确保公共领域免受侵蚀,立法者需要对该权利施以限制,而知识产权法上的合理使用、法定许可和侵权例外等限制类型均为可行的制度工具。因此,数据的知识产权保护路径在保护客体的可行性和保护力度的均衡性方面均具有相对合理性。而无论立法者是否设置创造性要件以及创造性要求高低,知识产权法均提供了现成的落地方案。
对于知识产权法的价值体系与数据产品经营权的契合性,学界已有初步认识。如有论者认为:“能够成为知识产权客体的数据是衍生数据。”另有学者主张,衍生数据系智力劳动成果的产物,与知识产权的客体具有诸多共性。还有观点承认,作为衍生数据的数据产品属于知识产权的范畴。在实证层面,区分原始数据与衍生数据的保护亦是知识产权审判实践的基本立场。鉴于数据处理者并未对原始数据进行有价值的创造性贡献,法院或者直接拒绝保护,或者仅在被诉获取和使用行为威胁数据安全时提供有限的禁令救济,但数据处理者自始至终均无法获得损害赔偿,而衍生数据则可受到较为全面的保护。
因此,在三权分置的数据产权体系中,数据知识产权可能甚至应当有一席之地,其价值取向可较好地完成数据产品经营权的立法表达。特别是如果立法者决定对数据产品设置创造性要求,知识产权法审查授权方面的制度配置可提供完备的认知模型。其通过客体要件、审查模式、程序配置、救济方式等组合式制度安排,有效保障了授权前后各阶段利益相关者间的利益平衡,并以此实质降低审查结果的错误成本和权属不确定性所引发的市场交易担忧。当然,数据知识产权的具体权能设置已超出本文的行文范围。本文仅旨在论证登记对象的确定思路,并在必要限度内探究数据知识产权在数据产权体系中的可行定位。至此,数据知识产权登记的第二处前提论证即告完成。
(三)登记对象构成要件的具体确定
尽管学界对数据产权的登记对象是否限于衍生数据仍有观点分歧,但对试点省市立法文本的梳理表明,其对衍生数据的认识较为一致。试点省市登记办法中的“经过一定规则或算法处理”“实质性处理”“经过算法加工”均指向衍生数据,部分试点省市的起草说明更是已明确此点。衍生数据的要求实则暗含了实用价值和智力成果属性两个要件,经加工分析所得的数据产品自然具有商业价值且蕴含数据处理者的智力劳动。此外,试点省市对作为衍生数据处理素材的数据资源均施加了来源合法合规性要求,以尊重数据来源者的个人信息、隐私、商业秘密和知识产权等在先权益,相关法律法规已有明确规定且《数据二十条》亦着重提及,学界和司法实践对此已形成稳定共识。
试点省市分歧明显之处在于,是否应将登记对象限定为非公开数据。北京、山东和福建对此持肯定立场,其余四省市却并未作此要求,即同时允许登记公开数据和非公开数据。公开数据因承载着促进信息流动和共享的功能,因此亦有论者主张应当限制公开数据的保护。但本文认为,对公开数据的限制尚可,但应当允许其通过登记而受到数据知识产权保护,这契合赋权的正当性理论、有利于形塑数据行业的正向激励、与既有司法共识的立场吻合以及可确保登记办法本身的科学性。
首先,依据激励理论,知识产权的正当性在于解决因其保护对象的公共产品属性而引发的市场失灵问题。公共产品具有两项典型特征,即非竞争性和非排他性,这意味着信息成果一旦公开,若无法定排他权的配置,任何理性的使用人都会选择擅自盗用,而不会事先寻求许可,市场自发的调节机制由此陷入失灵状态。创新主体无法通过自然的市场领先时间以收回成本并获得合理利润,从而损害其继续从事创新活动的激励效应。为避免出现此种无效率的结果,法律赋予创造主体一定期限的排他权以排除他人未经授权的使用,并可通过市场的定价机制收回研发成本并获得合理利润,这意味着立法者人为地为其提供了市场领先时间。在此意义上,正是公开数据才具备公共产品特征进而更具产权保护的正当性,数据处理者反而对非公开数据具有事实上的排他力,对产权保护的依赖性相对较低,这也解释了为何部分主张赋权路径的学者明确将客体限定为公开数据集合。因此,将公开数据排除在数据知识产权的登记范围内,似欠缺产权正当性的理论基础。
其次,将登记对象限于非公开数据易引发数据控制者的策略行为。当前,数据行业在实践中主要依赖商业秘密保护其非公开数据,其对外许可时会通过严苛的合同保密条款维持数据的秘密状态,或者直接以提供服务的方式达到数据需求方的使用目的,而避免让其实际接触到数据。在此情形下,数据知识产权的配置实则赋予数据控制者在产权保护和商业秘密保护之间的选择权。简单的“成本—收益”分析表明,只有数据价值高于登记成本且低于保密成本,或者竞争对手实施反向工程所需时间小于数据知识产权的保护期限时,数据控制者才会选择登记其非公开数据。反之,其会继续依赖商业秘密的保护模式。鉴于非公开数据本身通常具有高价值、数据知识产权的试点保护期限仅为2~5年、竞争对手通过反向工程获取保密数据十分困难,数据控制者仅会策略性地登记那些价值不高的非公开数据,这会因降低制度效能而有违试点登记旨在提供正向激励的初衷。更有甚者,此举会迫使数据经营者采取更严苛的保密措施以防因数据公开而丧失产权保护的可能,徒增经营成本。与之相对,公开数据的控制者因担心他人的盗用而更有意愿去申请登记。考虑到只有高申请量才能确保积累足够的试点经验,在登记对象范围之内排除公开数据有悖于鼓励登记的制度初衷。
再次,允许公开数据的登记与既有司法共识的立场吻合,有利于降低数据行业的认知成本。在司法实践中,公开数据与非公开数据的区分在于数据控制者是否通过技术措施限制他人访问和获取其数据。二者的保护共性为:如果获取手段和方式不合法,则后续的使用行为亦不合法;就其个性而言,非公开数据的合法获取方式为获得事先授权,未经授权的获取和使用行为均不具有正当性。这种模式体现出法院对企业经营自主权的充分尊重。就公开数据而言,由于其具有促进信息共享的效应,为避免产生信息封闭和垄断,对于未采取技术措施限制复制和抓取的公开数据,司法实践对数据控制者施以容忍他人适度收集和使用的义务,但如果被告的使用行为超出必要范围,以至于实质替代了原告的数据产品或服务,那么被告对公开数据的获取和使用则具有不正当性。在此意义上,数据公开并不等同于数据的自由复制和利用,而整体排除公开数据的登记与司法共识相左。
最后,在登记办法本身的立法技术维度,将登记对象限定为非公开数据必须同时界定非公开性的判断标准。究竟采取类似于商业秘密的秘密性那般严苛标准,抑或是采取司法实践所承认的通过登录机制等技术措施限制访问的宽松标准,登记办法本身须加以明确界定。对此,《北京办法》和《山东办法》均未予表态,山东登记机关在政策解读中将“非公开性”限定为“数据的现有状态”,但依然未阐明具体的非公开程度和判断标准,这也从侧面说明清晰界定非公开性是一项苛求,毕竟行业实践中的限制访问措施有异,难以形成共识性的判断标准。
综上,数据知识产权的登记对象须为来源合法的衍生数据,其应同时准许公开数据和非公开数据的登记,而衍生数据实则暗含了实用价值和智力成果属性两项要件。
在审查模式方面,试点省市的分歧在于应当采取形式审查抑或实质审查。《山东办法》决定采取“形式审查+实质审查”的组合方案,这意味着登记平台仅对申请文件的完整性予以形式审查,而登记机构负责“对数据来源合法合规性及数据产品智力成果属性、实用属性进行实质审查”。公开报道显示,上海亦决定建立实质审查制度。相反,其余五省市均不约而同地仅选择登记机构的形式审查模式,主要关注申请材料的完整性和基本内容的属实性。本文认为,借鉴知识产权法上实质审查与形式审查的理论区分依据,数据知识产权有效率的审查方案为形式审查,这是由登记对象内在的高信息成本和多区别特征所决定的。
(一)知识产权法上审查模式的选择依据
在现行知识产权实定法中,信息成果的审查模式呈现为一项严苛程度递减的光谱:实质审查、形式审查和不予审查。发明专利和植物新品种须经严格的实质审查,集成电路布图设计则仅要求相对宽松的形式审查,著作权因自作品创作完成后自动产生而无须任何审查,但作品的自愿登记须经类似形式审查的核查程序。那么为何知识产权法会提供这些差异化的审查方案?这涉及知识产权的赋权模式选择理论。
以《巴黎公约》和《伯尔尼公约》为代表的国际公约体系,确立了创造性信息成果赋权的两极模式:专利权与著作权。传统观点认为,专利法仅保护具有技术功能的信息成果,而版权法则致力于为具有文学艺术美感的表达提供保护。然而,技术进步与产业变革不断挑战着传统“技术—艺术”二分理论。例如,其无法解释为何具有艺术美感的外观设计进入了专利法的保护视野,而功能性的计算机程序却成为著作权法的保护对象。传统理论解释力的不足倒逼学界探索新的解释路径,信息成本理论逐渐成为相对主流的解释工具。
依据信息成本理论,专利模式与版权模式的实质区别在于二者所保护对象的界权信息成本不同,版权作品的信息成本显著高于可专利性的技术方案。个中缘由在于,二者在创造主体、创造高度要求、创造限制、保护范围和保护期限等方面的差异,导致社会中既存作品的数量远多于既存技术方案的数量。此外,社会共识方面的区别也会导致二者界权信息成本的不同,毕竟技术语言具有相对稳定的字面含义,而作品的具体表达却可依不同场景作出相去甚远的解释。诸此原因导致界定新作品与既有作品区别的信息成本十分高昂,事先审查或者根本不可能实现,或者虽可实现但成本极高,因此版权法选择了侵权诉讼中的事后确权方案。与之相对,社会中既存技术方案的数量相对较少,界定新技术方案与既有技术方案区别的信息成本相对可控,这就使得事先审查成为可能,是故专利法接纳了实质审查制度。正是由于信息成本的不同,专利模式和版权模式在权利获得、权利范围、权利限制和侵权认定等方面体现出明显差异。
因此,界权对象信息成本的测量依赖于与在先信息成果的比较,以识别出可用以划定权利范围的创造性差异。有学者在借鉴专利法区别技术特征概念的基础上提出了“区别特征理论”,自此信息成本的高低与区别特征数量的多少建立起对应关系:信息成本越高,区别特征数量相应越多,赋权模式就更接近版权模式;相反,信息成本越低,区别特征数量相应越少,专利模式就更为可取。在信息成本理论与区别特征理论的合力下,非典型知识产权的赋权模式就呈现地较为清晰。
图1 信息成果赋权模式的选择
在我国知识产权实定法中,集成电路布图设计和植物新品种是仅有的两项排他性特殊权利的保护对象。正是由于信息成本和区别特征维度的差异,二者分别选择了版权模式和专利模式。集成电路因其可内置数百亿个纳米级制程的晶体管,元器件的互联方式和位置排布具有极大设计空间,其内在的信息成本非常高,相较于在先布图设计的区别特征数量非常多,因此其选择了著作权模式。但是,出于芯片产业的高价值且便于行政机关初步确立权利人身份的考量,布图设计法采取了形式审查制度,而未如著作权法那般放弃审查。相反,植物新品种则因其相对于既有品种的区别特征较少,内在的信息成本相应较低,这也使得事先审查的成本相对可控,是故植物品种权采纳了专利模式,立法者相应采取了事先实质审查的确权思路。
(二)数据知识产权审查模式的具体确定
在理解知识产权法对审查模式配置的法理依据后,数据知识产权的审查模式选择就较为清晰。由于数据集合的体量十分庞大且处于动态变化之中,单个企业控制的数据与其他企业的数据千差万别,这意味着数据具有极高信息成本和极多区别特征,事先实质审查授权的专利模式几乎无法实现,于是事后确权的版权模式自然成为应选项。这也解释了为何在前数据经济时代,比较法上诸多法域都选择通过版权模式保护数据库。例如,《欧盟数据库保护指令》采用了以版权模式为基础的特殊权利以保护无独创性的数据库,欧盟成员国为将其转化为国内法,多在坚持独创性标准的同时,将数据规定为邻接权的对象。而在该指令出台前,部分北欧国家曾通过降低独创性标准的高度将数据纳入作品的范围内为其提供版权保护。此外,或许源于对数据高信息成本的考量,我国主张对数据赋权保护的部分学者亦倾向于版权模式。因此,在版权模式的赋权思路下,数据知识产权的审查模式更宜采取形式审查,而非实质审查。
在此意义上,《山东办法》要求登记机构审查数据来源的合法合规性,这实则难以落地。由于申请登记的数据须满足来源合法合规的要件,这意味着该数据不得侵害他人的个人信息、隐私、商业秘密和知识产权等在先权益,但登记机构事实上无法逐项核实数据条目的合规性,毕竟其并无包含全部在先权益所指向对象的完美数据库。更为现实的方案为,在坚持形式审查的同时,要求申请人通过提交声明承诺书的方式,保证拟登记数据的真实性和合规性,并就声明保证的内容承担责任。如果第三人在后续的异议或撤销程序中主张数据虚假或不合规时,登记机构再通过比对申请人和第三人提供的证据以作出维持或撤销的决定。这种版权模式下的事后确权方案更具效率,因此仅关注申请材料完备性和基本内容属实性的形式审查便成为多数试点省市所选择的方案。
此外,《山东办法》中的实质审查对象还包括申请登记数据的智力成果属性和实用性,前者因欠缺具体审查标准而无法操作,后者则因审查标准相当宽松而无实质审查的必要。智力成果属性实则意味着登记机构要对衍生数据的创新增量进行审查,以判断其是否具备一定程度的创造性,这要求登记机构比对未经处理的原始数据或经预处理的数据集合和作为处理结果的衍生数据。尚且不论这种比对在技术和操作层面是否具有可行性,如果登记机构采取专利实质审查的操作方案,其需要选择一份与申请登记数据最接近的现有数据产品进行比对,但其在实然层面欠缺完备的数据库以筛选出可比对样本。即便可以如此行事,由于不同类型的数据资源经处理后可形成不同样态的数据产品,且针对同一数据资源采取不同的处理方式亦可得到差别明显的数据产品,此时并不存在统一的创造性评判标准。正是由于不同类型作品的独创性要求有异,著作权法并未规定独创性的统一评判尺度,亦放弃对其事先审查。在此意义上,智力成果属性仍被纳入审查的范围内,唯一可能的解释便是知识产权行政部门为强化其从事数据知识产权登记业务的正当性而选择如此行事。
至于实用价值,审查的标准在可预见的范围内会十分宽松,这导致其实际上会沦为形式要件。商业秘密法上的商业价值要件即为适例。在认定商业秘密的价值性时,法院认为原告付出实质金钱和时间等成本所得的信息无疑具有独立经济价值,极端情形下,即便原告并未实际生产出产品,而仅证明了特定研发方向的失败,这种信息亦具有经济价值,因为其可节省竞争对手的研发成本。循此思路,在数据控制者付出时间和成本收集和加工数据后,所得的数据产品自然具有竞争优势和商业价值。如果第三方希望获得该数据产品,往往需要付费或者独立分析数据,而这均需要付出成本。因此,登记对象的衍生数据属性实则暗含了实用价值要件,这导致后者实质审查的必要性或许难以成立。
产权制度的基石为权利客体、确权方式、权利内容、权利归属和权利限制,而为助其良性运转的其他制度安排均为配套制度,具体包括公示公告、异议处理、登记效力、续展和变更、撤回、注销和撤销等系列制度安排。受篇幅所限,本文仅选取实践中有分歧的公示制度和较为重要的登记效力展开分析。立法者在该等配套制度的设计方面应当同时秉持两种价值取向:第一,须与赋权模式相匹配,以减弱义务主体的净信息成本效应,这意味着登记机构必须承认独立处理例外、遵循实质性近似的侵权认定标准并限制公示的内容;第二,鼓励登记和促进数据的交易流通,这要求对登记机构施以保密义务且须明示登记的效力。
(一)版权赋权模式下的配套制度安排
前文的分析表明,数据知识产权的赋权宜采取版权模式,而该模式对应着特定的配套制度设计。在专利模式下,审查机关严格以权利要求书所记载的内容为依据界定保护范围,经事先实质审查后的技术方案须向社会完全公开,这意味着义务主体需相应承担较高程度的避让侵权义务。同时,由于义务主体往往为本领域技术人员,其对信息成本的容忍度也较高,因此专利模式要求创造者在从事创造行为时需逐一检索出在先技术方案以避让侵权,并排除了独立创造的侵权例外,在侵权认定标准方面亦遵循全要素规则。相反,版权模式则事先并未界定权利对象且未向社会公开,这导致作者在创作新作品时无法详尽检索出在先作品,其避让侵权的义务自然相应较低。而且版权体系内的义务主体并不限于同行业人员,其对信息成本的容忍度亦较低。为减弱其净信息成本效应,承认独立创作例外就成为版权法上有效率的制度安排,在侵权认定方面遵循实质性相似的判断标准也顺理成章。
既然数据知识产权的赋权方案选择了版权模式,采纳该模式下的配套制度自然具有效率。鉴于数据处理者通常并不知悉他人所拥有的数据内容,其在从事数据处理时无法做到事先避让侵权,在借鉴著作权法的基础上承认独立处理例外,自然成为降低其信息成本的制度工具。与之相应,实质性相似就应当成为侵权的判断标准。在实践中,由于数据的体量较大,经独立加工分析所得的数据与他人数据构成实质性相似的可能性虽然较低,但并不能完全排除。例如,据相关登记平台反馈,中国移动与中国联通针对同部分客户群体所收集的数据资源就具备实质近似性,二者针对该等数据进行分析加工后所得的衍生数据也很可能十分相似。在此情形下,登记机构绝不能以在后申请登记的数据与在先已登记数据构成实质性相似为由,拒绝在后数据的登记申请。
至于数据知识产权的公开范围,登记机构仅须公示相关基本信息即可,而无须公开已登记数据的实体内容,且无须规定公众查阅权。其实,无论在赋权方案方面抑或是审查模式方面,数据知识产权与集成电路布图设计权十分相似,后者的公示内容可为前者提供参考依据。集成电路布图设计在授权后,国家知识产权局仅会公示设计名称、权利人、创作人、登记号、申请日和创作完成日等基本内容。与之相应,部分试点省市亦仅选择公开登记申请号、申请日期、申请人、数据名称、应用场景和数据处理规则简要说明等基本信息,这契合赋权模式和审查方案的内在法理,值得肯定。
但是,登记办法不宜规定公众的查阅权。虽然《集成电路布图设计保护条例实施细则》第39条规定公众可至国家知识产权局现场查阅已登记布图设计的复制件和图样的纸件,但其背后的原因在于,通过反向工程提取布图设计的技术难度较低,且芯片行业具有典型的累积创新特点,在后设计较为依赖在先设计进行推进式创新。但与此相反,通过反向工程获取非公开数据几乎难以实现,且数据行业并不具有累积创新的典型特征,何况当下数据企业因担心泄密以致登记意愿并不高,因此并无必要规定公众的查阅权。在此意义上,浙江、北京和广东允许任何单位或个人通过登记机构查阅已公告数据知识产权的内容,似欠缺合理性。
与此相反,江苏则仅允许申请人和权利人查阅包括数据内容在内的登记信息,这实则排除了其他主体查阅已登记数据基本信息的可能。山东和深圳的做法值得提倡,其虽规定任何主体均可查阅已登记数据的信息,但却将查阅范围严格限定在申请人和数据集合名称等基本信息,而不包括已登记数据实体内容。遗憾的是,二者并未明确规定登记机构的保密义务。因此,限定公开和查阅范围与设置保密义务的组合式方案更契合法理且有助于实现鼓励登记的制度初衷。
(二)促进数据交易流通下的配套制度设计
我国决策层旨在通过确权的方式促进数据要素的交易流通,而客体明确与产权清晰是数据交易流通的前提。在初始确权完成后,数据的可转让性就扮演着连接登记制度效率与数据市场的桥梁式角色。这意味着立法者需审慎地规定数据知识产权的登记效果,具体包括权利获得和权利变动两方面。对此,学界目前主要提供了两种方案,即整体论和区分论。前者认为,数据产权的产生、变更、转让和消灭均应采登记生效主义,未经登记不发生权利获得和变动效果;后者则认为,数据产权的产生应采登记对抗主义,未经登记的权利可产生但不得对抗善意第三人,但其变更和转让则以登记为生效要件。然而,本文认为,整体论更为可取,这是由数据知识产权登记的低审查错误成本和促进数据交易流通的价值取向所决定的。
知识产权法上审查授权的法律效果为权利自登记之日起生效,专利权、商标权、集成电路布图设计权和植物品种权等概莫能外。为降低审查结果的错误成本,知识产权法专门配置了授权前的公告和异议程序以及授权后的撤销和无效程序,据此利害关系人在授权前后均可纠正行政机关的审查错误。尽管审查模式的不同会导致权利稳定性的鲜明差异,但知识产权的市场响应度却并未因部分权利被无效而呈现出明显的负面效应。在试点省市已规定授权前的公告和异议以及授权后的撤销程序之前提下,数据知识产权登记的法律效果采登记生效主义,并不会造成显著的错误成本。此外,登记生效主义可引导数据企业积极采用数据流通的标准规则,以促进数据的场内交易。
有观点认为,由于数据实时变化,登记生效主义会给数据控制者带来过高的申请负担,因此应采登记对抗主义。该担忧虽具有合理性,但在本文语境下可能难以成立。纵然原始数据会因用户行为痕迹和客观事实信息的实时收集而处于动态变化中,但本文主张登记对象仅限于衍生数据,通常只有作为分析素材的原始数据和相应的算法处理规则发生重要变化时,才会导致数据产品出现实质不同,进而产生变更登记的必要。换言之,只有原数据产品发生实质性变化时才能形成新数据产品。因此,数据知识产权的保护对象通常会呈现出阶段性变化,而非实时变化,这也解释了为何部分试点省市要求数据来源、处理规则、数据格式和更新频次等重要事项发生变化时,才须提请变更登记。
至于登记后的权利变动,基于促进数据交易和流通的考量,必须优位保护第三人利益。公信力的内涵实则为国家机关对权利归属和内容的背书,以保护善意第三人的信赖。与登记对抗主义相比,登记生效主义更有利于保护交易安全,交易主体可通过查询登记簿的方式确认权利归属,以解决交易中的信息不对称问题,登记机构开放网络查询,还可显著降低交易主体核实权利归属的信息成本。此外,登记生效的要求亦可激励交易主体在交易完成后尽快提请变更登记,这对数据知识产权的行政管理具有正外部性。如果数据交易所与数据知识产权登记平台进行数据共享,权利变更登记申请可以在交易完成时自动提交,这种快捷方式能够实质节省交易成本和登记成本。
数据知识产权科学理想化的立法进程为,在实体法就权利客体、权利获得方式、权利内容、权利归属和权利限制等基础制度作出明确安排的前提下,再通过制定具体的登记办法以促进产权制度的高效运行。因此,数据知识产权登记本应处于数据产权体系中相对边缘的位置,但却因中央立法的缺失和当前地方试点的批次性立法颇受关注。职是之故,本文立足于纠偏立场尝试对登记对象、审查模式和部分配套制度,作出符合法理的制度安排,以尽可能地降低制度设计和运行的错误成本,亦可为决策者在将来制定中央层面的立法时提供借鉴。在此意义上,澄清数据知识产权登记制度设计的底层逻辑,对积累有价值的先行先试经验裨益良多。决策者在遵循本文所揭示的制度构造依据之基础上,可起草科学合理的登记办法,从而更好地实现试点登记效果。
《华东政法大学学报》由华东政法大学主办,现为“中国法学核心科研评价来源期刊(CLSCI)”“中文社会科学引文索引(CSSCI)来源期刊”“中文法律类核心期刊”和“中国人文社会科学法学专业核心期刊”,先后获评“全国高校社科精品期刊”“全国优秀社科学报”“华东地区优秀期刊”和“上海市最佳学报”。
1. 私有智库:单篇对话与向量检索的智能融合
-END-
责任编辑 | 郭晴晴
审核人员 | 张文硕 范阿辉
本文声明 | 本文章仅限学习交流使用,如遇侵权,我们会及时删除。本文章不代表北大法律信息网(北大法宝)和北京北大英华科技有限公司的法律意见或对相关法规/案件/事件等的解读。
关注下方公众号,获取更多法律信息