调研|论大数据、人工智能的知识产权法律
时间:2020-07-02 19:26

  编者按:2019年,贵州省委办组织开展了全面深化重大问题调研,并首次面向社会公开征集调研。贵州高院课题组调研获2019年贵州省委全面深化重大问题优秀调研委托类三等。

  随着智能信息技术的不断发展,大数据产业为人类创造出了新的经济利益和商业价值,但随着智能信息技术的不断深入和创新,数据呈现出日益庞大、类型愈加复杂的趋势。2015年9月,国务院印发了《促进大数据发展行动纲要》,力图全面推进大数据的发展和应用,将我国建设成为数据强国。目前,我国的大数据和人工智能在快速发展的同时,面临着一系列知识产权法律的问题,本文试图研究大数据、人工智能遇到的知识产权法律问题,提出一些行之有效的措施和,以有效地大数据、人工智能的知识产权,促进大数据产业和人工智能更好更快地发展。

  “大数据”这个名词最早出现于《第三次浪潮》一书中,该书的作者阿尔文托夫勒称之为“第三次浪潮的华彩乐章”。美国咨询公司麦肯锡全球研究所(MGI)在其报告中认为“大数据”是指无法在一定时间内用传统数据库软件工具对之进行抓取、管理和处理的数据集合。中国计算机学会大数据专家委员会委员赵国栋认为大数据是在多样或者大量数据中迅速获取信息的能力。目前学界对“大数据”的概念莫衷一是,笔者倾向于《贵州省大数据发展应用促进条例》对“大数据”所下的定义,即“本条例所称大数据,是指以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,是对数量巨大、来源分散、格式多样的数据,进行采集、存储和关联分析,发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态”。

  “人工智能”一词由美国科学家麦卡锡(McCarthy)在1956年首次提出后,国内外对“人工智能”的定义并未达成共识。人工智能促进协会将人工智能定义为“对思想和智能行为的基础机制的科学理解及其在机器中的体现”。计算机科学教授亚伦所罗门认为,“人工智能是与科技和工程密切相关的跨学科领域,其科技部分试图给人类、动物、信息处理机器以及机器人提供各种各样的智能要求和可行的机制,其工程部分试图将这些知识应用于设计实用的新型机器并帮助我们更有效地处理天然的智力活动”。笔者将“人工智能”定义为:人工智能是指研究人类智能活动的规律,模拟、扩展、延伸人的智能的科学技术。

  1.体量大(Volume)。大数据的首要特征体现为“大”,即由许多数据汇集而成。随着科技的进步,数据的存储单位从过去的GB到TB,乃至现在的PB、EB级别。

  2.多样性(Variety)。当今世界,数据的来源十分广泛,决定了大数据的形式具有多样性,大数据的形式表现为视频、图片、网络日志、地理信息,等等。

  3.价值性(Value)。大数据的核心特征是价值性。在现实生活中,有价值的数据比较少。大数据的价值在于从大量的数据中,挖掘出有价值的数据,并进行深度分析,从而发现一些新规律,获取一些新知识,并运用于各个领域,最终达到推进社会治理、提高生产力的效果。

  4.高速性(Velocity)。与传统数据不同的是,“大数据”的产生和处理速度更快,难以用传统数据库的处理模式进行收集、管理、存储。大数据对处理速度的要求非常严格,服务器中大量的资源用于处理和计算数据,许多平台都需要做到实时分析。

  经过60多年的演进,在互联网、大数据等新理论新技术以及经济社会发展强烈需求的共同驱动下,人工智能技术加速发展。笔者认为,人工智能具有以下几大特征:一是一种大数据驱动的知识学习技术;二是能够实现跨的认知、学习、推理;三是人机、脑机相互协同和融合;四是能够自主操控,无须人类操控;五是能进行智能的信息检索,获取人类无法获得的一些信息,并且将信息获取工作做到精细优质。

  由于数据属于事实,不是由大众创作出来的,而且不是具有独创性的作品,故“大数据”本身不具有独创性,不受《著作权法》,但是对“大数据”的内容进行独创性的选择或编排后,形成具有独创性的数据库,即“大数据”汇编作品,则可以获得《著作权法》的。在一些国际条约中,明确对构成汇编作品的数据库给予。例如《世界知识产权组织版权条约》第5条明确:“数据的汇编,无论采用任何形式,只要其内容的选择或排列构成智力创作,即受到。这种不延及数据本身,也不损害汇编中的数据已存在的版权。”因此,具有独创性的数据汇编作品才能受到《著作权法》的。

  根据《著作权法》的,《著作权法》的是大数据汇编作品所呈现的选择或编排方式,而不是其中的作品或者其他不构成作品的材料。但是,就“大数据”而言,“大数据”编排形式的商业价值并不高,真正具有商业价值的是“大数据”本身以及对“大数据”进行选择或编排后形成的汇编作品。如今,许多行业对大数据的选择或编排趋于标准化,如果仅仅按照是否具有独创性来判断“大数据”汇编作品能否受到《著作权法》的,将导致具有重大商业价值的“大数据”本身无法得到《著作权法》的。

  从司法实践上看,对数据库的危害主要来自于对其内容的非法复制、制作以及与其进行竞争的数据库的搭便车行为,即不正当竞争行为。《反不正当竞争法》是对《著作权法》进行补充的一部法律,它对数据库进行了进一步的。对于不构成汇编作品的数据库,《反不正当竞争法》也可对智力投入进行。鉴于制作人对数据库投入了大量的物力和财力,只要竞争对手非法复制或窃取了该数据库中的有关数据,就可以认定竞争对手的行为违反了《反不正当竞争法》的公平、诚实信用原则,构成该法所称的不正当竞争行为。如果数据库符合商业秘密的特征,也可作为商业秘密予以。

  当经营者之间没有竞争关系时,即使一方直接提取“大数据”汇编作品中的数据去制作相同或者相近的数据,该“大数据”汇编作品的经营者也无法适用《反不正当竞争法》,而且我国是以举例加概括的方式对不正当竞争行为进行界定,大多数时候,通过原则性条款来界定不正当竞争行为会导致极大的不可预见性,大都根据个案予以解释和判断,这无疑让“大数据”汇编作品的作者很难预见自己的能否得到,故通过《反不正当竞争法》“大数据”汇编作品的实质内容具有很大的不确定性。

  人工智能的实质是“让机器从事需要人的智能工作”。在机器人创作的作品中,机器人能否像人一样成为作者?在传统的观点中,往往认为人工智能的创造物不具有独创性,仅仅是再一次将计算机内所存储的内容进行汇编整理而已。随着人工智能的快速发展,机器人拥有的智能越来越强大,机器人与自然人的差别将会逐渐缩小。近年来,人工智能的一些专家在模拟人脑思维方面取得了重大进展,他们为机器人建设了大量的神经元,帮助机器人完成深度学习、模拟思考等行为,甚至表现出比人脑更强大的创造力。因此,机器人能否成为作者引发了学界的大讨论,许多学者对此莫衷一是。纵观目前的知识产权法,只对人类的智力予以,至于机器人所创作的作品,却不构成《著作权法》所称的作品,以至于无法受到《著作权法》的。我国《著作权法》第十一条第二款:“创作作品的是作者。”《著作权法》显然将自然人定位为作者,从而排除了机器人作为创作主体的可能性。

  我国的《专利法》没有对人工智能的创造物进行。我国的《专利法》第二十六条:“申请发明或者实用新型专利的,应当提交请求书、说明书及其摘要和要求书等文件。请求书应当写明发明或者实用新型的名称,发明人的姓名,申请人姓名或者名称、地址,以及其他事项。”该条文中所说的发明人是自然人,享有民事和义务的法人也不能成为发明人。因此,按照我国《专利法》的,人工智能的创造物不能受到《专利法》的。

  由于海量数据的存储和复制,人工智能的运用多借助于互联网的分发和获得,在此过程中存在包括提供电信接入服务、支付服务、浏览器服务、内容服务和平台服务等多个环节,围绕不同时期和环节形成数据,企业间争夺产权将会形成争议,而且企业的商业模式和广告分成也将受到影响,甚至可能存在伪造数据的情况。对大数据、人工智能的知识产权法律,应当遵循如下原则。

  人本法律观是相对于神本法律观发展起来的,无论是科技还是法律,其发展和完善都应当为人类服务,脱离了这个本质,就会损害到人类自身整体的利益。

  法律是因人而生,因人而存的。大数据的发展和完善应当遵循基本人类的、平等、安全、价值,促进社会的福祉发展,在数据采集和人工智能使用的过程中,对于涉及个人隐私、信息安全方面信息的数据应当采取一定的措施,必要时可以对大数据行业进行立法规范,设置一定的行业准入门槛,防止数据采集和人工智能运用过程中损害个人、、隐私等信息。

  大数据企业存在不同的样态,不同的主体对于数据的兴趣和癖好也不一样,初始采集过程中,企业对于原始数据收集往往是兼收并蓄,尽可能多地收集各类数据,但是往往有些数据涉及信息,如个人的账户、密码、身份,等等,如果这类数据被买卖,将会造成难以估量的后果,对于这类涉及特定的信息,应当慎重采集,采集后还应对数据信息进行脱敏处理。将个人信息进行大规模交易,可能会涉及刑事责任。从法律层面来说,应当加大对数据采集的必要性管理,对于特定信息收集、存储和使用。采集和使用的环节应当进行隔离,在企业间,企业各个部门之间对信息进行必要的分离管理,采集和使用应当分开进行,这样有利于明确责任主体。建立采集和隔离使用的原则,一方面有利于特定主体的隐私、商业秘密,另一方面能有效地预防犯罪,防止出现信息泄露的恶性事件。

  大数据基本形成或存储于服务器或者云端上,有些企业的数据是原始状态存储的,有些企业则是采取模型式存储,传输和存储环节存在不完善的地方,可以为其他企业抓取。在互联网下,即便数据已经逐步完善,如通过https的方式加密传输,但是由于分享和的需要,他人仍然可以接触并加以破解,会导致数据外泄。在企业竞争过程中,可能存在各种矛盾,但竞争对手之间应当避免对于大数据的计算结果采取过度解读,从而形成对某一特定企业的恶意解读,损害企业的权益,即便这种解读是客观真实的,竞争企业间也应当避免类似情形。企业之间通过网络协议,或者通过线下方式单独订立协议,对于加密或者的数据及数据统计结论,应当采取合理避让的方式,在竞争对手之间避免出现恶性竞争,防止利用大数据做出对竞争对手的侵权。

  在数据采集、数据挖掘和数据交易等环节,数据本身并不产生价值,而是基于其二次开发和深度加工形成的分析报告存在显著价值,虽然有些公司了数据接口,但并不意味着可以任意取用,需遵守一定的协议。对于数据的应当遵守利益平衡的原则,特别是对于公共利益的,要使知识产权人的利益和社会的利益始终保持一种平衡。在数据的生产交易环节加强,通过适当的知识产权方式方法创新。采集时,应当平衡用户利益和平台利益。数据采集者和用户之间是对立统一体,采集者也可以根据用户的癖好和习惯向用户推荐更多关心的信息,方便用户快捷精准获得资源。加工时,应当平衡数据采集者和数据中介服务机构之间的利益,对于数据的整理、存储、挖掘,也应该平衡各方利益,对于安全的需求、统一性的需求和便利性的需求,各方应当在数据加工时遵循一定的规范,按照行业或者国家标准来进行。数据交易时,还应当防止各种数据,包括涉及商业秘密、个人隐私或者其他涉及法律权益的数据在市面流通,为交易双方提供公平的市场。

  大数据本质上是一个数据拼图,尽管它是的,如果企业将大数据作为企业经营的版图,引起行业恶性竞争或者数据垄断,必然损害整体的数据行业发展,进而损害到社会公共利益。大数据的垄断与大数据的本质背道而驰,最终毁掉的是大数据的价值。

  1.鼓励企业将其经营的数据在脱敏以后加工进行交易,则会促进行业的整体发展,甚至于可以免费进行分享,但是这种机制必须在一定的安全机制下进行。

  2.对于传统企业来说,大量的运营信息可数据化及数据化采集、挖掘和使用将会是未来的行业发展重点,有价值的数据将会被逐步垄断,导致需方和售方博弈,在一定时期内,完成数据化将会导致技术、人才竞争的加剧。

  3.数据版图之争成为下一个纠纷的热点,围绕传统行业数据加工、挖掘和新兴市场主体的数据采集都会引发激烈的竞争。整体互联网法依赖于分享机制的形成,公开的技术分享将会大大促进行业整体进步。

  人工智能实际上就是一种机器模仿人类智力活动的技术。人工智能容易引理困境,如前文所述,技术虽然具有中立性,但是使用技术的人却具有一定的意图,对于人工智能模仿人类的活动所产生的法律效果缺乏评估的情况下,还是应当慎重认定法律行为和法律责任。从本质上来说,人工智能所遵循的是设备预先内置的逻辑思维能力,也就意味着这种规则是由人类创作的,而人类使用人工智能进行二次学习的过程中会产生下一阶段的活动,但由于无法预先评估机器在学习后会具备哪些能力,如果不加以评估,将会导致产生法律问题。例如高速行驶的无人智能汽车,在极端情况下,可能要面临着乘车人或行人的问题,具体决策都是根据计算机自动识别和评估来完成的,如果通过事先预置的智能系统进行决策,将会导致灾难性后果,甚至开发者需承担刑事责任,但如果将这种情形下的决策权移交给驾驶者,就能相对缓解法律伦理困境。

  大数据案件近年来逐步增多,与以往的涉互联网案件存在显著不同,以往案件多以“信息”为载体,而大数据模式下以“全息”为载体。采用全息的度、多样态来解读数据,在数据采集、数据分析和数据产权、数据等问题上争议非常复杂,可通过提炼一定规则方法,希望能够在大数据、工人智能起步阶段,有助于产业健康发展,培育和净化市场,促进社会创新的氛围。

  我国的大数据、人工智能产业的发展潜力很大,蕴含着巨大的经济价值。由于现有的知识产权法律机制不够完善,难以为大数据、人工智能产业的发展保驾护航。为了我国大数据、人工智能产业的快速健康发展,完善大数据、人工智能知识产权法律机制迫在眉睫。

  对大数据进行收集、选择或编排是对其进行分析利用的前提。虽然对大数据进行选择或编排后形成的作品不一定具有独创性,但是《著作权法》应当明确大数据汇编作品的“独创性”标准,以便更好地大数据汇编作品的著作权。衡量大数据汇编作品是否符合《著作权法》所要求的选择或编排的独创性要求,可以从以下内容考虑:如果大数据的获取、选择和编排是由汇编者完成,而非运用既定规则或规律的计算方法完成甚至抄袭完成,而且汇编者进行了主观上的权衡和判断,体现了汇编者的聪明才智,达到一定的智力创造高度,则这类汇编作品通常具有独创性。如果只是根据时间、字母排序等选择数据后汇编成作品,则不具有独创性,不能获得《著作权法》的。

  1995年,欧盟部长理事会通过了《关于数据库法律的指令》(以下简称《数据库指令》),另辟蹊径地对不构成作品、但是进行过实质性投资的数据库给予特殊,并对之做出相应的法律。《数据库指令》的第七条第一款:“在数据库内容的获取或选用方面,经定性或定量后,各国应对做出实质性投入的数据制作者赋予一种,即防止对数据库内容的全部或实质部分进行撷取或反复利用的。”《数据库指令》数据库特殊的期限为15年。我国可以仿效欧盟部长理事会颁布的《数据库指令》,对不构成作品但是进行了实质性投资的数据库给予特殊,以数据库投资人的利益。

  人类作品自完成之时就产生著作权,自动受到《著作权法》的,但是在现实生活中,对人工智能创作作品的独创性要求更高,而且必须经过著作权登记后才享有著作权。一方面,实行著作权登记制度可以有效人工智能创作物人的利益。如果人工智能作品不进行著作权登记,就会很容易被他人侵权。另一方面,通过著作权登记后,把原创性低的人工智能作品排除在外,以确保作品的质量。此外,人们可以通过购买一些人工智能作品的著作权,在其基础上进行第二次创作,从而创作出更高水平的作品,促进文化市场更加的繁荣。

  作品必须具有独创性。笔者认为,如果机器人完成一部作品,而且具有独创性,就应该受到《著作权法》的。虽然机器人创作的作品具有著作权,但是机器人并不能像自然人一样行使著作权。因此,机器人作品的著作权应由机器人的主人享有。这是因为,机器人是机器而不是“人”,它是依靠数据和算法而完成写作,该机器人以及其写作的技术径无一不是人类创制。在这种情况下,可参照《著作权法》关于职务作品或雇佣作品的有关,在《著作权法》中增设法律条文,机器人作品的著作权归属于机器人的主人,而不是机器人。