清华数据生态治理最新研究:促进数据流通共享和多层次市场体系

中新经纬3月12日电 (薛宇飞)近日,由清华大学社会科学学院经济学研究所主办的“人工智能时代数据生态治理研究课题成果发布研讨会”在北京举行。来自国家行政学院、清华大学、中国人民大学、北京师范大学、中国政法大学、中央财经大学、北京航空航天大学、同济大学、首都经济贸易大学的十几位专家、学者,围绕数据确权、数据互联互通、数据要素市场、数据生态体系等多方面问题展开深入讨论。

研讨会上,清华大学社会科学学院经济所副所长、教授戎珂及其研究团队发布了《人工智能时代数据生态治理研究》(下称报告)。据清华大学社科学院经济所所长汤珂介绍,此次报告是该所数字经济系列报告重要成果之一。

数据所有权和用益权分立

《人工智能时代数据生态治理研究》报告。来源:受访者供图

报告梳理了数据、人工智能、数据要素等相关概念,并提出数据生态、数据生态治理概念。在数据生态治理中,数据确权是数据流通和交易的基础,对数据市场健康发展至关重要。

对于数据如何确权,报告认为数据使用应当坚持两权分立的模式,其中用户等数据原发者拥有数据所有权,平台等数据处理者通过原发者的授权等方式拥有数据用益权。用户授权平台在保证其个人隐私不被泄露和滥用的情况下使用其数据,不同平台所掌握的用户数据在量级方面虽然有所差异,但在享有数据用益权方面应当是平等的——只要获得用户授权。

“人工智能时代数据生态治理研究课题成果发布研讨会”在北京举行。来源:受访者供图

报告称,平台需要对数据进行分类分级管理,数据分类分级授权制度有助于从源头上解决数据权属问题。数据所有权与数据用益权二元分立的方法,充分发挥数据要素的非竞争性、规模报酬递增等特征,在此基础上建立配套的法律法规和行业标准,促进数据要素交易、流通。另外,这种确权方式明确了数据收集者的数据用益权,并对数据的隐私保护、流通和交易提供了法律依据。

清华大学法学院院长申卫星。来源:受访者供图

清华大学法学院院长申卫星就报告观点评价道,数据所有权与数据用益权二元分立的确权方式,符合经济学中帕累托改进原则,用户授权平台在保证其个人隐私不被泄露和滥用的情况下使用其数据,平台享受数据用益权,用户也能获得平台因为使用大量用户数据而带来的部分收益或更好的智能化服务。按这种方式对个人数据进行确权是可行的,能够充分发挥数据要素的非竞争性、规模报酬递增等特征,可在此基础上建立配套的法律法规和行业标准,促进数据要素交易与流通。另外,按这种确权方式对依赖数据进行运营的互联网企业和平台型公司几乎没有影响,反而明确了这些公司享有数据用益权,并且对数据的隐私保护、流通及交易提供法律依据。

清华大学社科学院经济所副教授谢丹夏以视频方式参加研讨会。来源:受访者供图

研讨会上,多位专家都认同数据确权的重要性。清华大学社科学院经济所副教授谢丹夏称,如果没有明确数据的权属,就会对数据流通、市场交易等产生很大障碍。数据要素已经与劳动、土地、资本、知识一道,成为五大生产要素。

北京师范大学互联网发展研究院院长助理吴沈括称,作为凝结在数据之上的劳动价值——数据产品,如何给它确权是一个迫在眉睫的问题,“如果没有确权的话,行为红线如何处理,安全责任如何分配,大家对于这些都存在一些关切与担忧。”

中国人民大学法学院副教授熊丙万。来源:受访者供图

中国人民大学法学院副教授熊丙万表示,“这是关于数据要不要确权的大问题,目前法学界的共识度总体上比较高,就是要确权。”他继续解释称,一个理想的方案应该是能够系统承载数据之上多元主体的多重权利主张,协调相互之间的关系,最好并行不悖。

就应当怎样合理确权、确定什么样的权利,中国政法大学法治政府研究院院长、教授赵鹏阐释了自己的研究观点。他认为,无论从法理层面,还是从实际的竞争政策层面出发,设定数据财产权都有不小的障碍。从法律角度来看,财产权是一种对世权,针对所有人,不区分场景,不仅仅限于合同双方。“如果仅仅为了支撑大规模的数据交易而确认数据财产权,还缺乏法理的支撑。”

赵鹏继续指出,即使已经承认的财产性权利,其保护边界也有一个因竞争要求而适度调整的问题,数据集中引发的限制竞争问题已经越发明显,如果还通过法律来创制数据财产权,可能和竞争政策取向是背道而驰的,因为这种权利很可能加剧平台垄断、封闭的趋势。

建立数据可迁移和互操作规则,推动数据要素流转共享

报告认为,由于数据权属不够清晰,部分互联网平台存在滥采个人数据、设置数据流通壁垒、实施数据垄断、进行“平台二选一”等破坏市场秩序的行为,这些行为不仅侵害消费者权益,还阻碍数据市场和数字经济的健康发展。

那数据如何实现标准化?如何在多主体、多平台之间互联互通?小企业和大企业之间,大企业与大企业之间,平台与平台之间,是否鼓励不敏感的公开数据跨平台高效流动?政府数据与企业数据之间是否要互联互通?报告认为,数据的非竞争性以及规模报酬递增性导致了互联互通是数据要素市场化的本质要求,只有互联互通才能产生更大的价值。

北京航空航天大学法学院助理教授、工业和信息化法治战略与管理重点实验室办公室主任赵精武。来源:受访者供图

北京航空航天大学法学院助理教授、工业和信息化法治战略与管理重点实验室办公室主任赵精武认为,目前的互联互通政策,还是以开放链接为主,超级平台自我优待问题没有得到很好地解决。平台之间的屏蔽与封杀,会是整个互联网数据市场治理最重要的一个问题。

部分大型平台会借助自身的优势进行自我优待,来封杀生态系统之外的中小企业,这对整个市场经济秩序的破坏性较大,甚至会导致中小企业失去各种发展的可能。他认为,平台之间的屏蔽阻断了用户之间的共享,增加了用户使用的各种成本,限制了用户选择权,最终将损害消费者的合法权益。

“数据生态治理的重要一环是要强化反垄断监管,反垄断治理需要跟行业自律、行政指导有机互补,下一步数据生态治理应当与反垄断立法、执法紧密配合。”赵精武建议,在修改反垄断法之外,可以出台相应的“平台法”,以解决数据互联互通领域里的超级平台自我优待问题,让平台经济回到正常的法治轨道。

中央财经大学经济学院副教授、中国互联网经济研究院研究员徐翔。来源:受访者供图

中央财经大学经济学院副教授、中国互联网经济研究院研究员徐翔认为,在数据开放上,政府部门之间、企业之间的数据不能互通,是因为存在使用标准、编辑方式、基础性技术不同等问题。因此,未来不仅要实现技术标准化,还要构建数据生态的标准化模型,实现数据的互联互通。数据分级分类制度,会是一个很好的开始。

关于数据的互联互通,申卫星称,报告提出的“个人享有数据所有权,平台拥有数据用益权”,这些权利是否需要限制也得思考,“一旦承认绝对权,可能排斥其他平台对数据的使用,当然用户可以通过再授权、许可,让其他平台获取数据,但是这样就重复劳动了。已有平台的用益权,是否应构成数据壁垒?在数字经济时代,数据用益权肯定要受到一定限制,但是限制的理由是什么?限制到什么程度?这些问题都需要考量,因为这对数据生态至关重要。”

吴沈括认为,针对数据流转共享过程中一系列瓶颈因素,需要通过设计共享、访问制度,制定保障数据可迁移和互操作性的规则,推动数据要素和资源流转,促进价值倍增和数字经济发展。

清华大学社会科学学院经济所副所长、教授、博士生导师戎珂。来源:受访者供图

戎珂团队表示,增强用户数据的可携带性和平台间的互操作性是平台互联互通、共创价值的核心要求,也是互联网反垄断的最新趋势,因此,需要探索建立平台间的有效连接,提高数据互操作性,并建立开放生态系统。对此,《个人信息保护法》首次规定个人信息可携带权,“个人请求将个人信息转移至其指定的个人信息处理者,符合国家网信部门规定条件的,个人信息处理者应当提供转移的途径”。

构建多层次多样化的数据市场体系

报告提出,数据分类分级授权是实现数据确权的重要途径,能够让数字平台直接通过用户的自主授权或市场化的授权协议,合理合法地收集使用数据,如用户头像、昵称等个人公开数据经用户授权后可以跨平台流动,从而降低数据要素市场的交易成本。为了更好地匹配数据确权的需求,报告建议从数据的负外部性(敏感程度)以及正外部性(数据流转可市场化授权程度)等特征设计分类分级的数据授权体系,构建“多层次、多样化”的数据市场体系,促进数据所有权和用益权二元分离,保护数据安全和个人隐私,推动数据要素和产品顺畅流通,满足数据流通或交易的多样化需求。

报告提出,基于数据市场体系的基本逻辑和原则,从交易内容和交易模式两大维度出发,打造“多层次、多样化”的数据市场交易体系,鼓励场内交易,规范场外交易。一方面,在交易内容维度,拓展目前已有的两级市场体系,建立多层次数据市场,具体包括三级:第一级市场主要指数据资源市场,解决原始数据授权等问题;第二级市场主要指数据要素市场,数据要素指的是参与到社会生产经营活动、产生经济效益、以电子方式记录的数据;第三级市场主要指数据产品和服务市场。

另一方面,在交易模式维度,由于数据的交易模式受应用场景、买方异质性的影响较大,应该建立多种数据交易模式,具体应该包括三种:第一种交易模式是场内集中交易模式,即通过数据交易所、交易中心等平台进行数据集中交易。此处的“场内”并非仅限于交易所,而是指包括交易所、交易中心等在内的由政府主导、可监管可溯源的集中交易平台。第二种交易模式是场外分布交易模式,即在集中交易平台外进行数据分散交易。第三种交易模式是场外数据平台交易模式,即通过数据平台进行多方数据交易。

同济大学经管学院副研究员周迪认为,“有必要设计分级分类的数据授权机制,以达成不同场景不同层次下数据的权属共识。”周迪指出,在数据分级分类授权的思路下,用户不再需要考虑数据衍生的具体权利有哪些,只需考虑数据能在何种程度上进入数字平台的生产活动之中即可。数据分级分类授权机制可以推动数据快速进入数字经济的生产活动之中,不仅让平台企业对数据的获取和利用变得合理合法,也能减少数据的交易成本。

长江学者、清华大学电子工程系副教授李勇。来源:受访者供图

研讨会上,长江学者、清华大学电子工程系副教授李勇称,将数据市场体系分为三个阶段或市场是非常好的,这与它们在技术上的方案是一脉相承的。要实现数据变现或数据产业化,其实非常难,因此,把原始数据变成数据要素,数据要素再变成数据产品,在工程上就是解耦的方程。

李勇同时提醒:“我比较关心的是数据分级分类制度建立后,会给经济学带来什么新问题。从技术上来说是比较好的。但技术上做出来能不能用,还是取决于经济因素、社会因素。”

对于经济成本问题,戎珂解释道,数据分类分级授权制度有助于从源头上解决数据权属问题。如果数据权属不清,会导致后续交易成本越来越大。“目前可能有一个误区,即有些人认为源头上解决问题太麻烦,索性就不解决,但是源头上不解决,后边都会存在一些‘原罪’的问题。所以我们认为一开始的基于数据来源方的授权非常关键。”戎珂表示。

徐翔认为,报告提出的三级市场概念,基本将中国当前数字经济所需的数据完整概括起来,是具有特色的数字经济理论创新。

戎珂分析称:“我们认为,未来数据市场总体趋势是向第三级市场演化。未来可能会出现更多的数据产品交易,同时会出现更多的数据服务交易。但是数据的0-1,就是授权过程,会永远存在,它的收集方式可能也是非常分散的,在各个场景都可能出现。但最后到底怎么用,是以平台上的一些模式还是以场内或场外的模式为主,都需要进一步探索。”

至于跨境合作方面,吴沈括称,如何通过规则的设定来降低主体,特别是私有主体的经济负担、行政负担,这些都是应当考虑的问题。在强调适应中国需求,特别是在构建数字中国战略需求下的数据要素市场时,基于便捷、安全等考量,设计一套各方能够认可的规则,进而形成顶层的制度体系设计。“无论是欧盟还是美国,各方都已经意识到下一阶段的国际合作博弈的制高点就是在数据要素市场,一系列规则、制度的尝试都是具有共性的。”

数据生态治理要权衡成本,实现社会福利最大化

中共中央党校(国家行政学院)经济学部副主任、教授许正中。来源:受访者供图

报告提出,数据生态治理是指围绕数据生态,明确各个数据生态伙伴的角色,要求各类数据生态伙伴共同实现数据的协同治理、多环节治理,要求在保护个人隐私和数据安全的基础上,更好地发挥数据价值,促进数字经济和数字社会高质量发展。

报告发现,如何在保护数据隐私的条件下充分激活数据要素的经济价值,提高数据生态治理能力,国内外互联网企业利用在AI、大数据等方面的技术优势,对数据治理进行了积极探索和实践。亚马逊Macie通过机器学习,自动发现、分类和存储在AWS中的敏感数据,保护用户数据安全;谷歌推出密码检查器Password Checkup帮助用户检测他们在网站上输入的用户名和密码是否已被盗用;阿里巴巴推出DataWorks全链路数据治理产品体系,对外赋能阿里巴巴的数据治理能力;抖音坚持最小化收集原则,更精准地进行数据收集分析,并采用全向量化召回方法,避免用户隐私泄露问题。

国家行政学院经济学部副主任、教授许正中表示,他认同数据生态治理的概念,数据从生产要素到产业,再到国家治理,就是一个生态系统。数据产业共同体,泛社区治理网络,以及全链路数据治理是数据生态治理中的重要问题。

报告认为,从更广义的视角看,加强数据生态治理,有利于发挥数据在社会治理中的重要作用,促进社会治理现代化、数字化、智能化。报告基于短视频领域的实证研究发现,数字共治对工业二氧化硫和工业粉尘排放量有显著的抑制作用,其中,政府和平台的努力尤为重要,政府努力强度每提升1%,工业二氧化硫和工业粉尘排放量就分别降低0.5219%和0.5505%,平台努力强度每提升1%,工业二氧化硫和工业粉尘排放量就分别降低0.2494%和0.2208%,这说明政府与互联网平台打造的数字共治对促进经济绿色发展具有显著的促进作用。

谢丹夏介绍了他首创的“数据创新内生增长理论”。数据是有“杂质”的,可能会给我们带来隐私风险等福利损失,因而需要将数据中不利的东西剔除,他称之为“从数据到知识的漂白凝练”过程——也就是数据用于创新并产生可重复使用的“纯净”知识的过程。另外,数据涉及到的隐私内容,也可以通过隐私计算技术等方式进行有效控制。“我们怎样规避‘杂质’的影响,只交易有价值的部分,这实际上是从一个更为基础、科学的角度去探讨数据要素的本质,也将有助于我们未来立法。”

李勇在分析人工智能与数据治理的关系时称,数据治理与人工智能是双向循环的问题,“人工智能技术应用伴生着新的数据生态治理问题,但如果没有数据,人工智能的应用价值是没有这么大的。”他认为,从人工智能技术的角度来看,解决数据治理问题的方法就是在确保需求满足和应用质量的前提下尽量少用数据,尽量分布式地用数据,或者不用数据。

首都经济贸易大学工商管理学院助理教授施新伟。来源:受访者供图

首都经济贸易大学工商管理学院助理教授施新伟建议,数据生态治理需要考虑参与者,当前的数据生态治理更多是聚焦数据本身,而数据的生产者、消费者、第三方等也应纳入数据生态治理中。

清华大学公共管理学院教授、清华大学人工智能国际治理研究院副院长梁正。来源:受访者供图

清华大学公共管理学院教授、清华大学人工智能国际治理研究院副院长梁正认为,不管是权属界定也好,还是对包括定价、交易在内的整个流程的设计也好,数据生态治理最终要实现的就是社会福利最大化。

梁正点评报告内容称,字节跳动火山引擎的联邦学习平台Fedlearner支持多类联邦学习模式,融合分布式机器学习、同态加密、多方安全计算等技术,实现数据的“可用不可见”,解决数据的隐私保护问题,在电商、金融、教育等行业多个场景实际应用,取得显著正向效果,是将人工智能技术应用于数据生态治理的典型案例。他强调,“从经济学视角来看,数据公共治理模式的变化,会在各利益相关者之间产生什么样的互动关系,对治理绩效和产业发展产生怎样的影响,是我们公共管理学者特别关心的问题。”

施新伟表示,数据生态治理在起步阶段就应立足开放的国际化与全球化,与推广中国主导的计算产业生态同步进行国际化、全球化的治理。

从社会福利最大化出发,报告最后建议,针对分类分级数据授权体系,以及全产业链环节、不同场景的数据交易市场,应建立相应的分类分级的数据要素监管体系,规范各级各类的数据交易。首先,建立数据要素全产业链分类分级标识体系,做到数据要素类别级别始终清晰,动态可追溯。其次,积极推动数据要素分类分级体系落实,发挥各方主体力量,明确相应监管主体和要求,达到共治共建、成果共享的初衷。企业应承担对所收集数据建立分类分级体系的主体责任;相关行业协会和行业组织通过制定行业标准,发展第三方认证体系,推动数据要素分类分级工作;各级政府及主管部门应该承担数据要素分类分级的督促和落实工作。最后,按照类别级别越高、监管措施越严格的原则,完善各类各级数据要素的监管措施。针对公开数据以及授权程度较低的宽松条件下可商用数据,应采取自主经营、鼓励共享的原则,例如用户公开使用的昵称、头像等公开的一般个人信息、企业联系信息/产品价目表、政务公开信息等,应鼓励其跨平台、跨公共和商业领域共享,促进全社会的数据要素资源流通和价值倍增。(中新经纬APP)

(责任编辑:崔晨 HX015)

文章内容来自网络,如有侵权,联系删除、联系电话:023-85238885

参与评论

请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。

评论区