中国报道网——中国外文局亚太传播中心唯一官方中文网
位置:当前位置:首页 >> 数字法治

数字法治|赵精武:用户标签的法律性质与治理逻辑

发布时间:2023-02-06 12:15:58 来源:中国报道

赵精武(1992),男,河北黄骅人,北京航空航天大学法学院副教授,法学博士,工业和信息部工业和信息化法治战略与管理重点实验室研究员,北京科技创新中心研究基地研究员。本文来源于《现代法学》2022年第6期。

个体层面的个人信息权益与企业数据财产建构的主张不足以解释数据资源背后的群体性权益,恰如用户标签不仅描述了自然人的个体属性,还反映了被学者们所忽视的自然人群体的共同属性,当前学术讨论存在简化用户标签承载多元法益的误区。用户标签包含了个体性权益和社会关系权益的数据要素,因为在数据关系理论框架下,数据经济价值不单是数据本身,还包括数据所反映的群体性偏好、社交关系等信息内容。数据处理者精细划分用户标签数量和类型,其目的是更精准、更全面地获取不同用户群体之间的社会关系,而这正是以用户群体而非用户个体为基础,延伸数据安全保障义务内容的正当性依据,即数据处理活动应当以有利于数据资源再生产和预防数据群权益损害的方式进行。

一、 问题的提出

用户标签是指信息处理者为了方便发现和识别自然人基本特征而对自然人个体的特定属性(如消费偏好、行为轨迹、生活习惯等)高度提炼而形成的特征标识。用户标签数量越多,信息处理者对特定用户情况了解得就越充分。简言之,用户画像是由多个用户标签构成的。法学领域的研究成果大多倾向于将用户标签与用户画像、个性化推荐视为同一法律议题予以讨论,原因在于用户标签不过是用户画像和个性化推荐服务中的“客观技术过程”,其法律规制仍然需要回归算法治理框架之内。然而,前述观点仅关注到了用户标签在形成用户画像过程中的辅助作用,忽视了对用户标签自身经济价值来源的考察。从商业实践来看,用户标签的应用还涉及平台用户之间的相互识别、建立用户关系群等与客户关系管理(CRM)相关的业务活动(参见图1)。因此,与用户标签应用相关的制度探讨显然不能仅限于算法安全治理层面,还应当从数据治理层面来解释用户标签所包含的“双重法益”。因为用户标签既包含对个体用户行为特征的描述,还包括对用户群体性特征的描述,而这种群体性特征恰恰是用户标签自身的经济价值所在。诚然,算法治理体系确实能够解决用户标签技术滥用的问题,但这种治理的立足点是以保障用户个体权益为基础,无法回应用户标签内被忽视的“群体性权益”,故而有必要从数据安全治理层面重新审视用户标签治理领域是否存在遗漏保护的“权益”。

从现阶段的业务模式来看,用户标签技术应用的目的,首先是建构用户群体的共同特征,然后是对不同用户群体特征进行层层叠加,最后才是建构同时满足数个用户群体特征的用户画像。更为重要的是,数据处理者利用数据资源获取经济利益的主要方式,除了识别特定自然人基本情况之外,还包括对用户群体的精细化分类,以便及时发现市场需求走向和风险水平。因此,在回答如何规制用户标签技术应用之前,有必要厘清用户标签法律性质的三个理论问题:第一,用户标签的法律性质是什么?尽管用户标签之间相互组合能够间接识别特定自然人,但对于这种“可识别性”与《中华人民共和国个人信息保护法》(以下简称《个人信息保护法》)第4条规定的“可识别性”之间的落差又应当如何解释?第二,用户标签背后的群体性特征的利益归属如何在现有的权利体系中予以定位和解释?来自于用户的用户标签为数据处理者创造了经济利益,最终的信息服务却存在侵害用户个体权益的可能性,这明显存在数据处理者与自然人之间的权利义务关系失衡的问题。第三,用户标签技术滥用问题归根结底表现为数据使用方式不恰当,但这种数据处理行为又无法机械地套用既有权利架构,那么,又应当设置何种规则将其安置于数据安全体系之中?总体而言,用户标签在精准营销、用户群体分类、市场需求分析等领域的应用,使得标签技术的法律意义远超纯粹中立的技术方案和企业经营自主权的概念范畴,因此,需要在理论层面重新解释和建构用户标签承载的多元法益结构。

二、用户标签与个人信息的关系

(一) 用户标签的基本概念和技术特征

学界对于用户标签法律性质的忽视,本质上是对用户标签技术特征的忽视,并不是所有的用户行为模式特征都可以成为“用户标签”。用户标签的数量和内容设置往往需要以一定的商业目的或分析内容为依据,确保每一个用户标签彼此之间能够相互区分。通常而言,用户标签大致可分为“统计类标签”“规则类标签”和“机器学习挖掘类标签”三大类。统计类标签最为常见,主要是对用户基本情况进行统计;规则类标签则是为了发现用户行为的基本模式或总体趋势;机器学习挖掘类标签则是由算法所形成的用户标签,但该类标签因形成周期较长而较为少见。进一步而言,通常被认为是商业经营模式或技术方案的用户标签,实际上也是解决数据财产权益归属的重要依据,所谓的数据资产并不纯粹是个人信息处理者所持有或控制的数据集合,而是一整套围绕数据资源开发的技术、设备和信息资源体系。数据资产经济价值的形成有一部分来自于用户标签,以及标签类目体系,因为这些标签能够将数据资产真正转化为常见的各类信息服务,以标签形式形成的数据资源或数据集合也被视为“数据资产的最佳表现形式”。因此,用户标签并不纯粹属于用户画像的技术环节,其自身的经济价值毋庸置疑。

用户标签是包括个性化推荐、广告推送、智能运营系统等诸多数据产品在内的基础类数据。设置合理且维度多元化的用户标签体系,能够帮助企业直观地分析用户群体的消费行为特征,明确目前与未来的市场需求发展趋势。如果仅是针对个人偏好设置标签并提供类似的服务,那么,这种标签实际上属于传统商业活动中的同类产品推荐,而非前文提及的“标签算法”。从目前的用户标签技术应用情况来看,用户标签主要表现为三方面特点:第一,通常不具有唯一识别性。用户标签形成的用户画像并不当然等同于可识别的个人信息,倘若用户标签数量不足、内容不具代表性,最终形成的用户画像并不能实现精准营销的功能,反而有可能成为“用户分群”的依据。第二,设置规则具有唯一性和简洁性。为了充分了解个体用户的行为特征或个人偏好,个人信息处理者所设置的用户标签内容虽然简洁但极具概括性,其目的是细分营销市场、判断用户群体的消费特征,增加不同用户群体的可辨识度。第三,设置目的具有明显的业务导向性。如二手车交易平台不会选择将“偏好管弦乐”作为自身标签类型体系的内容之一,因为这不符合其促成二手车交易之目的。

每一个用户标签描述的仅仅是与自然人相关的一个特征,因此,针对同一自然人的不同用户标签之间内容并不重叠,传达的信息内容也各不相同。而且,随着用户标签类型和数量的增加,有关自然人的信息将会越来越详细,乃至能够精准定位到特定自然人。从大数定律的角度理解,网络平台为了预测用户的消费需求和习惯,倾向于收集有关用户各方面的行为数据,故而,用户标签的整合、聚合很大程度上能够传达有关用户职业类型、收入水平、消费偏好等详细的信息内容,这也是创造数据资产经济价值的关键所在。正如德国宪法法院在“人口普查案”中提及的“现代社会不存在与个人完全不相关的信息”,虽然单一的用户标签并不属于个人信息,但是,数量庞大且聚合的用户标签完全有可能成为个人信息,甚至能够达到敏感个人信息的程度。

(二) 用户标签并不当然是个人信息

用户标签是否属于个人信息需要判断用户标签的间接识别可能性是否与《个人信息保护法》第4条中的“可识别性”一致。用户标签实现间接识别特定自然人存在诸多限制,解除限制的前提是要满足“有充足数量的其他用户标签进行结合分析”和“采用相同的标签类目体系和标签设置标准”,以及“企业内部特定的算法”三个条件。尽管用户标签和用户画像早已成为普及性的商业模式,但是,零星或数量有限的用户标签类目具有鲜明的企业经营战略导向,不同企业所设置的用户标签无法与其他企业的用户标签结合起来确定特定用户身份信息。企业内部标签类目体系设置不合理,会影响到用户标签定位用户特征的准确性。更为重要的是,用户标签具有机器可读性,而非人的可读性,因而,如果不能放置在特定数据分析算法中,则无从谈及用户标签的间接识别能力。而《个人信息保护法》第4条中的“可识别性”标准显然不能解读为“关联个人的信息即是个人信息”。囿于商业实践的复杂性和技术更新周期性等现实原因,立法者并没有选择详细具体的概念界定模式,而是将“可识别性”标准的解释方式交由法官结合个案予以判断。与一般数据处理活动相比,用户标签结合识别特定用户明显具有“异常”的技术难度和前期成本要求,并不属于第4条意欲防范的“可识别性”风险。

更准确地说,在形成精准用户画像之前,与其说用户标签具有识别特定自然人的可能性,倒不如说用户标签具有“推测”“预测”自然人群体特征和行为趋势的可能性。与部分国外学者所提出的“过度推测”风险的治理论断所揭示的情形类似,企业在从事大规模数据分析之前,应当证明数据源和预期推理的合理性,针对诸如“从非歧视数据推断敏感信息内容”“用于推测行为的数据源是否具有隐私侵犯性”等事项进行评估。事实上,用户标签的使用并非数字经济的全新产物。在过去,企业会建构客户关系管理系统实现用户的存量管理,基于“老顾客”“新顾客”等简单标签体系进行商业营销;而现在,企业收集用户个人信息的目的与过去并无差异,唯一的区别是后者是从个性化定制和群体性定制两个层面达到业务营销的目的。

三、用户标签承载法益的结构关系

(一) 用户标签承载的多元法益

既然用户标签并不当然等同于个人信息,那么,就有必要重新审视用户标签的法律性质,法律性质解释方案的不同,决定了立法是否需要规制用户标签,以及以何种方式规制用户标签技术应用。技术中立并不是个人信息处理者可以任意使用用户标签技术的正当性事由,标签技术应用的最终目的还是为了精准识别特定自然人的特定需求,如若放任该项技术滥用,则不可避免地会发生“技术规训人类”的风险。国家网信办等四部门发布的《互联网信息服务算法推荐管理规定》第10条规定了算法推荐服务提供者的用户标签管理义务,即不得将违法、不良关键词纳入用户标签。该规定虽未明确解释用户的具体权利,但是,从条款内容来看,用户标签技术应用确实关系到个人信息权益的行使,因为在信用评定、电子支付等领域,用户标签内容设置的准确性和完整性直接关系到用户申请贷款等实体性权利能否实现。由此观之,用户标签作为信息服务内容的组成部分,对其合理设置、精准设置亦是信息服务合同权利的应有之义。除此之外,用户标签同时还具有社会公共利益的属性,标签内容设置不合理有可能导致网络违法信息的泛滥,如未能对用户标签增加“未成年人”的相关标签,未成年人则有可能频繁接收到不良信息的推送。所以,用户标签所承载的权益具有多元特征,虽然无法以明确的标准将这些复合型权益泾渭分明地区隔,但是,这并不妨碍从个体性权益和群体性权益两个层面解构用户标签的法益特征。

在个体性权益层面,用户标签越多,个人识别性越强,用户标签存在转化为“个人信息”的趋势。《个人信息保护法》所规定的个人信息是以信息要素组合为基础,如单独的“姓名”“身份证号”“年龄”等信息根本无法称得上是“个人信息”,但“姓名+身份证号”“姓名+年龄+电话”等信息要素组合则构成了“个人信息”。但是,对于不包含特定信息要素的用户标签,继续沿用个人信息保护规则将会出现保护客体不匹配的问题。本文所强调的“用户标签”主要是以单一的用户标签或者信息要素组合不具有识别效果的用户标签为论证对象,用户标签所承载的“个体性权益”是以单一用户标签之间的关联性为基础。用户标签的技术功能与个人行为特征识别密切相关,并且,用户标签的提取与设置也是基于业已收集的个人信息,故而用户标签所承载的个体性权益与个人信息权益存在体系上的部分关联,关联的核心则是基于个人信息而设置的用户标签可能会对个人其他权益产生负面影响,而预防或消除这些负面影响的制度仅与《个人信息保护法》存在部分内容的交叉。第一,在知情权和决定权层面,自然人有权限制或拒绝个人信息的处理方式,当然也有权限制或拒绝不合理的用户标签行为,只不过,这种限制或拒绝的前提条件仅限于“不合理”或“不适当”。第二,在更改权和补充权层面,个人信息权益的法理基础是保障个人信息的完整性和准确性,目的则是为了预防个人信息处理活动对个人其他权益造成不当影响。相对地,用户标签作为个人信息处理活动的重要环节,内容的筛选和设置同样会对个人其他权益造成实质性影响,故而用户有权要求更改不合理、不适当的用户标签。第三,在解释说明权层面,用户标签设置显然属于《个人信息保护法》第48条规定的“个人信息处理规则”,因而,用户有权要求个人信息处理者对标签内容设置规则进行解释说明。第四,在未成年人保护层面,用户标签与未成年人所能触及的网络信息范围和信息服务类型相关,个人信息处理者有义务根据《个人信息保护法》第31条制定包括用户标签管理规则在内的专门的未成年人个人信息处理规则。最后,至于查阅复制权、删除权等其他个人信息权益,由于涉及对个人信息“原件”的直接处理,故而其行使规则和法理基础无法延伸至用户标签。

在群体性权益层面,用户标签的技术应用应当是以促成数据资源再生产和避免数据社会损害为合法性边界,其承载的群体性权益则是公正合理处理数据行为的基础。这并非笔者臆想,已有学者提出“群体信息可能带来所谓的群体个人信息保护或群体隐私问题”,并且,这些问题是否完全按照个人信息保护方式予以解决存有争议。尽管从信息服务合同的角度观之,用户标签技术应用的方式主要是以合同权利义务为限,但是,用户标签类目体系的设置却是数据使用价值的实现方式。数据商业化使用的基本逻辑是企业通过对业已收集的个人信息进行加工处理,并按照企业经营理念和营销策略设置标签管理体系,最终获得企业希望发现的信息。因此,个人信息处理者的用户标签管理规则和设置体系背后的群体性权益,应当以有利于社会群体共同利益的形式存在:一是个人信息处理者所获得的数据经济价值应当来源于公正合理的数据处理活动;二是个人信息处理者所挖掘的数据关系不应当侵扰到社会公共利益和个体的私密生活空间。在商业实践中,这种群体性权益最直观的表现形式是基于用户标签所确定的营销策略侵害消费者群体利益,尤其是在自动化推送服务模式下,部分用户标签重合的用户群体往往只能接收到有限类型的信息。诚然,用户标签体系的设置属于平台经营自主权的范畴,但设置方式可能会对个体权益和群体性权益造成损害,有的平台试图获取超出正常营销范围的用户群体信息,如用户群体之间的社交关系、基于用户群体的歧视性再分类等。

(二) 用户标签群体权益的理论基础

前述用户标签多元法益并存状态早已为学者们所关注。在论及数据权属问题时,学者们试图将同一数据集合上的个人信息权益、企业数据财产权益,乃至潜在社会公共利益按照法律主体身份予以区分。但实际结果显而易见,在理论层面上,这些权益彼此之间的区分方式虽然能自圆其说,但在实践层面,却无法解释数据集合内部不同类型数据权益的具体边界,也无法解释企业利用数据集合获得的经济利益,且当这些数据集合是以不同方式组合个人信息而形成时,自然人是否有权获得其中的部分经济利益等问题并未明确。这些理论困境的形成,源于学者们普遍忽视了数据关系对于多元法益并存状态的影响方式。用户标签的间接识别特征不仅表现为能够间接识别到与标签相关的特定自然人,还包括能够间接识别到与特定自然人具有社会关系的其他自然人。简单地说,用户的消费行为被贴上标签后,学界主流观点大多倾向于分析这种标签行为是否会有可能重新识别到这个用户,但用户标签内容描述的不仅是该用户的个人属性,同时还是一定范围的群体性特征。这种个体性特征与群体性特征之间的映射关系,并不能依循法律主体的不同而划分出相对应的权利体系架构,进一步而言,这种技术层面的映射关系本质上是社会关系的数据化描述,即既表现为“具有A类特征的用户群体可能同样具有B类特征”,也表现为“A类用户与B类用户因为工作内容、消费行为等社会交往活动而构成了‘A+B’类特征”。

用户标签内容所包含的社会关系是用户标签兼具个体性权益和群体性权益的根本原因,美国学者萨洛梅(Salome)也基于数据关系的社会性特征提出数据治理的关系理论,用以解释“数据关系如何产生超越个人的权益”。萨洛梅并没有选择从信息自决权等主流视角探讨数据保护的必要性,而是将数据权益置于政治经济领域剖析数据的社会属性和关系属性。因为互联网巨头收集数据的经济动机并不纯粹是为了尽可能全面地描述个体用户的用户画像,也是为了尽可能发现“数据主体与他人关系的所有信息”,常见的好友推送信息可得优惠、拉入新用户即赠福利等营销活动亦是出于此种目的。在萨洛梅看来,“数据主体—数据处理者”和“数据主体—数据主体”均是数据处理活动需要考量的实践基础。前者反映的是信息服务提供者与信息服务接受者之间的权利义务关系,后者反映的则是数据经济价值创造来源,如对群体行为特征的总结与预测。由于数据经济价值常常被理解为企业通过技术、人力、资金等前期投入而获得的价值,“数据主体-数据主体”所反映的社会关系也被默认为企业的“数字劳动”所得。然而,数字时代下的社会关系并非纯粹客观的社会现象,以往隐藏于实践活动中的社会关系被平台挖掘和发现,将可能获取用户的现实好友关系等私密信息,或可能因技术缺陷导致挖掘的社会关系被异化。“数据主体—数据主体”所反映的社会关系承载的是消极性权益,即特定社会关系不得被擅自披露或恶意加工。《中华人民共和国民法典》选择将个人信息纳入人格尊严的保护范畴,原因是个人信息乃是法律主体身份的数字化;而用户标签作为群体行为模式特征的概括,本质上是法律主体身份数字化的社会交往活动的延伸,因而,其多元法益并存的解释显然需要以数据所反映的社会关系为核心。

萨洛梅在理论层面最大的贡献在于发现数据生产业务中最核心环节是数据关系的识别,这是解释用户标签群体权益存在的理论基础。现有的个人信息保护研究成果普遍以个性化服务所面向的特定自然人为核心,却忽视了商业逻辑层面数据真正的经济价值来源是社会关系和共同特征。在过去,企业也会收集和处理消费者的个人信息,其目的是维护客户存量和发现市场需求;在当下,消费者个人消费情况固然重要,但这种重要性却被集体的共同特征所涵盖。换言之,企业完全可以根据特定自然人是否属于某几类群体范畴,评估该自然人可能的消费偏好和行为轨迹,这也被萨洛梅归结为企业能够从“行为定位、预测任务、规模风险评估和可调节反馈系统”中获利的根源所在。所以,用户标签的群体权益来源并不完全是学者们所设想的算法透明义务等建构性理论,还包括数据经济价值的形成机理。对于数据关系的忽视将会导致“风险—收益”的失衡:一是个人授权收集个人信息所承担的信息安全风险与所享受的信息服务比例失衡;二是个人信息处理者通过收集个人信息获得集体的共同特征等利益与其承担的经营风险比例失衡,如用户提交了自己的消费记录、薪资水平等信息,却被用户标签定位为“缺乏足够消费能力”,用户实际能够获得信息服务的内容和类型受到限制,明显属于萨洛梅所提及的“不公平的数据处理活动”。

(三) 用户标签群体权益的基本内容

用户标签的群体权益与传统意义上的社会公共利益存在一定的差异性,相较于后者而言,群体权益在内容和正当性基础层面更为具体。用户标签的群体权益的正当性基础是数据之间的关系或者结构化数据所能映射的社会关系以及经济价值。回顾国内学者有关数据财产权益归属问题的探讨,有一个问题未能得到圆满的解释,即个人信息处理者处理个人信息集合并获得经济利益,自然人作为原始数据的提供者,是否应当获得相应的经济利益?从经济利益的实际来源看,如果自然人拒绝提供个人信息,个人信息处理者确实未必能够得到足以盈利的信息内容和数据资产。但是,一旦承认自然人享有部分的数据收益权,无疑会对所有的数据处理活动施加庞大的额外成本。从经济利益的实际创造者来看,个体层面的个人信息并不足以形成具有商业价值的数据资产,经济利益的真正来源是企业自身运用信息技术、原始数据收集等劳动所产出的数据资产。类似的问题是,一旦承认企业数据财产权的正当性基础是企业的技术处理活动,又会陷入企业以加工后的数据不属于个人信息为由规避义务履行的困境。这一权益归属难题置于数据治理关系理论框架下,则被转化为如何解释个体性的经济利益与个人信息权益之间的内容衔接问题。

可以确定的是,针对由个人信息衍生而来的数据资产,自然人享有部分权益。不过,这种权益并非通常意义上归属于特定个人的具体权利,而是被融入群体权益之中。客观上,单一个体乃至小范围群体的个人信息本身并无多大商业经济价值,在无法收集自然人全部的个人信息的预设前提下,个人信息处理者完全可以选择用其他自然人个人信息集合予以替代,获得经营活动所需的群体性共同特征信息。因此,在立法层面建构归属特定个人的数据收益权缺乏足够的正当性基础,现行立法也未曾规定基于“可能促成收益”事由的具体权利。换言之,归属型数据权利的内在逻辑是个人信息处理者利用个人信息获得经济利益,但实践中经济利益的获得方式并不是完全利用个人信息所得,有关自然人数据收益权的讨论一开始就存在方向性偏差,误将客观的社会身份关系当作个体数据的经济价值来源,以至于徘徊在“数据资产经济价值主要来自于企业内部加工,还是自然人提供原始数据”的逻辑误区中难寻出路。在法理层面,承认自然人对数据流动中形成的数据资产享有部分权益并无不当,但关键是这种权益并不是归属于个人,而是以群体权益的形式为群体乃至社会公众所共同享有,其行使方式则是一种强制性义务规范,即要求个人信息处理者不得将集体共同特征以不恰当的方式标签化,并限制集体范围内个体权利的行使。

具体而言,用户标签可以视为社会关系的数字化,而这种社会关系足以让网络平台或信息服务提供者发现潜在的市场需求或评估风险程度。所以,用户标签承载的群体权益可以理解为社会关系权益,即用户标签应当以有益于社会关系发展或数据资产再生产的方式予以设置和使用,但由于社会关系权益并不专属于特定自然人,因此,该权益的存在形式主要是以强制性义务规范为限。详细而言,社会关系权益包括三个层面的内容:第一,并不是所有的社会关系都适合设置为用户标签的具体样态。在商业实践中,个人信息处理者所关注的“社会关系”无外乎与精准营销、拓展客户范围和规避经营风险相关,涉及到国家安全、个人私密生活状态的社会关系则不适宜作为用户标签。例如,频繁购买皮肤病药品的人群可以设置“购买皮肤病药品”的用户标签,但不宜设置“购买A类皮肤药品”的用户标签,因为后一类用户标签可能揭示“患有特定皮肤病者”这一私密群体,明显超出了精准营销或扩大客户范围的合理性。第二,用户标签不得用于歧视性的群组划分。创造数据经济价值的基础是客观性的社会关系,而不是具有歧视性或偏见性的社会关系。常见的大数据歧视等问题在一定程度上可以理解为,网络平台未能正确使用用户标签划分恰当的群组类别,如果简单地按照过往消费记录划分“高端消费、中端消费、低端消费”群组类别只会误导数据资产再生产方向,使得原本发现市场需求的用户标签异化为精细评估消费者能够接受的最高价格水平的歧视性标签。第三,用户标签的使用目的应当与用户标签所反映的社会关系具有关联性。因为个人提供个人信息的目的是享受更优质的信息服务,如果根据用户使用行为信息形成的用户标签被用于分析其他群体共同特征,显然已经超出了用户标签设置的必要限度。例如,用户标签所反映的是A类用户群体的消费需求,用户标签所形成的用户画像也是为了满足A类用户群体的消费需求,但如果用户标签被用于挖掘和分析A类用户群体的生活状况,则属于社会关系权益所排斥的非合理数据处理活动。

四、多元法益结构下用户标签技术滥用的治理模式

(一) 用户标签技术滥用的外观特征

目前,商业实践中用户标签技术滥用主要表现为标签内容设置不合理、标签使用目的不合理、标签设置不透明三个特征。“标签内容设置不合理”是指标签内容具有明显歧视性、偏见性的主观判读。用户标签的技术逻辑仅是为了说明用户某一个属性,而这个属性虽然预先经过商业营销策略的筛选和评估,但终究是对用户属性的客观性描述。标签内容设置不合理不仅包括标签内容未能选择中立性属性特征进行描述,而且还包括标签内容未能涵盖用户相关的重要属性。“标签使用目的不合理”是指标签设置目的超出经营活动的必要限度,过度侵蚀用户的隐私空间或其正当性权益。网络平台通过用户标签应用挖掘用户的兴趣爱好和消费偏好,本属于合理的经营行为,可如果网络平台将用户标签用于识别用户的个人健康状况、资产水平、日常出行路线等目的时,即便这些目的在一定程度上与精准营销、挖掘客户相关,但对于用户而言,其所享受的个性化服务要以牺牲自身的隐私权益为代价。“标签设置不透明”是指用户并不知晓用户标签设置和管理的基本规则。用户标签不当然是个人信息,但是,其设置逻辑是以用户的操作行为为基础,本质上属于个人信息处理者对自然人具体行为的记录,并且这种记录结果最终可能会影响到自然人能够获得的信息产品和服务。对于这些能够实质性影响自身权益的技术应用,用户理所当然地有权知悉用户标签的设置和管理规则。当然,从知情目的来考虑,并不是所有的用户都能够理解复杂的用户标签技术方案,且用户标签的具体设置方式也属于商业秘密的范畴,故而这里的“知情”也仅限于“用户标签的设置对用户权益产生何种影响”“用户标签的内容在何时收集”等基本事实。

有必要说明的是,萨洛梅的数据治理关系理论是以数据关系所涵摄的社会意义为基础,该理论与用户标签所涵摄的社会意义存在些许差异:第一,用户标签所描述的是个体化的属性,其内含的社会关系指向的是不同群体之间共同特征的关联性。网络平台之所以在经营活动层面侧重建构用户标签背后的标签关系模型,是因为不同群体之间的共同特征一旦存在某种关联性,网络平台便可发现潜在的市场需求和未来的消费趋向。第二,用户标签所反映的社会关系还表现为社会群体行为模式变动对经济社会的影响,这里的社会关系主要还是以群体行为模式特征对属于该群体的潜在用户消费需求进行评估和预测。进一步而言,前者的重心在于发现和评估市场营销活动中可能存在的风险,后者则重在将属于特定群体的其他自然人纳入网络平台的用户群体中,拓展用户存量。第三,用户标签所反映的社会关系还表现为不同社会群体之间的差异性特征。对于网络平台而言,共同特征是为了吸引同类消费者和预测市场需求总量,差异性特征则是为了说明不同群体在容忍个性化推送、主要营销信息接收渠道、消费习惯等层面的关键性差异,以便针对不同社会群体提供符合其消费特征的精细化营销活动和信息服务。

用户标签的核心价值是为了辅助数据分析、精细划分用户群体类型,以及作为信息产品的组成部分,而用户标签技术滥用则是将这些技术目标简化为全方位分析用户个人身份信息,以及相关的社会交往活动。这种社会关系异化的后果是网络平台与用户之间的权利义务关系失衡,以定制化服务、个性化推送服务优化为目标的用户标签,沦为网络平台巩固自身数据资源竞争优势的技术工具。在商业实践中,优质数据越多,经济价值越大。基于这种数据规模化效应,网络平台逐利的本质会促使其尽可能收集更多的个人信息和业务数据,但这些业已收集的数据还需要进行数据分析和挖掘才可能成为企业的市场竞争优势和经济价值。与此同时,用户标签的精细化程度日趋加深,有利于今后数据经济价值的挖掘,网络平台利用用户标签所获得经济价值和详细的用户群体偏好与其提供的个性化服务明显不成比例,而自然人的个体性权益仅限于人格尊严保护,社会关系权益则难寻救济的法律依据。

(二) 用户标签技术滥用的治理逻辑

在明确了用户标签技术滥用是社会关系异化之后,其治理逻辑显然应当以矫正这种技术功能异化为核心,实现在引导用户标签的设置和管理在符合用户标签承载的个体性权益诉求的同时,保障用户标签所承载的社会关系权益。有意思的是,国内学者论及用户标签的治理模式或规制方案时,倾向于将用户标签、用户画像以及个性化推送视为一个整体性论证对象,进而分化出两种治理体系:一种是基于算法公正的算法推送服务监管体系,要求用户标签的设置与管理不得侵害用户个人权益;另一种则是基于个人信息权益体系框架的数据安全规制体系,重点规制个人信息处理者在设置用户标签之前应当遵守的个人信息保护规则。在算法治理逻辑下,与其说是对用户标签设置或管理行为的治理,倒不如说用户标签与用户画像在法益层面并没有显著区别,均属算法技术应用的组成环节。算法技术已经成为平台运行的核心,但算法治理逻辑并不关注具体技术方案是如何实现的,仅仅关注用户直接受到影响的服务内容或能够直接接触到的业务环节,这也是将用户标签妥善管理义务安排在《互联网信息服务算法推荐管理规定》第17条的理论根源。

此外,前述两种治理逻辑之所以否认独立规制用户标签技术应用的必要性,是因为这两类治理逻辑将用户标签视为正常经营策略或纯粹中立的技术方案,并且认为,用户标签技术对用户权益的负面影响完全可以在具体业务层面予以控制。在算法治理逻辑下,算法问责机制涵盖了从用户标签的内容设置到标签算法模型的建构,因为这些事项本身是判断算法服务提供者是否存在主观过错、算法推送服务是否正当合理的客观依据。借由对这些事项的事后问责可以促使算法服务提供者在事前阶段,即对用户标签技术应用模式进行调整,并且,用户标签作为算法推送服务的一部分,也属于《互联网信息服务算法推荐管理规定》第16条要求告知或公示的算法推荐服务的“基本情况”或“主要运行机制”,故而也就没有必要专门建构一整套用户标签规制体系。在个人信息保护治理逻辑下,内容设置不合理、重要标签遗漏等网络标签技术滥用问题,则可通过事前阶段的个人信息收集、处理的告知义务,事中的个人信息保护影响评估以及事后的侵权责任予以解决。用户标签与个性化服务在业务逻辑上均是以数据收集活动为起点,按照“个人信息—用户标签—数据分析—用户画像—个性化推送”的业务流程实现数据经济价值的创造,规制用户标签和个性化推送在保护对象和保护方式上并没有明显区别,两者之间紧密的业务关联性无法在制度层面予以分隔。

总之,前述两种治理逻辑均是以个体权益的保障为制度目标,规制用户标签技术应用方式的直接依据是用户与网络平台之间的信息服务合同中的权利义务内容。归根结底,这两种治理逻辑在个体层面所要保障的个体性权益是自然人在网络空间的行为自主权,分别对应的是算法推荐服务适用自主权和个人信息自决权。但这种行为自主权并不能解释用户标签所承载的社会关系权益保护问题,这也是现行立法在社会公共利益保障层面所遗漏的内容。无论是算法治理框架对算法应用模式的限制,还是部分学者所主张的“在信息整合和用户画像阶段,个人信息处理者需要履行数据安全保障义务”,均普遍缺乏对用户标签群体权益的回应。如若继续在此层面探讨用户标签的治理问题,客观上不可能满足现行立法所要求的“权利内容具体且明确”的要求,这也是需要从数据安全治理层面保护用户标签群体权益的根本原因。

在立法层面,专门规制用户标签的必要性表现为:由个人数据关系延伸而来的群体性数据关系需要专门保护,后一种数据关系所传达的社会关系权益不归某一个特定自然人所有,而是由用户群体所有。因为群体性数据关系本身兼具个体化经济价值和集体性经济价值,个体化经济价值是指群体性数据关系能够帮助网络平台准确定位市场需求和及时规避经营风险;集体性经济价值则是指群体性数据关系反映的是社会群体之间的社会关系以及群体所组成的社会结构运行状态。在数据治理关系理论中,群体性数据关系的社会意义在于,不同群体的分组可能导致群体之间的差别化待遇,如“黑人”群体相比于其他社会群体可能会遭受更多的社会歧视。因而,群体性数据关系所传达的社会意义实际是指不同用户群体背后的用户标签是否能够以客观中立的内容予以表达。用户标签技术滥用的治理逻辑,除了需要为个体性权益提供法律救济之外,还需要在社会层面明确用户标签技术应用的合理边界。在现代社会的风险分配逻辑中,风险的承担应当与可能获得的经济利益保持一致,网络平台在享受群体性数据关系经济价值的同时,也应当承担相应的法定义务,即保障用户标签技术应用的公平性和合理性。

(三) 个体与集体层面的强制性义务规范

有关用户标签法律性质的理解可以从其规制方式的角度出发。由于用户标签技术滥用的治理逻辑是以预防社会关系异化使用为基本目标,保障的是群体权益,那么,具体的规制方式显然不能从用户权利增设和补强的角度进行制度建构,而是需要从强制性义务规范的角度设置用户标签承载的社会关系权益保护路径。

诚然,用户标签与个人信息的概念外延并不完全重合。二者承载了不同的权益类型,从一般的制度保护逻辑来看,似乎需要选择“另起炉灶”的方式解决滥用用户标签技术的现实问题。但也正如前文所表述,用户标签承载了个体与群体层面的两种法益,个体层面的法益保护不可避免地需要延续个人信息保护的基本逻辑。但是,群体层面的法益保护强调了数据处理者以“社会可信任方式”处理用户标签,所以,“强制性义务规范”的内容应当与现有的数据安全保护规范衔接,置于广义层面的“数据安全”目标之下予以解释。因此,《中华人民共和国网络安全法》《中华人民共和国数据安全法》和《个人信息保护法》所规定的“数据安全保障义务”既包括个人信息处理者为保障数据安全持续状态应当采取的措施,还包括需要确保数据处于合法的利用状态。这种“合法利用”状态包括两层含义:一是与个人信息权益或其他数据权益相对应,确保数据按照权利人的请求进行收集和处理;二是与社会公共利益相对应,应履行法定数据保护义务,确保数据的利用方式符合法律法规和公序良俗。基于此种考量,在立法层面显然没有必要专门增设用户标签技术应用的规则体系,真正需要的是补强对数据安全保障义务内容的解释,明确社会关系权益所对应的数据安全保障义务应当以何种方式履行。因此,用户标签相关的强制性义务规范应当从以下三个层面予以建构:

第一,禁止设置歧视性用户标签或将用户标签用于价格歧视、区域歧视等不公平的消费活动。诚然,《个人信息保护法》第24条规定了个人信息处理者不得利用自动化决策实行不合理的差别待遇,《互联网信息服务算法推荐管理规定》第10条规定了算法推荐服务提供者应当加强用户标签管理,但这些义务性规定并没有直接提出对用户标签内容设置的具体要求,仅以“违法信息关键词”和“不良信息关键词”作为禁止性事项。此种立法逻辑忽视了歧视性决策结果的形成原因并不仅仅是用户标签本身的不合理性,还包括数个用户标签组合后所反映的歧视性社会要素。例如,“购买商品价位在第一档(便宜)”和“当月投诉5次”两个标签本身并没有歧视属性,但这两个标签组合可能会让企业得出“符合这两类特征的用户比较难缠”的歧视性结论。因此,“禁止设置歧视性用户标签”既指向个体的用户标签内容应当符合社会公序良俗和强制性规范要求,也指向数据处理者应当预防数个用户标签组合可能产生的歧视性自动化决策结果。

第二,保障用户标签体系的完整性,禁止信息处理者故意遗漏或删减涉及用户个体权益的标签内容。用户标签体系的商业价值在于较为全面和客观地分析用户的消费偏好,以及群体消费趋势,所以,单纯遵循“限制用户标签设置数量和内容可以保障个人信息安全”的规制逻辑过于粗糙。类似个人信息权利体系中的更正权的逻辑,强调用户标签体系的完整性则是为了保障用户的其他合法权益。在社会信用体系建设过程中,有关社会信用的用户标签直接关系到用户是否能够享受现实生活中的社会公共服务,用户标签体系部分内容的缺失或失实均会间接导致用户遭致不公平待遇。

第三,禁止信息处理者根据用户标签分析和挖掘特定用户的社交关系网络,不得滥用用户标签中具有社交属性的信息内容。《个人信息保护法》将“个人信息”的范畴限定在已识别或可识别的特定自然人信息,其默认的立法逻辑是“相关信息内容是与特定自然人相关的”,忽视了在识别特定自然人的过程中对其他具有社交关系的自然人“牵连性”的识别风险。正如前述所提及的数据关系理论,A类信息既能够识别到特定的自然人A,但是,也有可能识别到具有社交关系的特定自然人B。这种社交关系所具有的“间接识别”可能性显然也属于个人信息保护的基本范畴,故而有必要在立法层面限制数据处理者借助用户标签数量叠加的识别范围。换言之,法律所允许的数据关系经济价值的挖掘,仅限于与服务目的或产品功能密切相关者,数据处理者不得主动分析和挖掘特定自然人的现实社交网络。

前述制度建构方向主要是以数据处理者的法定义务为起点,但同样不能忽视用户标签所承载的数据关系的经济价值,这种财产性权益是在数据安全立法中建构“数据公平处理原则”的现实基础。用户标签所承载的社会关系权益不能直接为“社会公共利益”的抽象法益所涵盖,因为此种立法安排只会弱化社会关系权益的实际保护力度。从权益平衡的角度考量,数据处理者在通过用户标签所反映的数据关系或社会关系而获取市场竞争优势或经济利益时,应当确保其数据处理行为符合“数据公平处理原则”,即数据处理活动应当符合特定用户群体的群体性利益,数据处理者采取的数据保护技术措施,应当与其数据关系经济价值保持同等水平。在体系定位层面,不同于个体权益所采用的具体义务规则,针对用户标签承载的社会关系权益的保障方式实际上更倾向于以兜底性条款的形式进行保障,确认数据处理者是否合理履行数据安全保障义务,以防范个体性义务规范所无法回应的标签技术更新、应用方式创新可能产生的未知风险。

五、结语

数据分析技术的更新迭代加速了网络社会互联互通的转型进程,个人信息乃至个体数据的经济价值从传统层面的个体基本情况分析延伸至个体与个体之间的社会关系分析,而用户标签作为自然人基本情况和使用行为的属性描述,其经济价值更是延伸至社会群体之间的共同特征、差异特征以及社会关系的分析。尽管用户标签确属个人信息处理者自行选择数据处理方式的“意思自治”范畴,但同样需要注意的是,用户标签在创造数据经济价值的同时,也存在技术滥用风险,内容设置不合理、超目的识别社会关系,以及关键缺漏等问题,直接影响到用户群体的群体权益。在我国数据治理体系的建构过程中,既要关注个体层面的个人信息及数据财产权保护,也要重视用户标签背后的社会关系权益保障。从逻辑上看,自然人个体权益的实现,除了需要个人信息处理者在数据全生命周期各个环节采取法定措施予以保障外,还需要在群体权益层面规定个人信息处理者在设置和使用用户标签等数据处理活动中应当遵循的基本原则,因为数据的“合法利用状态”意味着合理恰当的数据处理活动需要兼顾用户标签背后的个体性权益和群体性权益,而不是仅限于特定的人格权或狭隘的数据财产权。

《数字法治》专题由华东政法大学数字法治研究院特约供稿,专题统筹:秦前松。

责任编辑:楚予

关于我们|联系我们|广告发布|法律顾问|版权声明

版权所有 中国报道杂志社 广播电视节目制作经营许可证:(京)字第07311号 电子邮件: chinareport@foxmail.com 法律顾问:北京岳成律师事务所

电话: 010-68995855 互联网出版许可证:新出网证(京)字 189号 京ICP备08103425号 京公网安备:110102000508