其次,从运行角度来看,生成式人工智能还存在着一种高频、渐进的个人信息间接泄漏风险。生成式人工智能需要从大量数据中学习和生成模型,并不断改进模型,以提高生成文本的准确性。这就意味着,上一版本中收集的个人数据可能被用于模型训练并在未来版本中进行输出,从而间接导致个人信息泄露。例如,在ChatGPT中输入的文本可能包含具有隐私敏感性的信息,如医疗记录、司法文书、个人通讯记录等,而模型可能会学习到这些信息并在模型输出的结果中泄露这些信息。这种个人信息泄露乃至频发的风险,与生成式人工智能内在运行机理紧密关联,为生成式人工智能所特有,并且一定程度广泛存在于海量用户“人机对话”的过程中。只不过囿于生成式人工智能的高度复杂性和黑盒特性,其内部机制和应用过程往往难以被完全理解和掌控,从而使这种间接泄露及频发境况很难被发现和察觉。
生成式人工智能语料库中的个人信息泄露及其频发境况无疑会给用户带来隐私威胁、精神焦虑,甚至是财产、声誉和信任上的损失。如被不法分子滥用,进行信息关联和深度信息挖掘,严重时还可能威胁到国家数据安全和总体国家安全。伴随人类社会迈入数字文明时代,数字、信息堪称数字文明时代的“新石油”,数字、信息安全问题更是不容置若罔闻。
二、生成式人工智能的个人信息保护二元路径
基于上述,生成式人工智能无疑将对个人信息保护带来诸多挑战,亟需寻求切实的治理路径进行应对。综合而言,在实现个人信息保护与利用的平衡、信息安全风险合理分配及实践效果上,风险控制路径更具有优势。同时,将其嵌入生成式人工智能,以保护个人信息、防范规制风险具有其正当性和可行性。
(一)个人信息保护的二元路径
综合而言,目前个人信息保护存在二元路径:权利保护路径和风险控制路径。其中,“权利保护路径”起源于20世纪60年代的“公平信息实践”,其核心思想是保障信息主体对其个人信息的掌控和自主决定权。该路径遵循“权利确认-权利行使-权利救济”这一基本逻辑,属于以个人为中心的法律范式。随着个人信息保护领域的不断深入和发展,权利保护路径已经被广泛接受和认可。欧盟法律更进一步确认个人信息保护权为一项基本权利,从而进一步巩固权利保护模式的地位。然而,随着大数据时代的到来,权利保护路径也面临着越来越多的批评和挑战。一方面,虽然权利保护路径彰显信息主体的法律地位,但其相关权利保障机制却将主要保护责任转移给了信息主体,这种“赋权即责任”的模式导致了信息安全风险的不合理分配。另一方面,囿于信息主体存在有限理性以及大数据技术给告知同意原则带来结构性变革,以信息主体为中心的权利保护路径在应用中实则存在难以克服的负担和实践问题。
在这一背景下,风险控制作为一种新的概念被提出,并逐渐应用于个人信息保护,最终成为国际趋势。“风险控制路径”旨在通过不同的机制、模式和手段对个人信息保护相关的风险进行识别、评估、分配和管理,以保障公民权利、社会利益和国家安全等法益的不受侵犯。在风险控制路径下,个人信息权利不再具有绝对性,更多的体现为一种风险规制的工具。风险控制路径在个人信息保护领域的发展历程可以追溯到20世纪90年代。1995年,欧盟通过《数据保护指令》,并引入风险管理的理念,要求数据控制者采取适当的技术和组织措施,以保护个人数据不受损害。此后,欧洲各国陆续出台针对个人信息保护的法律法规,并将风险控制路径作为一种重要的保护手段。尽管我国《个人信息保护法》未明确指出采用风险控制路径,但从“敏感个人信息”和“一般个人信息”分类保护等具体内容规定来看,仍然对风险控制路径进行回应。作为一种新兴的保护理念,风险控制路径在未来生成式人工智能个人信息保护中毋容置疑将发挥重要作用。此外,在最新发布的《生成式人工智能服务管理暂行办法》的第二章第五条中,明确提及加强各机构在生成式人工智能的风险防范领域的通力合作,亦印证了个人信息保护的风险控制路径的重要性与必要性。
(二)生成式人工智能的个人信息保护:嵌入“风险控制路径”的正当性
相较于以权利保护为主的路径,风险控制路径在个人信息保护方面具有截然不同的特征,基于以下考量,无疑在推进生成式人工智能的个人信息保护过程中,将风险控制路径嵌入其中,具有其自身正当性。
其一,风险控制路径更有利于实现生成式人工智能技术利用与个人信息保护的衡平。在当代社会,我们需要在维护个人权益和推动社会经济发展之间找到平衡点,过度追求个人信息的绝对保护可能会忽略经济和社会发展的利益。在数字化浪潮中,数据和个人信息成为经济和社会发展的重要基石和创新驱动力。数据创新融合了人工智能、物联网、区块链等前沿技术,正在重构人类社会和产业形态。我国的《网络安全法》和《数据安全法》均明确规定数据开放和利用的政策支持,特别强调匿名化数据的自由利用,为企业拓展数字化业务和推动技术创新提供重要机遇。生成式人工智能以数据信息为燃料,为人类提供了前所未有的创造力和生产力,在未来,生成式人工智能将会在内容创作、图像生成、语音合成、自然语言处理、医疗诊断等多个领域发挥重要作用。因此,在生成式人工智能开发与应用的过程中,我们需要辩证看待其中的个人信息保护与发展问题。因此,在制定个人信息保护策略时,应兼顾生成式人工智能的经济和社会价值。如果采用权利保护路径则过度强调个人信息的控制,不仅会导致高昂的实施成本,可能还会制约数据的流通和利用,从而对生成式人工智能的开发与应用形成阻碍。相比之下,风险控制路径不强调个人信息的绝对控制,旨在通过风险管理和风险规制的方式将生成式人工智能应用中的个人信息处理风险降低到可接受的范围内。这种方式在保障个人信息安全和隐私的同时,能够有效利用数据这一宝贵资源推动社会和经济的可持续发展,避免个人权益保护对技术创新和公共利益造成抑制。
其二,风险控制路径更有利于实现生成式人工智能信息安全风险的合理分配。在当前风险社会中,生成式人工智能的社会价值不断凸显,其用户群体持续扩大,随之而来的个人信息保护风险也逐渐演变为一个重要的社会问题。因为一旦生成式人工智能发生信息安全事件,可能会危及上亿个用户群体,对整体社会秩序和公共利益乃至国家利益造成不利影响。正如前文所述,生成式人工智能应用中的个人信息安全风险在整体上已经上升到国家层面的意识形态安全、国家信息安全以及网络空间安全。此时,传统的权利保护路径已经不再适用,因为它通过某些机制将技术带来的风险不合理地转嫁给每一个独立的信息主体,从而导致生成式人工智能信息安全风险的分配失衡。相较之下,基于风险开启理论和获利报偿理论的风险控制路径,强调由生成式人工智能技术服务提供者和监督机构承担风险控制的主体责任,对信息处理活动进行价值判断,从而将生成式人工智能应用中的个人信息保护纳入到全社会风险控制的范畴中。在这种保护方式下,生成式人工智能带来的个人信息安全保护责任不再是信息主体的单一责任,而是一个需要多方参与和共同承担的社会责任,是一种更符合信息安全风险分配原则并且可实现期待性更高的保护路径。
其三,风险控制路径更有利于实现生成式人工智能应用中个人信息的高效保护。根据社会学家乌尔里希·贝克的观点,现代化进程中科技和经济全球化的发展所带来的各种风险难以预测和计算。这些风险不受时间、空间和社会界限的限制,无法完全消除,其绝对性不可避免。此外,现代社会的复杂性决定了风险之间必将相互渗透和影响,这是现代社会不可避免的趋势。一旦人们对此形成了正确认识,“相对安全”便取代“绝对安全”,成为生成式人工智能个人信息安全风险治理的理性目标。生成式人工智能正在不断迭代升级,其带来的个人信息非法收集、泄露、滥用、虚假信息生成等问题已经显露,其他潜在风险和问题或许正在酝酿之中。传统权利保护模式以一种定型化的刚性方式,为个人信息保护划定最低的限度,无法有效应对复杂的信息生态环境和生成式人工智能可能带来的新型信息安全威胁。而风险控制路径更注重个人信息保护的动态性,以量体裁衣的灵活模式,根据生成式人工智能应用的具体情况进行风险把控。这种方式考虑技术、市场、法律、管理等多个维度,能够对生成式人工智能带来的信息安全风险进行全方位、动态化回应,能够更好地适应信息化、数字化时代的发展,应对生成式人工智能带来的新型信息安全威胁,保障个人信息的安全和隐私。
三、风险控制路径的四层次体系展开
针对生成式人工智能应用中个人信息保护的复杂性,风险控制路径应基于下述四层次体系展开:
(一)促使告知同意规则的“个人控制中心向风险控制中心”转变
告知同意规则包含“告知”与“同意”两个层面,前者要求信息处理者必须向个人信息主体明示信息处理的范畴、方式、目的等影响个人信息主体作出同意决定的内容,后者则要求信息处理者的处理行为必须征得个人信息主体的明确甚至是单独同意。对于生成式人工智能中的个人信息收集而言,原则上同样需要遵守告知同意规则。《生成式人工智能服务管理办法》也明确将授权同意作为生成式人工智能开发与运行的基本准则之一。但正如前文所述,生成式人工智能语料库数据收集的强制性和无形性使得告知同意规则基本处于虚置状态。若遵循严格的告知同意原则,生成式人工智能技术服务提供者必须对所有信息主体进行一一告知并征得明示同意,对于收集敏感个人信息的情况还需征得信息主体的单独同意。显然,采用强告知同意规则可能会导致生成式人工智能无法正常运行,并且个人也将因此承担冗长的隐私协议解读负担。因此,为保障个人信息权益得到切实有效保护,同时促进生成式人工智能技术的持续健康发展,需要对告知同意规则进行风险化解释和调试,推动告知同意规则由“个人控制”为中心向“风险控制”为中心转变。
告知同意规则的风险化解释和调试指将可能引发的风险作为个人信息处理合理性的判断标准。具体而言,如果信息主体对生成式人工智能技术服务提供者的信息收集行为未做出明确同意或明确拒绝的意思表示,但通过个人信息保护影响评估能够确认信息处理行为不会带来超出合理范围外的风险,那么可以推定其默示同意。这一做法与美国所采用的“择出式知情同意机制”相类似,即企业在采集用户个人信息时并没有征求同意的义务,只需要在采集行为发生前或发生时向用户进行信息披露。从美国联邦立法到州立法,择出式知情同意机制始终占据主导地位,这一机制更有助于提升用户行为信息的商业化利用效率。需要注意的是,所谓“择出同意” 即使信息主体被认定为默示同意,其在信息处理过程中仍享有选择退出的权利,可通过新的意思表示推翻之前的默示同意。在生成式人工智能应用中同样如此,在后续语料库数据存储、语言模型训练等环节用户仍有权撤回(默示)同意。为此,应当要求生成式人工智能技术服务提供者提供便捷的撤回同意的方式,以辅助用户行使这项权利。
相反,如果评估确认风险等级较高,除了征得信息主体的明确同意之外,生成式人工智能技术服务提供者还应当启动增强性告知程序,充分发挥告知规则在个人信息保护中的风险交流作用。具体来看,除个人信息处理的范畴、类型、目的和必要性等基本内容之外,还应就以下内容进行补充告知:首先,算法逻辑。这要求生成式人工智能技术服务提供者就个人信息与模型训练的相关性进行说明,包括“人机对话即信息收集”这一事实以及个人信息的准确性将影响生成内容质量这些重要事项,以为用户进行风险判断提供指引。其次,次级处理者的名称、处理目的、期限、方式等相关内容。以OpenAI为代表的生成式人工智能技术服务提供方将其全部或部分处理活动委托给次级处理者,而用户并没有与这些第三方订立任何信息处理协议,这可能会给个人信息保护带来超出预期的风险。因此,在评估确认风险等级较高的情况下,生成式人工智能技术服务提供者应当向信息主体详细披露次级处理者的信息处理情况,使信息主体能够全面了解风险和后果,从而做出决策。
(二)推进最小必要原则的风险化解释