工程可信赖的机器学习运维——基于零知识证明

摘要 — 随着人工智能（AI）系统，尤其是基于机器学习（ML）的系统，逐渐成为关键领域中的核心组成部分，其概率性和不透明性给传统的验证与确认方法带来了重大挑战。这些挑战在受监管领域尤为突出，这些领域需要防篡改且可审计的证据，正如欧盟《人工智能法案》（EU AI Act）等相关法律框架所强调的那样。相较之下，零知识证明（Zero-Knowledge Proofs, ZKPs）作为一种密码学解决方案，使证明者能够通过经过验证的计算过程，证明其满足特定要求，而无需泄露敏感的模型细节或数据。

通过对零知识证明协议的系统综述，我们识别了五个关键属性（非交互性、透明设置、标准表示、简洁性以及抗量子安全性），这些属性对于其在AI验证与确认流程中的应用至关重要。随后，我们基于团队数据科学流程（Team Data Science Process, TDSP）模型的适应版本（包括数据与预处理、训练与离线指标、推理以及在线指标阶段），对基于ZKP的机器学习应用进行了后续的系统性综述，详细阐述了验证目标、机器学习模型及所采用的协议。

我们的研究结果表明，当前基于ZKP增强的机器学习研究主要集中在推理验证阶段，而数据预处理和训练阶段尚未得到充分探索。值得注意的是，我们的分析发现该研究领域正显著趋向于统一零知识机器学习运维框架（Zero-Knowledge Machine Learning Operations, ZKMLOps）的发展。该新兴框架利用零知识证明，提供正确性、完整性和隐私性的强大密码学保障，从而推动可信AI原则下更高水平的问责制、透明度与合规性。 关键词 — 验证与确认，机器学习，人工智能，零知识证明。

1 引言

人工智能（AI）软件已成为众多应用中的关键组成部分，涵盖从自动驾驶[1]、医疗诊断[2]，到金融决策和公共服务自动化[3]等领域。AI技术的快速发展和广泛应用带来了深远的利益，同时也引发了关于可靠性、安全性与伦理等方面的重大挑战。随着AI系统在高风险领域影响力的日益增强，确保其可信性和稳健性变得至关重要[4]。建立信任的关键流程之一是软件的验证与确认，旨在证明软件系统满足其声明的属性，并能在现实操作条件下如预期般运行[5]。传统的软件验证与确认主要依赖测试、静态分析以及基于文档的流程，如性能报告、外部审计和模型卡[6]。虽然这些方法在传统软件中已被证明有效，但在应用于尤其是基于机器学习（ML）的AI系统时面临显著局限。ML模型本质上具有概率性、依赖数据且常常是黑箱的，这给正确性和合规性的评估带来了复杂性。此外，将ML模型作为服务（Machine Learning as a Service, MLaaS）进行部署[7]时，模型内部细节对外部验证者不可见，这种黑箱特性限制了直接检查，并使得验证所声明的模型是否被实际用于推理，或报告的性能指标是否真实反映部署系统行为变得复杂[8]。因此，传统的验证方法难以提供客观且防篡改的证据，削弱了问责性和信任度，特别是在需要明确且可审计验证证据的受监管领域，这一点在近期法规如欧盟AI法案（EU AI Act）中被强调[9]。一种有希望提升验证透明度与客观性的方法是采用零知识证明（Zero-Knowledge Proofs, ZKPs）[10]。ZKP是一种密码学协议，允许一方（证明者）向另一方（验证者）证明某项计算正确执行，而无需验证者重新运行计算或获取敏感内部信息。ZKP最初用于可验证计算领域，近年来逐渐应用于机器学习，例如通过ZKP证明推理步骤确实使用了声明的模型正确执行，而无需透露模型内部参数或输入数据[11]。本工作聚焦于评估将ZKP应用于更广泛的可信AI软件验证与确认的MLOps生命周期的可行性。通过将ZKP嵌入AI软件工作流，可以生成防篡改且密码学可验证的证据，证明计算符合声明的规范和要求，同时不泄露诸如专有模型权重或训练数据等敏感信息。这一方法使得外部审计人员、客户或监管者能够在尊重知识产权的前提下，独立验证AI软件的运行。总结而言，本工作的核心贡献包括：(a) 对ZKP协议的系统综述，强调五个关键属性（非交互性、透明设置、标准表示、简洁性及抗量子安全性），使其适合集成于AI系统的验证与确认流程；(b) 基于TDSP模型[12]各阶段的结构化分析ZKP增强的机器学习应用，详细说明每个应用的验证目标、所用ML模型及ZKP协议；(c) 探讨ZKP与机器学习技术在向统一的可信AI零知识机器学习运维（Zero-Knowledge Machine Learning Operations, ZKMLOps）验证框架发展的趋势，指出研究动态与未来方向。本文其余部分安排如下：第2节介绍可信AI、AI软件验证与确认以及零知识证明的背景知识；第4节描述研究方法；第5节系统综述ZKP协议，识别其五大关键属性；第6节系统综述ZKP增强的机器学习应用，展示该领域向统一ZKMLOps框架的收敛；第7节讨论未来研究方向与扩展机会；第8节总结全文，强调主要研究成果。