量子计算核心：量子测量、编码与读出技术原理与实践

张

张建站

2026/5/24 7:31:12

10分钟阅读

1. 量子测量从原理到实践的核心桥梁在量子计算的世界里无论算法多么精妙最终我们都需要一个窗口来窥探量子系统的内部状态并将那抽象的、概率性的量子信息转化为我们熟悉的、确定的经典比特。这个窗口就是量子测量。它远不止是计算流程的最后一步而是连接量子世界与经典世界的核心桥梁其效率与精度直接决定了量子算法的实际效能。无论是量子化学模拟中计算分子的基态能量还是量子机器学习中从量子态中提取分类结果都离不开对量子态的“读取”操作。量子测量的本质是对量子系统施加一个特定的“提问”并根据量子力学的概率规则得到一个“答案”。这个“提问”由一组测量算符定义。最基础的是投影测量它对应一组正交投影算符。例如对单个量子比特在计算基 {|0⟩, |1⟩} 下测量就是询问它“你是0还是1”。测量后量子态会以概率 |⟨0|ψ⟩|² 坍缩到 |0⟩或以概率 |⟨1|ψ⟩|² 坍缩到 |1⟩。然而投影测量是一种“非黑即白”的强干扰测量一旦实施原始量子态的相干性就被彻底破坏。为了更灵活地获取信息我们引入了正算子值测度。POVM 由一组正算符 {E_i} 构成满足 ∑_i E_i I单位矩阵。每个 E_i 对应一个可能的测量结果。对于一个量子态 ρ得到结果 i 的概率是 Pr(i) Tr(ρ E_i)。POVM 的强大之处在于它的测量算符不必正交这意味着我们可以设计出比投影测量更精细、信息获取效率更高甚至对系统扰动更小的测量方案。实际上投影测量是 POVM 的一个特例当 E_i 是正交投影算符时。注意在真实实验中我们无法通过单次测量就精确获知概率幅 a₁。假设我们要从单比特态 |ψ⟩ a₁|0⟩ a₂|1⟩ 中提取 a₁ 的信息我们会对该态制备 K 个完全相同的副本并对每个副本独立进行投影测量 Π₁ |0⟩⟨0|。每次测量得到一个二进制随机变量 V_i它服从伯努利分布 Ber(a₁)即 Pr(V_i1)|a₁|²。我们通过统计 K 次测量中结果为1的频率 ā₁ (∑ V_i)/K 来估计 |a₁|²。根据大数定律当 K→∞ 时ā₁ 会收敛到真实概率 |a₁|²。但在现实中K 总是有限的这必然引入统计误差其大小约为 1/√K。因此提高测量精度需要付出样本数量平方倍增长的成本这是量子读出中一个根本性的效率瓶颈。1.1 量子读入将经典世界“翻译”成量子语言量子读入或称量子编码是将经典数据如图像、文本、向量转化为量子计算机可操作的量子态的过程。这是利用量子算法解决经典问题的第一步其效率直接影响整个流程的可行性。一个低效的编码过程可能完全抵消量子算法本身带来的加速优势。下面介绍几种主流的编码方案它们各有优劣适用于不同的场景。1.1.1 基编码最直观的比特映射基编码是最直接的方法。给定一个长度为 N 的经典二进制向量x (x₀, x₁, ..., x_{N-1})我们将其直接映射到一个 N 量子比特的计算基态上 |ψ⟩ |x₀, x₁, ..., x_{N-1}⟩。例如整数 6 的二进制是 (1,1,0)对应的量子态就是 |110⟩。实操要点制备这个态非常简单。我们从全 |0⟩ 态 |0⟩^⊗N 开始遍历向量的每一位。如果第 i 位 x_i 1就在对应的第 i 个量子比特上施加一个 X 门泡利-X 门作用相当于经典的非门如果 x_i 0则什么都不做。整个操作可以表示为|ψ⟩ ⊗_{i0}^{N-1} X^{x_i} |0⟩^⊗N。优势与局限优势电路深度极浅通常只需一层并行 X 门易于在近期的含噪声中等规模量子设备上实现。局限数据表示效率极低。要编码一个 N 维的二进制向量就需要 N 个量子比特。对于高维数据所需的量子比特数将线性增长这对于量子比特仍是稀缺资源的当下是个巨大挑战。1.1.2 振幅编码指数压缩的威力振幅编码是量子优势的典型体现。它将一个长度为 2^N 的复向量x (x₀, x₁, ..., x_{2^N-1}) 编码到一个 N 量子比特态的振幅中 |ψ⟩ Σ_{i0}^{2^N-1} (x_i / ||x||₂) |i⟩。其中||x||₂ 是向量的 L2 范数归一化保证了 Σ |振幅|² 1。核心价值它实现了数据的指数压缩。仅用 N 个量子比特就能表示一个 2^N 维的经典向量。这对于处理机器学习中的高维特征向量或大型数据集具有巨大潜力。实操难点与方案难点在于制备这样的态并非易事。我们需要找到一个酉变换 U使得 U|0⟩^⊗N |ψ⟩。对于任意的归一化向量构造对应的 U 通常需要复杂的量子电路其深度可能随数据维度指数增长。一个常见的简化方案是当向量维度较小时例如2维可以使用单比特旋转门。例如编码向量 (x₀, x₁)我们可以使用 RY(θ) 门其中 θ 2 arccos(x₀)作用于 |0⟩ 态RY(θ)|0⟩ cos(θ/2)|0⟩ sin(θ/2)|1⟩。通过设置 cos(θ/2) x₀即可实现编码。对于高维情况则需要用到更复杂的状态制备算法如基于二叉树的递归方法或使用量子随机存取内存。实操心得振幅编码虽然理论上高效但在当前硬件上实现通用、高保真度的振幅编码是主要挑战。通常我们只对具有特定结构如可快速傅里叶变换的数据才能设计出高效的制备电路。在近期应用中更常使用的是下面介绍的角度编码。1.1.3 角度编码在效率与可行性间折衷角度编码是一种在资源消耗和实现难度之间取得平衡的流行方案。它将一个 N 维的实向量x (x₀, x₁, ..., x_{N-1}) 的每个分量编码到 N 个独立量子比特的旋转门角度中 |ψ⟩ ⊗_{i0}^{N-1} R_σ(x_i) |0⟩^⊗N。这里σ 可以是泡利 X, Y, Z 中的任何一个R_σ(θ) exp(-iθσ/2) 是对应的旋转门。操作细节通常我们会将数据值 x_i 缩放归一化到区间 [0, π) 或 [-π, π) 内因为旋转门是 2π 周期的超出此范围的角度是冗余的。例如使用 RY 门进行编码|ψ⟩ RY(x₀)|0⟩ ⊗ RY(x₁)|0⟩ ⊗ ... ⊗ RY(x_{N-1})|0⟩。核心优势线性资源编码一个 N 维向量需要 N 个量子比特和 N 个单比特门电路深度为常数如果并行执行资源消耗是可管理的。内置非线性这是角度编码在量子机器学习中备受青睐的关键。旋转门本身包含了正弦和余弦函数。当后续的量子电路对这些编码后的量子比特进行纠缠操作时数据分量之间会通过量子干涉产生复杂的非线性相互作用。这为模型提供了强大的非线性表达能力无需像经典神经网络那样显式引入激活函数。1.1.4 量子随机存取内存量子数据的“硬盘”上述编码方法一次通常只处理一个数据样本。但在机器学习中我们经常需要处理整个数据集 D {x^(j)}。QRAM 的概念应运而生它类似于经典 RAM允许我们按地址“查询”存储在量子叠加态中的数据。工作原理假设有 M 个数据样本每个样本x^(j) 已通过某种方式如振幅编码制备成了量子态 |x^(j)⟩_d下标 d 表示数据寄存器。准备一个地址寄存器包含 N_a ⌈log₂(M)⌉ 个量子比特。这个寄存器可以处于叠加。QRAM 操作的目标是构建如下纠缠态 |D⟩ (1/√M) Σ_{j0}^{M-1} |j⟩_a ⊗ |x^(j)⟩_d。这里|j⟩_a 是地址寄存器的基态|x^(j)⟩_d 是对应的数据态。价值与挑战价值当地址寄存器处于叠加态 (1/√M) Σ_j |j⟩_a 时一次 QRAM 查询操作就能同时访问所有 M 个数据样本的量子态实现数据的量子并行加载。这对于诸如量子最近邻搜索等算法至关重要。挑战物理实现一个大规模、容错的 QRAM 是量子计算领域的重大挑战之一。它需要大量量子比特和复杂的受控操作在当前技术下难以实现。因此许多算法论文将 QRAM 的存在视为一种“黑盒”假设。1.2 量子读出从量子态中高效“榨取”信息量子读出是量子读入的逆过程负责将量子计算的结果一个量子态转换回经典信息。根据我们需要信息的完整程度读出协议可分为两大类。1.2.1 全信息读出量子态层析全信息读出的目标是完整地重建未知量子态的密度矩阵 ρ。这就是量子态层析。对于一个 N 量子比特的态其密度矩阵有约 4^N 个独立实参数。因此QST 需要指数级多的测量副本通常只适用于小规模系统N 10。核心方法测量在多个不同的测量基下对量子态的多个副本进行测量。最常用的是泡利测量基。对于一个 N 量子比特系统我们需要测量所有可能的泡利字符串 {I, X, Y, Z}^⊗N 的期望值。总共有 3^N 种非平凡的组合忽略全局的 I⊗N。重建根据测量得到的频率统计通过算法重建密度矩阵。线性反转最直接的方法。将测量方程 Tr(ρ P_i) m_i (m_i 为测量估计值) 视为线性方程组直接求解 ρ。但这种方法不保证重建出的矩阵是物理的即半正定、迹为1。最大似然估计更稳健的方法。寻找一个物理的密度矩阵 ρ‘使得观测到当前测量数据的似然概率 L(ρ’) Π_i [Tr(ρ‘ E_i)]^{n_i} 最大n_i 是结果 i 出现的次数。这转化为一个带约束半正定、迹为1的凸优化问题计算量更大但结果更可靠。避坑指南对于线性反转法当测量数据存在统计噪声时重建出的矩阵特征值可能为负这是非物理的。在实际科研中对于至关重要的态表征MLE 是更标准的选择。可以使用像Qutip或Forest这样的量子计算软件包中内置的 MLE 例程。1.2.2 部分信息读出面向任务的高效提取对于大多数应用我们并不需要完整的密度矩阵而只关心某些特定的属性。部分信息读出协议因此更具实用价值。1. 采样这是最简单、最常用的读出方式。将最终量子态在计算基下进行多次测量每次测量得到一个经典的比特串如 “01011”。通过大量采样我们可以估计出量子态在计算基下的概率分布 Pr(i) |⟨i|ψ⟩|²。应用场景优化问题在量子近似优化算法中最终的量子态编码了优化问题的解的概率分布。通过采样我们可以高概率地得到最优或近似最优的比特串解。生成模型量子态本身可以表示一个复杂的概率分布。采样从这个分布中抽取样本可用于生成式任务。算法验证通过对比采样得到的分布与理论预期可以验证量子电路是否正确执行。2. 期望值估计在量子化学、量子多体物理和许多量子机器学习模型中最终输出往往是一个或多个可观测量 O 的期望值 ⟨O⟩ Tr(ρ O)。可观测量是厄米算符通常可以分解为泡利字符串的线性组合O Σ_i α_i P_i其中 P_i 是形如 X⊗Y⊗Z⊗I... 的张量积。操作步骤分解将目标可观测量 O 分解为泡利字符串的求和。测量对于每一个泡利项 P_i我们需要在它的本征基下测量量子态。例如对于 Z 项直接在计算基Z 基下测量即可。对于 X 项需要在测量前对对应量子比特施加一个哈达玛门 H将 X 基旋转到 Z 基。对于 Y 项需要先施加 S† 门再施加 H 门。估计对每个 P_i 进行多次测量用测量结果的平均值来估计 ⟨P_i⟩。最终⟨O⟩ 的估计值为 Σ_i α_i ⟨P_i⟩。效率考量如果 O 包含大量泡利项则需要大量不同的测量设置。通过泡利分组技术可以将可对易的泡利项安排在同一次测量中完成显著减少测量轮数。3. 影子层析可扩展的经典阴影影子层析是近年来革命性的部分信息读出框架。它的目标不是重建整个态而是为了能够后续预测多个甚至指数个观测量 {O_i} 的期望值且所需量子态副本数仅与观测量数目 M 的多项式对数相关而不是与希尔伯特空间维度相关。经典阴影协议的核心三步随机测量对待测量子态 ρ 的单个副本随机选择一个酉变换 U通常从某个集合中随机选取如随机泡利测量或随机 Clifford 测量作用到态上得到 UρU†。然后在计算基下测量这个变换后的态得到一个经典比特串 |b⟩。构建经典阴影对每个这样的测量结果我们计算其“逆通道”作用后的状态M^{-1}(U†|b⟩⟨b|U)。这里 M 是平均测量通道的逆。这个状态一个厄米矩阵就是该次测量对应的一个“影子”。重复 T 次得到影子集合 {ρ̂_1, ρ̂_2, ..., ρ̂_T}。预测性质要估计任意观测量 O 的期望值只需计算这些影子的经验平均⟨O⟩est (1/T) Σ{t1}^T Tr(O ρ̂_t)。理论保证当 T 足够大时这个估计是准确的。核心优势样本高效相比于全态层析的指数级开销影子层析只需多项式数量的测量即可预测大量性质。灵活通用一旦获得经典阴影集合就可以用它离线估计任意多个、甚至事后才决定的观测量而无需重新运行量子实验。实用性强协议简单易于在现有硬件上实现已成为近期量子基准测试和误差缓解中的重要工具。1.3 协议选择与实战考量面对众多协议如何选择这完全取决于你的任务和目标硬件。对于量子读入追求近期实现选择角度编码。它资源需求适中能提供非线性且与当前含噪声量子比特的相干时间兼容。是量子机器学习实验的首选。处理经典二进制数据/小规模问题基编码简单可靠。处理高维向量/理论研究考虑振幅编码但必须仔细设计或假设高效的状态制备电路。需要量子并行访问数据集在理论算法中引入QRAM假设但需明确其目前是理论抽象。对于量子读出需要完整态信息如表征小型量子处理器使用量子态层析并优先考虑最大似然估计法。需要比特串解如组合优化直接采样。需要估计某个物理量的期望值如能量、损失函数使用期望值估计并应用泡利分组优化测量次数需要估计多个甚至未知的观测量且系统规模较大采用经典阴影协议。这是目前处理中等规模量子系统信息提取最前沿和实用的技术。硬件误差的影响所有读出协议都假设测量本身是完美的。现实中测量存在读出误差如将 |0⟩ 误判为 |1⟩ 的概率。在分析最终结果的误差时必须将测量误差的传播考虑在内。对于影子层析等协议已有研究开始融入测量误差模型。1.4 常见问题与排查实录在实际操作中从量子设备中读取数据总会遇到各种问题。以下是一些典型场景和解决思路。问题1采样结果与理论模拟偏差巨大。可能原因A量子电路保真度低。电路中的双量子比特门误差、退相干效应会在态制备阶段就引入错误。排查简化电路先运行一个只有编码部分无复杂纠缠的电路看采样分布是否接近预期。使用随机基准测试或层析来标定你的量子处理器的门保真度。可能原因B测量读出错误。这是超导量子比特等平台上的常见问题。排查直接制备并测量 |0⟩^⊗N 和 |1⟩^⊗N 态构建测量误差矩阵。例如制备 |0⟩ 却以一定概率测到 |1|。后续数据分析时可以应用该误差矩阵进行校正测量误差缓解。可能原因C热布局误差。在低温系统中量子比特可能没有很好地初始化为基态 |0⟩而是有一定概率处于激发态 |1⟩。排查进行初始态层析。在算法开始前增加主动复位或更长的弛豫等待时间。问题2期望值估计的统计波动过大。可能原因A测量次数不足。根据统计学估计值的标准误差与 1/√M 成正比M为测量次数。解决增加测量次数 M。但需权衡时间成本。可以预先设定一个目标精度 ϵ然后估算所需的 M ≈ 1/ϵ²。可能原因B可观测量 O 的方差过大。即使测量次数足够如果 O 本身在量子态上的方差 Var(O) 很大统计波动也会很大。解决检查 O 的分解。如果某些泡利项 P_i 的系数 α_i 很大但对应的 ⟨P_i⟩ 值很小会导致信噪比低。考虑是否可以通过变换问题形式来选择一个方差更小的可观测量。问题3使用经典阴影时预测不同观测量的精度差异很大。可能原因随机测量集合的选择与目标观测量不匹配。经典阴影的误差界与观测量 O 的“影子范数”有关。对于局部观测量随机泡利测量效果很好但对于非局部的观测量如多体纠缠见证者可能需要使用随机 Clifford 测量。解决分析你的目标观测量 {O_i} 的结构。如果它们主要是少体局部的坚持使用随机泡利测量。如果需要预测全局性质考虑切换到随机 Clifford 测量尽管其单次实验的电路深度可能更深。问题4振幅编码的态制备电路深度太深无法在硬件上执行。可能原因使用了通用的、复杂度高的状态制备算法。解决利用数据结构如果你的数据向量具有特殊结构如稀疏性、由某个函数快速生成可以设计定制化的、浅层电路来近似制备该态。变分编译使用一个参数化的量子电路 V(θ)通过经典优化来调整参数 θ使得 V(θ)|0⟩ 尽可能接近目标态 |ψ⟩。这是一种近似方法但电路深度可控。放弃完美编码在许多机器学习任务中对输入数据进行精确的振幅编码并非必需。可以考虑使用角度编码等近似方案或者研究证明在特定任务下近似编码不会影响算法性能。量子读入与读出协议是量子算法落地不可或缺的“翻译官”和“信使”。理解它们的原理、权衡和实操细节是设计高效、可行的量子应用方案的基础。随着硬件进步更高效的编码方案和更稳健的读出技术将持续涌现不断拓宽量子计算解决实际问题的边界。

L2正则化：从防过拟合到抗成员推理攻击的轻量级隐私保护

1. 项目概述：当模型“记住”太多时，隐私便已泄露在机器学习项目的日常开发中，我们常常会为一个指标欢呼雀跃：训练准确率。当一个模型在训练集上达到99%甚至100%的准确率时，我们很容易产生一种“任务已完美解决”的错觉…...

2026/5/24 7:26:36 阅读更多 →

AI/ML研究可重复性危机：厘清概念、构建验证框架与工程实践

1. 项目概述：AI/ML研究中的“可重复性”到底是什么？如果你在AI或机器学习领域做过研究，或者尝试过复现一篇顶会论文的代码，大概率经历过这样的挫败：明明按照论文描述配置了环境、下载了代码和数据，跑出来的…...

2026/5/24 7:26:04 阅读更多 →

GitHub汉化插件：3分钟消除语言障碍，让中文开发者无缝参与全球开源协作

GitHub汉化插件：3分钟消除语言障碍，让中文开发者无缝参与全球开源协作【免费下载链接】github-chinese GitHub 汉化插件，GitHub 中文化界面。 (GitHub Translation To Chinese) 项目地址: https://gitcode.com/gh_mirrors/gi/github-chine…...

2026/5/24 7:25:53 阅读更多 →