热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
我们为什么在我们的FHE堆栈中选择了电路引导(CBS)而不是可编程引导(PBS)

7月22日 01:23
@sunscreentech 和其他 FHE 公司之间的主要区别之一是我们在技术栈中选择了电路引导(CBS)而不是可编程引导(PBS)。以下是我们这样做的原因 👇🧵
首先,引导是什么?
引导是 FHE 方案中最复杂且计算密集的组成部分。它是一种技术,允许对密文进行刷新,实质上减少同态操作中累积的噪声,从而使进一步的计算成为可能。
可编程引导(由 @zama_fhe 使用)在单一步骤中刷新噪声并评估查找表。它以 LWE 密文作为输入,返回一个新的 LWE 密文,准备进行下一个查找。每次引导的延迟较低,因此在孤立的门上看起来很有吸引力。其权衡是顺序依赖。真实程序需要一系列引导,而这些操作之间的线性依赖意味着计算无法并行运行。这使得大多数计算资源(核心)处于闲置状态。
电路引导(由 @sunscreentech 使用)遵循不同的路径。引导仍然消耗 LWE 密文,但输出是专门为 CMUX 操作设计的 GGSW “选择器”。每个 CMUX 的成本远低于引导,并且由于 CMUX 树是极其并行的,它们可以在需要另一个昂贵的引导操作之前有效地分配到许多计算资源中。这种依赖结构的变化是决定性的;它使我们的运行时能够充分利用今天的多核 CPU 和 GPU,并且能够清晰地映射到即将到来的 FHE 加速器上。
CMUX 是计算硬件中广泛使用的基础,因此我们可以利用数十年的工作来实现简单 CMUX 部件的通用计算。PBS 电路通常需要针对负循环索引、LUT 填充和格式转换进行定制处理,这些都会减慢迭代并增加错误的表面面积。然而,请注意,如果您简单地使用 tfhe-rs 的默认参数,它几乎可以抽象掉 PBS 的所有这些工作。
随着工作负载的扩展,数据重用变得重要。一个 CBS 产生的 GGSW 选择器可以驱动多个 CMUX,从而在广泛的子电路中摊销昂贵的步骤。PBS 不提供可比的重用;每个新门都会产生一个新的引导。
当我们对完整的 16 位和 32 位算术进行基准测试时,CBS-CMUX 管道始终以更少的顺序引导和更高的整体吞吐量执行。随着核心数量的增加,这些增益会扩大,并且与我们的长期硬件路线图保持一致。
对于我们的团队 @sunscreentech,CBS 提供了正确的平衡:可预测的并行性、更清晰的计算故事,以及随着硬件改进而提升的性能曲线,而不是在顺序瓶颈面前停滞。这就是为什么 CBS 是我们技术栈的基础,以及我们为什么继续加大对其生态系统的投入。
944
热门
排行
收藏