“破坏性”方法：解决保护-效用的另一种方式

roseline371274 · Post by **roseline371274** » Mon Mar 24, 2025 5:51 am

最后，在实施方面，通常的白化方法提出了一些技术难题。特别是在二级保密和地理区分下对需要粉饰的盒子的检测可能会特别复杂，特别是当传播是在几个不相互嵌套的地理层面上进行时，例如 IRIS、QPV 或每边 200 米的方块。

为了克服这些限制，INSEE 现在使用一套新的方法来保护统计机密性，称为“破坏性”方法：这些方法不是将某些框白化，而是对原始数据进行轻微的“噪声处理”，即通过（小的）随机扰动稍微修改其中一些（甚至全部）的值。

与白化方法一样，破坏性方法的选择源于数据保护和实用性之间的兼职数据妥协：但白化方法的结果是二元的（保留精确值或白化），而破坏性方法则允许通过或多或少地降低单个数据中包含的信息来完善这种妥协。这种降级必须足以确保数据的保护，同时最大限度地提高数据对公众的有用性（最大限度地减少原始信息的丢失）。

请注意，修改表中的所有框的扰动方法的一个重要优点是可以防止地理分化的风险：由于所有框都（略微）嘈杂，因此在实践中不再可能确定位于几个独立分布的区域交叉点的个体的特征。例如，如果所有统计数据都分发给±3个单位，则两个（或更多）分区的交集泄露少于5个人的某些信息的风险就会变低。