跳转到主要内容

【隐私保护】Presidio简化了PII匿名化

匿名化的背景和如何构建匿名器

随着GDPR在欧洲实施后的各种法规,正确处理敏感信息,特别是个人身份信息(PII)成为许多公司的要求。在本文中,我们将讨论什么是PII,以及如何在非结构化数据(尤其是文本)中匿名化PII。我们还将演示使用Microsoft Presidio的文本匿名器的示例实现,这是一个提供快速PII识别和匿名模块的开源库。本文分为以下几个部分:

  • 背景:隐私和匿名
  • 现有的匿名技术
  • 使用Microsoft Presidio自定义PII匿名器
  • 结论、链接和参考文献

跳到任何你觉得最有趣的部分!

背景

早在19世纪50年代,数据保护和隐私保护技术就已被研究和应用,当时美国人口普查局开始从公开的美国公民人口普查数据中删除个人数据。自从早期使用诸如添加随机噪声或聚合之类的简单技术以来,已经提出并改进了各种模型。隐私权是一项基本人权。根据字典的定义,它是

个人或群体将自己或关于自己的信息隐藏起来,从而有选择地表达自己的能力。