第7章数据发现数据 - 隐私考虑 - 《数据之美 : 解密优雅数据解决方案背后的故事》

隐私考虑

智能系统与那些可以执行“数据发现数据”的其他系统一样，要求非常密切地关注隐私权和保护公民自由。如何构建和部署这些下一代系统，以及如何使用管理策略（包括责任和监督）都值得人们密切关注和热烈讨论。一些核心问题包括：定义什么样的数据需要为可发现性构建索引，如何把这些数据整合在一起（比如，什么是关系？），什么是相关性，应该向谁揭示什么样的相关性，谁可以搜索索引，系统如何对未授权使用进行监视，以及如何检测错误和纠正错误。

幸运的是，基于目录的模型有很多关于加强隐私保护的很好的特征，包括：

·敦促多方之间分享更多的数据被传送更少的信息到更少的地方（卡片目录）所取代。

·可以通过一致的方式，对人们的搜索操作以及找到的结果以日志形式记录下来，这样有助于更好地实施责任制和监督制^[1]。

·不同方之间的信息共享已经减少为只需要分享他们需要知道的东西（通过直分享必须分享的信息使得分享变少了）。

·可以使索引“匿名制”(aonymized)，这意味着无意的暴露甚至是那些索引中数据量很小的元数据的机会也大大降低^[2]。

[1]防篡改的日志记录通常也被称为不可变的审计日志。Markle Foundation在关于国家安全，尤其是非透明的政府系统方面，发表了一篇有趣的论文，可以浏览：http：//www.markle.org/downloadable_assets/nstf_IAL_020906.pdf。

[2]更多关于“匿名制”的目录，可以在Jeff Jonas和John Karat所著的《Emergent Information Technologies and Enabling Policies for Counter-Terrorism》（编辑Robert L.Popp和John Yen，2006年Wiley-IEEE Press出版）的“Anonymized Semantic Directories.A Privacy-Enhancing Architecture for Enterprise Discovery”一章中找到(htp：//www.wiley.com/WileyCDA/WileyTitle/productCd-0471776157.html)。