我们正在创建一个网站,该网站将收集用户的位置信息(点)。我们正在探索保护用户位置隐私的技术(例如,用户经常会共享敏感的家庭住址)。我想到的一种选择是在将这些点存储到数据库中之前对其进行混淆或“散列”,从而根本不需要存储这些敏感数据。
我相信我们的基本要求是:
给定单个混淆点,即使给定与该点关联的所有元数据(即假设整个数据库都已损坏),也无法得出(例如)一公里左右的原始点。
给定与同一原始点相对应的任意大的混淆点集,仍然不可能导出原始点。(例如,一种简单的技术是在原始点上添加一个随机向量,但是如果您这样做足够多次,则混淆的点将聚集在原始点周围。)
如果可以保留各种统计属性,那很好,尽管我不知道在此阶段哪些属性很重要。例如,我宁愿混淆点以“自然”方式散布,而不是累积到网格中。但是,隐私比这更重要。