自从我在一家名为SmartyStreets的地址验证公司工作以来,这是一个好问题。
首先,邮政地址代表地图上的单个可定位点。地址本身是良性的,因为它没有任何其他信息。在地图上画点不会做任何事情。只有当您开始将CONTEXT分配给该点(地址)时,它才开始具有某种含义。
考虑到这一点,邮政地址可以代表个人,组织,建筑物,汽车等。一旦开始收集多个邮政地址,就可以增加可以从该分组中获得的上下文。可以确定相似性以查看地址的共同点。尽管如此,仅在相似区域中的一组地址并不能表示很多上下文。我可以看一下Google地图,并查看特定区域内的所有房屋。除非我未经授权访问特权信息,否则这不是侵犯隐私。
为了实际放弃任何类型的私有数据,必须组合其他上下文。例如,提交给在线服务以进行地址验证和/或地理编码的一组邮政地址不会泄露信息,除非您知道谁提交了该列表进行处理。一旦知道列表所有者,就可以对列表的预期用途做出某些推断。知道列表所有者和预期用途之类的其他上下文,当然可以视为特权信息,并且可能是侵犯隐私的根源。
可以将处理“内部”进行,这样就不涉及外部数据服务。当然,它不包括对特权信息的任何未经授权的访问。地址验证和地址编码不是初学者的任务,并且当然需要高级技能(即随着时间的流逝而积累的经验),以便处理非常大的列表而不消耗过多的时间和资源。因此,将其引入内部肯定是一种选择,但是每个拥有敏感地址信息的公司是否都有资源在内部进行自己的“安全”地址处理(包括地理编码)?不。(尽管这肯定意味着本网站读者的工作安全。)
有一些方法可以维护必要的隐私并仍然使用在线服务。一种方法是创建一个帐户,测试并弄清所有内容,然后使用一个临时电子邮件地址设置一个新帐户,该帐户具有与信用卡相关联的不相关账单地址,该地址无法追溯到您。从理论上讲,处理此帐户上的地址不会丢失任何有价值的上下文,因此将维护列表中个人的隐私。(这开始听起来像电影《国家大敌》。
如果这听起来复杂且不必要,我同意。一种更简单的方法是利用使用HTTPS和POST并且不存储或记录您处理的任何数据的API。使用HTTPS意味着唯一的记录将是时间戳记以及您从中调用的IP地址。底层的URL是未知的。当然,您使用的帐户会直接返回到您,但这不是问题,因为使用POST请求允许您附加有效负载(在这种情况下为一批地址),并且不记录有效负载的内容。因此,您提交的地址不在任何服务器日志上。而且,它们在每个进程之间的内存都被清除了,这意味着这些地址不会被存储或记录,并且它们的返回是通过安全连接完成的。
13Mar2012 06:31(-6)IP:12.134.223.12 UserID:875564-POST QTY:3439942-[已处理]
查看日志的任何人都只会看到您处理了一些地址,而他们却不知道处理了哪些地址。这甚至可以满足最严格的隐私政策要求。对我而言,指出这种类型的服务可用(并且非常快)而不提及在何处找到它是没有意义的。它已经内置在SmartyStreets的LiveAddress API服务中。其他服务(例如Cdyne,QAS和ServiceObjects)也可能提供类似的服务,但我还没有听说过。