名称:首先,可能是中间名和姓。
我很好奇您可以使用公开可用的数据集从名字中挖掘出多少信息。我知道,使用美国人口普查数据,您可以在低高概率(取决于输入)之间的任意位置获得以下信息:1)性别。2)比赛。
例如,Facebook正是利用这一点准确地找到了其网站用户的种族分布(https://www.facebook.com/note.php?note_id=205925658858)。
还有什么可以开采的?我没有在寻找任何具体的问题,这是一个非常开放的问题,可以缓解我的好奇心。
我的示例是特定于美国的,因此我们假设该名称是位于美国的某人的名字;但是,如果有人知道其他国家/地区的公开数据集,那么我对他们也很开放。
我不太确定这是否是正确的地方,否则,如果有人可以将我指向一个更合适的地方,我将不胜感激。
我希望这是一个有趣的问题,并且这是合适的地方!