有谁知道一个好的图书馆,可以将一个人的名字映射到他或她的性别?[关闭]


90

我正在寻找一个图书馆或数据库,该图书馆或数据库可以根据一个人的姓名或昵称提供有关该人是男性还是女性的猜测。就像是

john => "M",
mary => "F",
alex => "A", #ambiguous

我正在寻找一种支持英文名称以外的名称(例如日语,印度语等)的东西。

在我再按“您将通过假设他们的性别来冒犯别人”的思路得到另一个答案之前,请先让我弄清楚,我的应用程序不会与任何人进行交互。无论如何,它不会发送电子邮件或与任何人联系。没有用户要问。在许多情况下,相关人员已经死亡,而我仅有的信息是姓名,出生日期和死亡日期。我想知道个人性别的原因是使输出的语法更好,并有助于以后可能出现的搜索。


33
哇...每个人似乎都在回答“我应该做这个”这个问题,而不是问“我该怎么做?”这个问题。不足为奇,只是很有趣。
bsneeze,2009年

9
我实际上认为这是一个很好的问题。如果您访问某个网站,并且90%的时间都在了解您的性别,那么我会看到好处。我希望我的电视能做同样的事情。我正在观看最近一次飞行中山丘之王的重播,每3分钟就会有一个“个人按摩器”广告。
Uri

6
@mP哇,从猜测性别到使语法更好的方法到种族描述的方法。
Chas。欧文斯(Owens)

2
没错,这不是人们不想因为道德的事情而给你的东西,就像一开始就没有任何意义,所以你在寻求失败的解决方案。另外,您提到的不是英文名称,在跨文化参考中,它变得更加复杂。对我来说,这是不行的。
zalew

2
你怎么知道一个名字是男是女?亚历克斯可能是亚历山大(男性)或亚历山大(女性)的简称。我认识一位男弥迦女。那外国名字呢?
加布

Answers:


66

在一般情况下,名称的性别是无法通过程序推断的。您需要一个名称数据库。这是美国人口普查局提供的免费名称数据库

编辑:2010年名称的链接已死,但注释中有可用的链接和一个库。


2
这很棒。似乎正是要求者所需要的。模棱两可的名字可能会根据男性的频率对女性的频率来猜测性别。
stalepretzel

1
我使用人口普查数据为此建立了一个库,效果很好!潜在应用:分析,IVR语音性别选择。
克里斯·麦考尔

9
这是名称->来自人口普查数据的性别,如python dict:raw.github.com/Bemmu/gender-from-name/master/gender.py
Bemmu 2012年

3
原始链接已死,但人口普查仍保留该列表。特定于1990年代的版本(我不知道为什么)在这里:census.gov/genealogy/www/data/1990surnames/names_files.html
Chipmonkey

2
美国22MB的婴儿名字(按性别):ssa.gov/oact/babynames/limits.html (链接于2015
Dylan Hogg

70

sex.c是一个出色的开源 C程序。它包含来自世界各地的44568个名字的数据。有很好的文档和文件格式的描述(基本上是纯文本),因此从您自己的应用程序中读取它应该不难。

这是作者说的:

关于数据质量的几句话

精心准备的名字字典。例如,该词典中的土耳其语,印度语和韩语名称均已由数位以英语为母语的人独立分类。我还特别注意仅列出当前可以找到的那些名称。

从中得到的教训?

任何修改都应该非常谨慎地进行(并且还必须遵守搜索算法所需的排序)。例如,在知道“ Sascha”在德国是一个男孩的名字之后,作者从未假设英语的“ Sasha”是一个女孩的名字。知道“ Jan”在德国是一个男孩的名字,所以我从未想过它也是“ Janet”的英文缩写。另一个恰当的例子是名称“ Esra”。在德国,这是一个男孩的名字,在土耳其,这是一个女孩的名字。

该程序计算出该名称为男性或女性的概率。可以仅使用名称作为输入,也可以使用名称和原产国来完成此操作,从而获得更好的结果。

您可以从德国计算机杂志c't 40 000 Namen的网站下载该文件 。本文以德语提供,但请放心,所有文档均为英语。如果您对本文不感兴趣,则这里是直接的ftp链接0717-182.zip。压缩文件包含源代码,Windows可执行文件,数据库和文档。


太好了,谢谢。
Dale Athanasias


33

“我告诉你,一个叫'苏'的男孩的生活并不容易。”

...所以,为什么要加倍努力呢?如果您需要了解性别,请询问...否则,不必担心。


15
@Chas:即使您成功地在80%的时间做到了正确,这仍然会激怒每十个人中有两个使用您的软件。不太好...我理解这种动机,但是您最好改写您的信息,使其与性别无关。
Shog9,2009年

2
我想知道是否还有其他人记得SNL的“拍子”。
埃里克森(Erickson),2009年

8
再读一遍,我的讲道糟透了。。。不是要放下您的想法,我认为这是一个有趣的想法,但是也很冒险。我曾经担任电话推销员,无论您知道多少个名字,即使您甚至在识别声音方面也很出色,有时您仍然最终会猜错……这从来都不是一件有趣的事。因此,这是我要避免的事情,除非能够正确地猜测出一个巨大的回报。
Shog9,2009年

3
我会接受Shog9的建议。除非你的应用程序将是英语以外的其他语言中,它可能更容易只使用中性代词-例如他们,一,她/他,等
卡尔文

11
我女友的名字叫凯文。她让足够多的人从名字中错误地猜出自己的性别,她不需要计算机也能做到这一点。要提防的是创建一个数据库条目,该条目根据计算机的猜测说明某人的性别。看到这些的人可能会认为它是由他自己提供的,并且当他们的假设被证明是错误的时候就会感到非常困惑(而不是仅仅基于名称而感到困惑)。
布赖恩·坎贝尔

29

我建立了一个免费的API,可以根据名字对性别进行概率猜测。我没有使用任何上述方法,而是使用了来自社交网络的庞大的个人资料数据集来提供概率猜测以及确定性因素。它还支持通过国家或语言ID进行可选过滤。随着更多的配置文件添加到数据集,它一天比一天好。

可在http://genderize.io免费使用

您应该考虑的件事是使用一种将人口统计因素考虑在内的工具,因为命名约定将严重依赖于此。

http://api.genderize.io?name=kim
{"name":"kim","gender":"female","probability":"0.89","count":1440}

http://api.genderize.io?name=kim&country_id=dk
{"name":"kim","gender":"male","probability":"0.95","count":44,"country_id":"dk"}


22

这是两种可能甚至无法奏效的怪异方法,并且在不违反许可条款的情况下可能无法大规模奏效:

  1. 使用Facebook API(我几乎一无所知,甚至可能无法做到)执行两次搜索:一次搜索具有该名字的FB男性用户,一次搜索女性。使用这两个数字来确定性别的可能性。

  2. 松散得多,但更具可扩展性,请使用Google API并搜索名称以及特定于性别的代词,然后比较数字。例如,有592,000,000个搜索“ Richard his”的结果(不是词组),而只有179,000,000个搜索“ Richard her”的结果。


除了关于让软件尝试从名字中猜测性爱等普遍共识外,这实际上是对原始问题的很酷的算法答案。做得好。
peSHIr

好想法。您可能还可以使用给定国家/地区的语言来输入一些字词以进行本地化。
Nosredna,2009年

很好,Nosrenda ...当然,Google还允许您已经通过语言代码过滤搜索结果。您甚至可以从HTTP请求中窃取用户的首选语言。他们的浏览器语言设置可能与其名称的种族不匹配,但这仍然是一种模糊的技术。
richardtallent

2
我发现Google是沙文主义者:男性返回的结果比女性多,因为Google中的男性人数更多。Facebook API可能更具代表性。
克里斯·麦考尔

6

考虑到您所说的限制,最好的选择是重新编写您所写的性别中性词,除非您知道每种情况下都想称其为哪种性别。

如果使用英语写作,请记住单数形式的“ they”在语法上可以作为性别中立的第三人称单数代词。

这个问题的标题就是一个很好的例子。目前是:

    ……将一个人的名字映射到他或她的性别上?

如果写成这样,那会不太尴尬:

    ……将一个人的名字映射到他们的性别上?

这不是完全“完全”的语法。甚至Wikipedia文章也承认,由于某些作者对通用“他”不满意,特别是在现代语境中使用了它。对于这样做的作者,我没有什么大问题(尽管如果性别中立确实很重要,我更喜欢改写结构,以便可以使用“一个”之类的代词),但我们称之为它。
本·柯林斯

我认为我们都是对的。所有语法,特别是英语语法,都有很大的问题。但是我想说的是,任何适用于英语的“完美语法”的定义在这里也适用。单数的“他们”完全是语法上的,或者英语什么都不是:-)
bignose

值得注意的是,一段时间以来,语法女孩(作者Mignon Fogarty)一直倾向于接受单数的“他们”。 grammar.quickanddirtytips.com/…–
卡伦·洛佩兹

4

假设用户必须是男性还是女性,也是一种不好的做法。有少数但非常多的“双性恋”人,其中大多数人对没有框打钩而
心烦。.bignose:在“单数”上很有趣。我不知道它有这么悠久的历史。



4

python软件包SexMachine将为您完成此任务。给出任何名字,无论是男性,女性还是男女通用都将返回。它依赖于Jorg Michael 的sex.c程序中的数据。


3

尝试使它自动化的唯一好处就是一堆不满意的用户。根据人口普查数据:

詹姆斯,约翰,罗伯特,迈克尔,威廉,大卫,理查德,查尔斯,约瑟夫,托马斯,克里斯托弗,丹尼尔,保罗,马克,唐纳德,乔治,肯尼特,史蒂芬,爱德华,布莱恩,罗纳德,安东尼,安东尼,凯文,杰森,马修,加里,蒂莫斯,约瑟,拉里,杰弗里,弗兰克,斯科特,埃里克,斯蒂芬,安德鲁,雷蒙德,格里高里,约书亚,杰里,丹尼斯,沃尔特,帕特里克,彼得,哈罗德,亨利,卡尔,阿瑟,瑞恩,乔,胡安,杰克,阿尔伯特,贾斯汀,特里,杰拉德,基思,萨穆尔,威尔利,劳伦斯,罗伊,布兰登,亚当,弗雷德,比利,路易,杰里米,亚伦,兰迪,欧根妮,卡洛斯,罗素,鲍比,维克托,马丁,杰西,肖恩,克拉伦斯,西恩,克里斯,约翰尼,吉米,安东尼,托尼,路易斯,迈克,戴尔,库蒂斯,诺曼,艾伦,格伦,特拉维斯,李,梅尔文,凯尔,弗朗西斯,耶稣,雷,乔尔,爱迪,特洛伊,亚历山大,马里奥,弗朗西斯科,米歇尔,奥斯卡,杰伊,亚历克斯,乔恩,朗尼,汤米,里昂,利奥,韦斯利,迪恩,丹,刘易斯,科雷,莫里斯,弗农,罗伯托,克莱德,沙恩,萨姆,莱斯特,查理,泰勒,吉恩,布雷特,天使,莱斯利,塞西尔,安德烈,埃尔默,加布里埃尔,米切尔,阿德良,卡尔,科里,克劳德,杰米,杰西,克里斯蒂安,隆妮,科迪,朱利奥,凯利,吉米,乔丹,贾梅,卡西,约翰尼,悉尼,朱利安,达里尔,维尔京,马歇尔,佩里,玛丽安,崔西,雷恩,弗雷迪,奥斯丁,杰基,乔伊,埃文,丹娜,唐妮,香农,安格洛,肖恩,林恩,卡梅伦,布莱克,凯里,让,IRA,鲁迪,贝尼,罗宾,洛伦,诺埃尔,德文,金,瓜达卢佩,卡罗尔,萨米,马蒂,泰勒,埃利斯,达拉斯,劳伦斯, DREW,JODY,FRANKIE,PAT,MERLE,TERRELL,DARRNELL,TOMMIE,TOBY,VAN,COURTNEY,JAN,CARY,SANTOS,AUBREY,MORGAN,LOUIE,STACY,MICAH,BILLIE,LOGAN,DEMETRIUS,ROBBIE,KENDALL,ROYCE,米奇,德文,阿什莉,凯莉,儿子,马林,阿里,萨米,米歇尔,罗里,克里斯,艾薇莉,阿莱克西斯,格里,史黛西,卡门,谢尔比,克里基,波比,奥利,丹尼,狄翁,奥德尔,玛丽,科尔比,霍利斯,基比,克鲁兹,梅里尔,兰恩,克莱奥,布莱尔,数字,克莱尔,伯尼,琼,多米尼克,特里斯坦,杰米,大拉韦尔内,阿尔瓦,史蒂芬,埃林,奥古斯丁,杨,约翰尼,阿里尔,达斯蒂,林赛,崔西,斯科蒂,桑迪,悉尼,盖尔,多里安,拉韦恩,纳斯达克,象牙,安德里亚,桑,迪恩,卡罗尔,永,浆果,特里尼达,雪莉,玛丽亚,张,罗萨里奥,丹妮,弗朗西斯,清,康尼,托里,卢佩,迪,宋,智,奎恩,米恩,西奥,卢,钟,华伦,杰米,惠特尼,索尔,钟,巴黎, OTHA,LACY,DONG,安东尼,KELLEY,CARROL,SHAYNE,VAL,JUDE,BRITT,HONG,LEIGH,GAYLE,JAE,NICKY,LESLEY,MAN,KASEY,JEWELL,PATRICIA,LAUREN,ELISHA,MICHAL,LINDSAY和JEWEEL克莱恩,伯尼,琼,多米尼克,特里斯坦,贾梅,加勒,拉韦尔内,阿尔瓦,史蒂芬,埃林,奥古斯丁,杨,珍妮,阿里尔,达斯蒂,林赛,崔西,斯科蒂,桑迪,悉尼,盖尔,多里安,拉韦恩,REFUGIO,象牙,安德里亚,桑,狄恩,卡罗尔,容,贝里,特里尼达,雪莉,玛丽亚,张,罗萨里奥,丹妮,弗朗西斯,唐,康妮,托利,卢佩,迪,宋,智,奎恩,米恩,西奥,卢,钟,华伦,杰米,惠特尼,索尔,钟,巴黎,奥塔,莱西,董,安东尼,凯利,卡罗尔,沙恩,瓦尔,裘德,布里特,洪,莱格,盖尔,杰伊,尼基,莱斯利,曼,凯西, JEWELL,PATRICIA,LAUREN,ELISHA,MICHAL,LINDSAY和JEWEL克莱恩,伯尼,琼,多米尼克,特里斯坦,贾梅,加勒,拉韦尔内,阿尔瓦,史蒂芬,埃林,奥古斯丁,杨,珍妮,阿里尔,达斯蒂,林赛,崔西,斯科蒂,桑迪,悉尼,盖尔,多里安,拉韦恩,REFUGIO,象牙,安德里亚,桑,狄恩,卡罗尔,容,贝里,特里尼达,雪莉,玛丽亚,张,罗萨里奥,丹妮,弗朗西斯,唐,康妮,托利,卢佩,迪,宋,智,奎恩,米恩,西奥,卢,钟,华伦,杰米,惠特尼,索尔,钟,巴黎,奥塔,莱西,董,安东尼,凯利,卡罗尔,沙恩,瓦尔,裘德,布里特,洪,莱格,盖尔,杰伊,尼基,莱斯利,曼,凯西, JEWELL,PATRICIA,LAUREN,ELISHA,MICHAL,LINDSAY和JEWEL玛丽亚,常,罗萨里奥,丹妮,弗朗西斯,唐,康尼,托利,卢佩,迪,宋,智,奎恩,米恩,西奥,娄,仲,华伦,杰米,惠特尼,索尔,钟,巴黎,大田,蕾西,董,安东尼,凯利,卡罗尔,沙恩,瓦尔,裘德,布里特,洪,莱格,盖尔,杰,妮基,莱斯利,曼,凯西,杰威尔,帕特里夏,劳伦,伊丽莎,米歇尔,林赛和杰威尔玛丽亚,常,罗萨里奥,丹妮,弗朗西斯,唐,康尼,托利,卢佩,迪,宋,智,奎恩,米恩,西奥,娄,仲,华伦,杰米,惠特尼,索尔,钟,巴黎,大田,蕾西,董,安东尼,凯利,卡罗尔,沙恩,瓦尔,裘德,布里特,洪,雷格,盖尔,杰,妮基,莱斯利,曼,凯西,杰威尔,帕特里夏,劳伦,伊丽莎,米歇尔,林赛和杰威尔

都是对男性和女性都有效的名字。如果一个女孩的名字叫罗伯特(Robert),并且每个人(包括您的软件)一直称呼她为男人,那她会很生气。


25
假设存在一个名为Mark的女孩(随时指出一个女孩)。如果我是她,我会对我的父母而不是对Chas的软件感到恼火……
Darko Z,2009年

6
如果该软件从不称她为男人,而是显示UI的“男性”版本怎么办?还是她与男人聚集在一起用于开发营销抵押品的数据集中?她甚至可能没有注意到。
克里斯·麦考尔

对于许多这些名称,我会根据500-1200个给定名称的Facebook个人资料中的数据获得100%的确定性。 api.genderize.io/?name=robert api.genderize.io/?name=andrew api.genderize.io/?name=john
Stromgren 2014年

3

尽管数据库可能是最实用的解决方案,但是如果您想找点乐子,则可以尝试编写一个使用名称并输出这三个选项(F,M,A)之一的神经网络(或使用神经网络库)。 )。

您可以使用其他答案建议的数据库中存在的数据集以及您拥有的任何其他数据来训练它。

该解决方案将允许您处理以前未专门分类的名称,并且还可以处理其他语言。您可能还希望将语言(如果您知道的话)作为输入传递给神经网络。

我不知道我可以说神经网络(或任何其他机器学习)将很好地进行分类。


3

它取决于文化/地区:以安德里亚(Andrea)为例,意大利人只是男性,瑞典是女性,而安德里亚斯(Andreas)是男性。肖恩在英语中含糊不清。如果一种语言有偏斜(例如拉丁语或俄语),则最终字母将根据语法规则进行更改,

歧义的另一个来源是姓氏与人名相同。

我认为总体上不可能解决。


如果OP具有伴随变量,则该变量指示原产地,出生地,国籍的文化,不管它会有用什么。但是他说,他不是,所以您只需要基于汇总进行统计上合理的猜测即可。
smci

3

这个想法显然不适用于大多数语言。

但是,如果您可以提前告知国籍,那么您可能会有更多的运气。在大多数斯拉夫语中(例如俄语,波兰语,保加利亚语),您可以放心地假设所有以-va -cha -ska结尾的姓(通常-a为女性),而-v -ch -shi则为男性。

实际上,根据姓氏,任何姓氏都有女性化和男性化的形式。但是,其他国家/地区(例如美国)使用的相同名称可能仅使用男性形式。

可以说相同的名字(-a -ya是女性的),但并非100%准确。

但是总的来说,您很难获得足够准确的库。


姓氏是男性还是女性?
Simon_Weaver

2
@Simon_Weaver我父亲的姓是Slavchev,我母亲的姓是Slavcheva。实际上,这是同一个姓氏,无论男女,其拼写都不同。这在奴隶名中很常见。
迪米塔尔·斯拉夫切夫


2

Z目录(在vettrasoft.com上)具有C语言功能,其工作原理如下:

void func()
{
    char c = z_guess_sex_byfirstname ("Lon");
    switch(c)
    {
    case 'M': std::cout << "It's a boy!\n"; break;
    case 'F': std::cout << "It's a girl!\n"; break;
    case 'B': std::cout << "this name is for both sexes\n"; break;
    case '?': std::cout << "sex unknown sorry\n"; break;
    }
}

它是由数据库驱动的,表中的名称大概有10,000多个,但是您需要下载并安装z目录(包括许多其他topo项目,例如国家/地区,地标,机场,州,区号,邮政编码等)以及c ++函数和对象以访问数据)。但是,名称是非常以英语为导向的。该表是一项正在进行中的工作,并逐渐更新。


1

性别名称地图可以使用,但在多文化国家/地区,更像是猜测。我可以举一个例子:波兰语中的玛丽安(Marian)是典型的男性名字,而英国中的相同名字是女性名字。在世界各地移民的时代,我不确定这样的数据库是否会非常准确。祝好运!


1
不,但是只要它好于50%,它就会胜过将名字视为男性气概。
Chas。欧文斯(Owens)2009年

@Chas,为什么要坚持这种错误的二分法呢?您可以选择性别中立。
bignose

我们甚至有2个著名的政治人物,其别名为'maria'-'mary',在您的数据库中将其归为女性。只为劳斯莱斯。
zalew

@JZ我说的是名字,而不是姓氏(反之亦然)。
Chas。欧文斯(Owens)

@bignose,与性别无关的语言看起来很奇怪,令人费解,我宁愿在可能的情况下产生看起来更好的东西。这不会传达给个人(如果他们甚至存在),因此没有冒犯的机会,我不知道为什么人们花这么多时间争论这个问题,而不是仅仅在知道了一个好东西的情况下才提供数据库链接之一。
Chas。欧文斯(Owens)

1

有些文化有男女通用的名字-例如我的。那你怎么办呢?我认为答案是简单明了的-不要以为-您可能会引起犯罪。只需询问是否需要,否则询问性别中立。


5
这个问题已经回答了您的答案:alex =>“ A”,#ambiguous。问题是否有答案,您的答案就不是。
Windows程序员,

我不同意-我的意思是所有名称都可能含糊。
Preet Sangha,2009年

如果名字是男女通用的,那么它们都将被归类为A,而我会追求性别中立,但是如果名字主要是男性或女性的话,我可以使用更自然的语言。
Chas。欧文斯(Owens)

我知道您的理由是什么,但请您参考后面的评论。
Preet Sangha,2009年

3
但是,如果您在StackOverflow上看到“ Preet”,则可能是男性。
Nosredna,2009年

1

好吧,不再了。IBM 专利不久前对该想法。

因此,如果您要寻找任何级别的灵活性(除了名称列表之外的其他东西),您都必须(吓一跳!)询问用户,或者只是向IBM支付权利:)

无论如何,这种自动检测对于许多性别不明确的人,甚至只是卑鄙的父母,都是令人讨厌的。让我们为他们加倍努力。


3
看来IBM已根据名称选择化身获得专利。幸运的是,这不是我打算将其用于的应用程序之一,因此我没有违反其专利。至于询问用户,假设我有用户要询问,而不是名字列表。我已经反复说过,没有用户,没有交互,也没有消息发给名称所属的人。
Chas。欧文斯(Owens)

1

它不是免费的,但这是我之前使用过的一个不错的库:

NetGender for .NET允许您快速轻松地在自定义应用程序中构建名称验证,解析和性别确定。准确验证特定字段是否包含有效的个人或公司。NetGender使用100,000+,种族不同的Name Dictionary和8,000+ Company Name Dictionary来确保精确的性别确定。

http://www.softwarecompany.com/dotnet/netgender.htm


1

您说自己有生日很有趣。这可能会有所帮助。我看过名字流行史数据库。

在影片Splash(1984)中,达里尔·汉娜(Darryl Hannah)的角色从麦迪逊大街的路牌上选择了“麦迪逊”这个名字很有趣,因为显然“麦迪逊”不是一个女孩的名字。

24年后,麦迪逊(Madison)是第4位最受欢迎的女婴名字!


从政府名称历史记录。(请查看玛丽在过去100年中令人沮丧的衰落。)


当我小时候写信给白宫时,理查德·尼克松(或可能是秘书)给我回了一些历史古迹的照片,写给“瑞德·安德森小姐”。“瑞德小姐?” 甚至没有意义!我们真的不能说出克拉克·盖布尔(Clark Gable)的Rhett(留着胡子,随风而逝!)和Vivian Lee的Scarlett之间的区别吗?尽管尼尔·扬(Neil Young)保证“甚至理查德·尼克松(Richard Nixon)也有灵魂”,但我永远不会原谅他。


好一点,日期肯定在这里起作用。
Chas。欧文斯2009年

1

我很确定没有这样的服务可以达到可接受的准确性。我认为这是无法克服的问题:

  • 男性和女性都有很多名字。
  • 即使您只考虑一个国家,这个世界上也有许多不同的名称。
  • 约翰尼·卡什(Johnny Cash)雄辩地提出了“一个叫苏的男孩”问题:-)

2
一个良好的数据库将有个男/女按地区雌雄同体的名字,当抽取样本等

日语等语言呢?我正在学习日语,所以我在这里可能错了,但是<->汉字这个名字并不是直截了当的关系,关于“什么”汉字组成一个人的名字存在双关语和误解。
法老



0

这并不是一个真正的编程问题-取决于获得概率表。

AFAIK没有公开形式的公共数据库。您可以根据人口普查数据构建数据,也可以从某人那里购买数据。

例如,某人为加拿大出售概率表


0

恕我直言,从一个人的名字确定性别通常是一个坏主意。很多名字都是双性恋的(很可悲,这甚至是一个单词?? :-),而且它们在一种文化中可能是一种性别,在另一种文化中可能是另一种性别。

一些愚蠢的例子,只有一些想到的(来自我本人的世界,CE)

Vanja-女性,在这里是东方国家/地区,主要是男性
Alex-双性恋(女性Sandra和男性Sandro的缩写)
罗宾-西方文化

在世界某些地区,可以通过查看名字的结尾来确定性别。例如,玛丽亚(Marija),桑德拉(Sandra),伊凡娜(Ivana),佩特拉(Petra),莎拉(Sara),露西娅(Lucija),安娜(Ana)-您可以看到大多数这些女性名字都以“ ja”或“ ra”结尾。还有其他例子。

不过,我认为最好是向用户询问性别。


9
“不过,我认为最好只是询问使用者做爱。” -我同意,这比在Stack Overflow上发表评论要好得多。
Windows程序员

2
UPS。Okeey,那不是很正确:-)
Rook

编辑之前会更好:-)
Windows程序员,


0

我知道没有这样的服务。但是,您也许可以找到所需的数据。美国政府发布有关姓名的普遍性及其所隶属者的性别的数据。社会安全局(Social Security Administration)有这样的页面,人口普查也可能如此,但是我没有花时间去看。也许其他世界政府也做类似的事情。


0

我知道没有这样的服务,但是..

  • 您可以从原始的人名列表开始,或者
  • 根据一些规则猜测性别(例如-o =>男性,-ela,-a =>女性)

在某些国家/地区(例如德国),可以给某人指定的名称受到法律的限制-也许有一些有关此事的出版物可以收集(但我暂时不知道)。


0

我所要做的是制作一个黑客,该黑客将其名称命名并针对facebook api进行搜索。然后查看最终的用户并计算其中有多少女性或男性。然后,您可以返回一个百分比。不再那么不可克服。:)


-2

只是问问人们,如果他们很好,他们会给你他们的“ M”或“ F”,如果不是,那么就给他们一个“ A”。


2
我没有与要映射其名字的人交流。
Chas。欧文斯
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.