如何衡量SE贡献者的“全面性”?


12

众所周知,Stack Exchange是具有不同主题的问答站点的集合。假设每个站点彼此独立,给定用户拥有的统计信息,与下一个家伙相比,如何计算他的“全面性”?我应该使用什么统计工具?

老实说,我不太了解如何数学上定义“全面性”,但是它必须具有以下特征:

  1. 在所有条件都相同的情况下,用户代表越多,他的能力就越全面
  2. 在所有条件平等的情况下,用户参与的站点越多,他的能力就越全面。
  3. 答案或问题不会影响全面性

首先,您如何在SE环境中定义“全面性”?
JM不是统计学家

@JM,我不知道,这就是为什么我希望社区能够更多地充实概念。
重力

1
冒着听起来像个下意识的PC警察的风险-让我们包括访问我们网站的女性在内。@Graviton,您所有的参考文献均为男性。
rolando2 2011年

用户ID定义的全面性不能告诉您贡献者的全面性,因为贡献者对于不同的SE可能具有不同的用户ID。一些用户ID也可能被多个贡献者(例如,共享帐户的合作伙伴)使用。
Alexis

Answers:


7

您还需要考虑站点之间的相似性。谁在计算器上和参与人经验丰富的咨询更全面的比别人谁在SO和交叉验证,谁又将(我认为)更全面的比别人谁在SO和参与参与程序员。毫无疑问,有很多方法可以做到这一点,但是您可以检查重叠注册以了解它。


1
@Matt Parker,要点-如果销售代表是指标的一部分,我还认为您需要查看销售代表的获取方式。一个人从很多问题/答案中获得少量回报而获得代表的人,比一个在单个问题上获得相同票数并获得大量赞成票的人更全面。
DQdlM 2011年

3
@Kenny这是一个很好的观点,我认为您所说的是正确的-但是我觉得很多投票最多的问题和答案通常很少表示专业知识,而真正坚韧的技术问题的好的答案通常有非常低的选票。
马特·帕克

1
例如,查看胡布的答案。他的答案总是非常出色,那么他的高分答案和1名投票者之间有什么区别?当我看前者时,我能很好地回答我所理解的问题。在后一种情况下,我什至没有开始怀疑的问题的绝妙答案。因此,票数低的答案实际上可以指示出专业化程度高(但请注意:如果您对全面发展的SE用户的外观感到好奇,那就是)。
马特·帕克

1
实际上,@ Graviton,明智的做法是寻找您认为是全面的多站点用户,并查看他们在各种指标中的表现。
马特·帕克

1
@KennyPeanuts,作为对@Matt的上述观点的补充,似乎SE网站上的用户数量也可观,可以回答大量问题,但很少产生赞誉。通常,这通常也不表示专业知识或全面性。(尽管这获得“声誉”的最简单策略之一)。
主教

6

示例:假设有三个站点,我们要比较用户A,B,C的全面性。我们以向量形式在三个站点中写下用户的声誉:

用户A:[23,23,0]

用户B:[15、15、0]

用户C:[10、10、10]

我们认为A比B更全面(它们的声誉均分布在两个站点中,但是A的总体声誉更高)。此外,我们认为C比B更全面(它们的总声誉相同,但是C在更多站点上的分布均匀。)尚不确定A是否应被认为比C更全面,反之亦然。

x Bx C分别为上述信誉向量。xAxBxC

我们想要通过用户信誉向量的函数来衡量用户的“全面性” 。通过以上所述,我们希望函数f满足f x A> f x Bf x C> f x Bf(x)ff(xA)>f(xB)f(xC)>f(xB)

任何凹的,增加会做的伎俩。f(x)

凸函数的两个常见示例是“分数范数”

f([x1,...,xm])=ixip

0<p<1

p=1/2

f(xA)=2239.6
f(xB)=2157.7
f(xC)=3109.5

1/2

f

f([x1,...,xm])=ixilog(xi/c).

c=ixi

f

f(xA)=46log(2)31.9
f(xB)=30log(2)20.8
f(xC)=30log(3)33.0

根据缩放后的香农熵来衡量,那么,我们可以说C是三个中最全面的,而A是第二个最全面的。

f(x)

EDIT2:根据whuber的评论添加了一个示例。


f

f[1,101]f

当任何x_i <0时,分数范数是不确定的。当任何x_i / c≤0时,香农熵将失效。当某些x_i从0变为-𝜀时,对圆度的度量突然爆发是没有意义的。
200_success

4

这是一个非常非常有趣的问题(实际上,我有点喜欢对堆栈交换站点进行建模的想法)。

关于全面性问题,评估此问题的一种方法是通过特定用户倾向于回答的标签及其在站点之间的分布。示例可以使这一点更加清楚。

我是TeX,StackOverflow,CrossValidated和AskUbuntu的成员。现在,我的确只对这里和StackOverflow有所贡献,而对Stackoverflow上的R只是贡献。因此,为了定义良好的圆度,我将看一下:a)两个站点共有的标签数量(以定义各个站点之间的相似性),以及用户回答的问题在具有很少或没有公共标签的站点上的程度。

例如,如果某人在StackOverflow和烹饪上为Python标签做出了贡献,那么该人比在这里回答有关Overflow和stats问题的统计软件问题(例如)的人更全面。

我希望这会有所帮助。


4
(+1)在SO和烹饪上都为Python标签做出贡献的人在食物中有一些异国风味:-)我听说它的味道像鸡肉。
ub

3

如果将“全面性”定义为“对许多不同的Stack Exchange站点做出贡献”,我将计算每个站点的贡献度量。您可以使用总帖子数或每天的平均帖子数,也可以使用声誉。然后查看该指标在所有站点上的分布,并以某种有意义的方式计算其偏度。

换句话说,一个“全面”的人将是为许多不同的站点做出贡献的人,而“没有全面的”人将是主要为一个站点做出贡献的一个人。您可以通过根据所有站点上的用户总数来扩展指标来进一步改善这一点。即,对许多不同站点做出了巨大贡献的人应该被认为比对任何站点都没有做出任何贡献的人更加全面。从未使用过SE的人不是很全面!


1

已经有很多好的答案,那么为什么还要一个呢?这主要是提醒大家注意讨论的有趣的想法在这里n个类别咖啡厅。尽管生态(和其他地方)的多样性大多只关注丰富度,但人们也应该关注不同物种之间的相似度/不相似度。

通过将物种(或类似SE站点之类的任何物种)表示为度量空间中的点,这导致将泛化为度量空间,例如,参见Tom Leinster,Emily Roff所著的度量空间的最大熵。通过将标记视为度量空间中的点,可以在SE站点内使用相同的想法。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.