Questions tagged «combinatorics»

对集合或其他有限离散结构中的元素进行计数或枚举。

3
将生日悖论扩展到2个人以上
在传统的“生日悖论”中,问题是“一群nnn人中的两个或两个以上的人共享生日的机会是多少”。我陷入一个问题,这是对此的扩展。 我不知道两个人分享生日的概率,而是需要扩展问题来知道xxx或更多人分享生日的概率是多少。在x=2x=2x=2您可以通过计算没有两个人分享生日并从减去生日的概率来做到这一点111,但是我认为我不能将此逻辑扩展到更大的xxx。 为了使这一点进一步复杂化,我还需要一个适用于nnn(百万)和xxx(千)的非常大数的解决方案。

5
这种“天真”的改组算法有什么问题?
这是有关随机随机排列数组的Stackoverflow 问题的后续内容。 已经建立了一些算法(例如Knuth-Fisher-Yates Shuffle),人们应该使用它们来对数组进行混洗,而不是依赖于“天真的”临时实现。 我现在有兴趣证明(或证明)我的幼稚算法已损坏(例如:不会以相等的概率生成所有可能的排列)。 这是算法: 循环几次(应该执行数组的长度),然后在每次迭代中获取两个随机数组索引,然后在其中交换两个元素。 显然,这需要比KFY(两倍多)更多的随机数,但是除此之外,它还能正常工作吗?合适的迭代次数是多少(“数组长度”是否足够)?

5
从拼字游戏中从一包字母中画出给定单词的可能性
假设您有一个带有磁贴的袋子,每个磁贴上都有一个字母。有带有字母“ A”的图块,和“ B”等等,还有 “通配符”图块(我们有)。假设您有一本单词数量有限的字典。n A n B n ∗ n = n A + n B + … + n Z + n ∗ññnñ一种ñ一种n_Añ乙ñ乙n_Bñ∗ñ∗n_*n = n一种+ n乙+ … + nž+ n∗ñ=ñ一种+ñ乙+…+ñž+ñ∗n = n_A + n_B + \ldots + n_Z + n_* 您可以从袋子中挑选块瓷砖,而无需更换。ķķk 给定所选的图块,您如何计算(或估计)从字典中形成长度为(1 < = <)的给定单词的概率?升ķ ķ升升l升升lķķkķķk 对于不熟悉Scrabble(TM)的用户,可以使用通配符来匹配任何字母。因此,单词“ BOOT”可以用图块“ B”,“ …

2
简化具有相同n和k的所有可能值的组合的总和
有没有办法简化这个方程式? ( 81个) +( 82) +( 83) +( 84) +( 85) +( 86) +( 87) +( 88)(81个)+(82)+(83)+(84)+(85)+(86)+(87)+(88)\dbinom{8}{1} + \dbinom{8}{2} + \dbinom{8}{3} + \dbinom{8}{4} + \dbinom{8}{5} + \dbinom{8}{6} + \dbinom{8}{7} + \dbinom{8}{8} 或更笼统地说, ∑k = 1ñ( nķ)∑ķ=1个ñ(ñķ)\sum_{k=1}^{n}\dbinom{n}{k}

1
离散均匀分布中未替换的样本之间的最大间隙
这个问题与我实验室对机器人覆盖率的研究有关: 随机绘制Ñnn从组数字{ 1 ,2 ,... ,米}{1,2,…,m}\{1,2,\ldots,m\}无需更换,并以升序排序的数字。 。1 ≤ Ñ ≤ 米1≤n≤m1\le n\le m 从此排序的数字,生成连续数字和边界之间的差:。这给出了间隙。{ 一(1 ),一个(2 ),... ,一个(Ñ ) } {a(1),a(2),…,a(n)}\{a_{(1)},a_{(2)},…,a_{(n)}\}克= { 一(1 ),一个(2 ) - 一(1 ),... ,一个(Ñ ) - 一(ñ - 1 ),m + 1 - a (n ) } g={a(1),a(2)−a(1),…,a(n)−a(n−1),m+1−a(n)}g = \{a_{(1)},a_{(2)}−a_{(1)},\ldots,a_{(n)}−a_{(n-1)},m+1-a_{(n)}\}n +1个n+1n+1 最大差距的分布是什么? P (max (g …


7
直观地理解为什么泊松分布是二项式分布的极限情况
在DS Sivia的“数据分析”中,从二项式分布推导了泊松分布。 他们认为,当M→∞M→∞M\rightarrow\infty,泊松分布是二项式分布的极限情况,其中MMM是试验次数。 问题1:如何直观地理解该论点? 问题2:为什么large- MMM的限制M!N!(M−N)!M!N!(M−N)!\frac{M!}{N!(M-N)!}等于MNN!MNN!\frac{M^{N}}{N!},其中M次试验的成功次数为?(此步骤用于推导中。)NNNMMM

4
评审团的偏见?
刑事审判后,一位朋友代表客户提出上诉,陪审团的选择似乎带有种族偏见。 评审团由4个种族组成的30人组成。检方使用了强制性的挑战,以从池中消除了10个人。每个种族群体的人数和实际挑战的数量分别是: A: 10, 1 B: 10, 4 C: 6, 4 D: 4, 1 total: 30 in pool, 10 challenges 被告来自种族C组,受害者来自种族A和D组,因此先验问题是C组是否受到过挑战,而A和D组受到了挑战。从法律上讲(IIUC; IANAL),辩方不需要证明种族偏见,而只是表明数据似乎表明存在偏见,这便使控方有责任从非种族角度解释每项挑战。 以下分析的方法正确吗?(我认为计算很好。): 有10个池成员的nCr(30,10)= 30,045,015个不同的集合。在这些不同的集合中,我计算出433,377个集合同时包含(不超过A组和D组的2个成员)和(不少于C组的4个成员)。 因此,达到观察到的明显偏见水平的机会比A组和D组优于C组(其中10项挑战中不包括偏爱)是它们的比率,即433/30045 = 1.44%。 因此,原假设(无此类偏差)在5%的显着性水平上被拒绝。 如果这种分析在方法上是正确的,那么向法院描述它的最简洁方法是什么,包括学术/专业参考文献(即不是Wikipedia)?虽然论点看起来很简单,但如何能最清楚,最简洁地向法院证明它是正确的,而不是恶作剧呢? 更新:在上诉摘要中,该问题已作为三级辩论进行了审议。考虑到此处讨论的技术复杂性(从律师的角度来看)以及明显缺乏法律先例,律师选择不提出建议,因此在这一点上,问题主要是理论上/教育上的。 要回答一个细节:我相信挑战的数量是10个。 在研究了周到且具有挑战性的答案和评论(谢谢!)之后,似乎这里有4个独立的问题。至少对我来说,将它们分开考虑(或听听为什么它们不可分离的争论)是最有帮助的。 1)在陪审团的挑战中,是否优先考虑被告人和受害者的种族?上诉论点的目的仅是引起合理关注,这可能导致司法命令,要求检方陈述每个单独质疑的理由。在我看来,这不是一个统计问题,而是一个社会/法律问题,由律师酌情决定是否提出。 2)假设(1),我对替代假设的选择(定性:对分享被告人的种族的陪审员的偏见,而赞成分享被害人的种族的偏见)是合理的,还是事后不允许?从我的外行角度来看,这是最令人困惑的问题-是的,如果一个人不遵守,当然不会提出!据我了解,问题在于选择偏见:一个人的测试不仅应考虑这个陪审团池,还应考虑所有此类陪审团池的范围,包括所有未发现辩护方存在差异并因此不愿意提出该问题的陪审员池。 。如何解决这个问题?(例如,安迪的测验如何解决这个问题?)看来,尽管我对此可能有误,但大多数受访者并未为可能的事后调查感到困扰1尾测试,仅针对被告所在的群体进行偏见测试。假设(1),同时测试受害者群体的偏见在方法上有何不同? 3)如果有人规定我选择(2)中所述的定性替代假设,那么检验它的合适统计量是什么?这是我最困惑的地方,因为我建议的比率似乎与安迪关于更简单的“偏于C的”替代假设的检验的保守度稍高(更保守,因为我的检验也将所有情况都排除在外)在尾部,而不仅仅是观察到的确切数字。) 两种检验都是简单的计数检验,具有相同的分母(样本的相同宇宙),并且分子精确地对应于与各个替代假设相对应的那些样本的频率。那么,@ whuber,为什么它和安迪的计数测试不一样,因为它“可以基于规定的空值[相同]和替代性的[描述的]假设,并使用内曼-皮尔森引理证明是正确的”? 4)如果有人规定(2)和(3),那么在判例法中是否存在可以说服怀疑上诉法院的内容?从迄今为止的证据来看,可能还没有。同样,在上诉的这个阶段,没有任何“专家证人”的机会,因此参考就是一切。

3
如何在R中重新采样而不重复排列?
在R中,如果我先set.seed(),然后使用样本函数将列表随机化,是否可以保证不会生成相同的排列? 即... set.seed(25) limit <- 3 myindex <- seq(0,limit) for (x in seq(1,factorial(limit))) { permutations <- sample(myindex) print(permutations) } 这产生 [1] 1 2 0 3 [1] 0 2 1 3 [1] 0 3 2 1 [1] 3 1 2 0 [1] 2 3 0 1 [1] 0 1 3 2 …

2
“最强密码”
我有一个受四位数PIN码保护的应用程序,该用户在锁定帐户之前进行了五次登录尝试。 现在,我的一位客户希望“加强”安全性,并提倡另一种解决方案: 六位数密码 否“彼此相邻的相同数字”:例如:11 3945或39 55 94 否“三个运行数字”:例如:123 654或53 789 3 现在开始思考:哪种解决方案最强? 我可以很容易地计算出四位数,但是如何计算另一位数呢? 谢谢! 更新资料 您会得到您想要的-特别是在使用数学时:) 所以,我要的是两个数字序列的组合数。 通读答案和评论,对我来说很清楚,这真的没有关系。如果您有5个猜测,那么有10.000或〜800.000可以选择。更重要的是排除1234和出生日期。在我的情况下,我实际上有用户的出生日期,因此我需要检查一些东西。 感谢您的精彩讨论!

2
秘密圣诞老人的安排将导致完美配对的可能性
因此,我们有秘密圣诞老人在工作。 我们是8个人。我们每个人轮流从碗上拉出一小张上面有名字的纸。唯一的规则:如果您拉名字,则必须将纸放回碗中,然后重试。 我们称人们A,B,C,D,E,F,G,H,这也是他们拣纸的顺序。 昨晚我们做了礼物交换。 A是F的秘密圣诞老人。 B是E的秘密圣诞老人。 C是D的秘密圣诞老人。 D是C的秘密圣诞老人。 E是B的秘密圣诞老人。 F是A的秘密圣诞老人。 G是H的秘密圣诞老人。 H是G的秘密圣诞老人。 看看发生了什么事?我们结了夫妻。 A和F是彼此的秘密圣诞老人。 B和E是彼此的秘密圣诞老人。 C和D是彼此的秘密圣诞老人。 G和H是彼此的秘密圣诞老人。 发生这种情况的可能性是多少?如何计算?

2
同一班级中五个孩子具有相同名字的概率
在婴儿命名论坛上,准父母一直在重复他们的《对珍妮弗的恐惧》的某些版本:“我不希望我的孩子成为同班5名孩子中的一个。” 事实是,没有哪个名字比这种受欢迎程度更接近了,即使在詹妮弗热潮的高峰期,您也没有一个班上有五个人。我想为这些父母提供某种答案,那就是这种名字重复的巧合是多么不可能。 使用美国社会保障局(Social Security Administration)广泛的婴儿名字数据(https://www.ssa.gov/oact/babynames/limits.html),有人可以告诉我如何计算出在美国有5个小学班的机会同名的孩子?(为简单起见,“同名”是指相同的拼写,“学校班级”是指所有孩子都出生于同一年。)我没有指定班级人数,但绝对应大于4 。:-)

2
没有替换的独立随机样本的交集的基数分布是什么?
SSS是一些组具有n∈Nn∈Nn\in\mathbb{N}元件,和a1,a2,...,ama1,a2,...,ama_1,a_2,...,a_m被固定的正整数小于或等于nnn。 由于的元素SSS相等,因此mmm样本L1,L2,...,LmL1,L2,...,LmL_1, L_2,...,L_m分别和独立地从吸入SSS无需更换,其尺寸是a1,a2,...,ama1,a2,...,ama_1,a_2,...,a_m,分别。 |L1∩L2∩ ... ∩Lm||L1∩L2∩ ... ∩Lm|\left|L_1\cap L_2\cap\ ...\ \cap L_m\right|{0,1,...,min{a1,a2,...,am}}{0,1,...,min{a1,a2,...,am}}\{0,1,...,\min\{a_1,a_2,...,a_m\}\}

3
我可以使用哪些统计方法来找到分类变量的流行或常见组合?
我正在研究多种药物的使用。我有一个包含400名吸毒者的数据集,每个人都陈述了他们滥用的药物。有10种以上的药物,因此可能有很大的组合。我将它们消耗的大多数药物重新编码为二进制变量(即,如果吸毒者滥用了海洛因,则海洛因为1,否则为0)。我想找到2或3种药物的流行或常见组合。我可以使用统计方法吗?

4
找到特定碱基对序列的可能性
考虑概率总是让我意识到自己在数数上有多糟糕... 考虑基本字母的序列,每个都可能出现。该序列包含特定感兴趣的碱基对长度的特定序列的概率是多少?一个,nnn- [R ≤ ÑA,T,C, and GA,T,C, and GA,\; T, \; C, \text{ and } Gr≤nr≤nr\leq n 有不同的(相等可能性)序列可能。在整个序列的开始处从感兴趣的序列开始;序列是可能的。我们可以在不同的位置开始感兴趣的序列。因此,我的答案是。4 ñ - - [R Ñ + 1 - - [R (Ñ + 1 - - [R )/ 4 - [R4n4n4^n4n−r4n−r4^{n-r}n+1−rn+1−rn+1 -r(n+1−r)/4r(n+1−r)/4r(n+1-r)/4^r 这个概率在增加,这对我来说很有意义。但是当时,该概率超过。但是那不可能。概率应在极限(接近我)范围内接近1,但不能超过该极限。n > 4 r + r − 1nnnn>4r+r−1n>4r+r−1n>4^r +r-1 我认为我在重复计算。我想念什么?谢谢。 (仅供参考,而不是功课,只是准备考试的一个玩具示例。我的分子生物学家朋友提出了一个问题。)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.