简短答案:这是一个方便示例。您无能为力。
更长的答案:您与进行内部调查的许多社交网络处于同一条路线,却对谁会回答随机出现在Facebook或Google+上的一个问题的调查一无所知...除了这些巨人之外,您不会没有任何关于那些没有回应的数据。调查和民意研究界通常对这类工作不满意,因为目前还不清楚如何将这些严重偏倚的样本的结果推广到总人口(如果有的话)。您可以尝试根据已知的人口统计信息进行权重调整,但是最终将得到权重变化,从一个仅代表自己的人的权重到分配给该人口中唯一知道如何使用计算机的70多名男性的1,000,000 (无论如何,可能并不能代表其余的1,000,000 70岁以上的男性)。
其他阅读:“如何使用统计数据撒谎”以关于偏倚样本的一章开头。如果您可以阅读它而对样本设计不感到沮丧,则可以继续。如果您依靠志愿者,那么您的样本将偏向年轻人和城市人口,他们可以更好地使用电子产品。同样,美国统计协会前任主席弗里茨·舒伦(Fritz Scheuren)撰写的“什么是调查”小册子开张了哈里·杜鲁门(Harry Truman)的照片,他的胜利无法通过当时存在的偏颇的投票技术来预测。
关于难以到达的人群有一些研究。一项著名的项目是一项研究,对在伊拉克采样的地理区域中的超额死亡人数进行了研究,在每个地区,当地医生都将尝试征集该城市每个家庭的采访。对该设计的批评不断增加,但是无论它有多妥协,它仍然有其采样组件。请参阅《柳叶刀》上的论文(您可能知道,在医学界您再也无法享有盛誉了)http://dx.doi.org/10.1016/S0140-6736 (04 ) 17441-2和http://dx.doi .org / 10.1016 / S0140-6736(06)69491-9。