啊哈,好问题!!
我也很天真地提出了S形逻辑曲线,但这显然不合适。据我所知,由于YouTube会计算唯一身份观看次数(每个IP地址一个),因此不断增加只是一个近似值,因此观看次数不会超过计算机。
我们可以使用人们易感性不同的流行病学模型。为简单起见,我们可以将其分为高风险组(例如儿童)和低风险组(例如成人)。让我们称为“感染”儿童的比例,为“感染”成年人的时间。我将称为高风险组中的(未知)人数,将称为低风险组中的(也未知)人数。y (t )t X Yx (t )ÿ(吨)ŤXÿ
˙ Ý(吨)=- [R2(X(吨)+Ý(吨))(ÿ-ÿ(t)),
X˙(t )= r1个(x (t )+ y(t ))(X− x (t ))
ÿ˙(吨)= r2(x (t )+ y(吨))(是- ÿ(t )),
其中。我不知道如何解决该系统(也许@EpiGrad会解决),但是查看您的图表,我们可以做出一些简化的假设。因为增长没有达到饱和,所以我们可以假设非常大而很小,或者 ÿ ÿ[R1个> r2ÿÿ
˙ Ý(吨)=- [R2X(吨),
X˙(t )= r1个x (t )(X− x (t ))
ÿ˙(t )= r2x (t ),
[R1个> r2ÿ- ÿ(吨)[R2
该系统解决了
x (t )= XC1个ËX[R1个Ť1 + C1个ËX[R1个Ť
ÿ(t )= r2∫x (t )d吨+ Ç2= r2[R1个日志(1 + C1个ËX[R1个Ť)+ C2,
其中和是积分常数。那么,总的“感染”种群为
,它具有3个参数和2个积分常数(初始条件)。我不知道安装它会多么容易...C 2 x (t )+ y (t )C1个C2x (t )+ y(吨)
0600 ,000 ,000x (t )ÿ(吨)
X˙(t )= r1个x (t )(X− x (t ))
ÿ˙(t )= r2,
并解决
x (t )= XC1个ËX[R1个Ť1 + C1个ËX[R1个Ť
ÿ(t )= r2吨+ Ç2。
x (0 )= 1C 1 = 1t = 0 XC2=y(0)C2=0Xr1r2C1个= 1X− 1≈ 1XXC2= y(0 )C2= 0X[R1个[R2
X= 600 ,000 ,000[R1个= 3.667 ⋅ 10− 10[R2= 1 ,000 ,000
更新:从我收集到的评论中,Youtube会统计观看次数(以秘密的方式),而不是唯一的IP,这有很大的不同。回到绘图板。
为简单起见,我们假设观看者被视频“感染”。他们会定期观看,直到清除感染为止。最简单的模型之一是SIR(敏感感染抗性),它是:
小号˙(吨)= - α 小号(t )我(吨)
一世˙(吨)= α 小号(t )我(吨)- β一世(吨)
[R˙(t )= β一世(吨)
αβx (t )X˙(t )= k I(吨)ķ
在此模型中,观看次数在感染发生后的某个时间突然开始增加,原始数据中的情况并非如此,这可能是因为视频还以非病毒(或模因)的方式传播。我不是估算SIR模型参数的专家。只是玩不同的值,这就是我想出的(在R中)。
S0 = 1e7; a = 5e-8; b = 0.01 ; k = 1.2
views = 0; S = S0; I = 1;
# Exrapolate 1 year after the onset.
for (i in 1:365) {
dS = -a*I*S;
dI = a*I*S - b*I;
S = S+dS;
I = I+dI;
views[i+1] = views[i] + k*I
}
par(mfrow=c(2,1))
plot(views[1:95], type='l', lwd=2, ylim=c(0,6e8))
plot(views, type='n', lwd=2)
lines(views[1:95], type='l', lwd=2)
lines(96:365, views[96:365], type='l', lty=2)
该模型显然不是完美的,并且可以通过许多合理的方式进行补充。这个非常粗略的草图预测了2013年3月前后某处的十亿观看次数,让我们看看...