相对来说乌方更得慢但是更接近真相一些。
这是我写得两篇乌克兰战损分析的文章,第二篇是因为太多的人质疑UALosses的真实性,又专门补充的。其中大部分质疑者都是俄友,认为UALosses报的乌方死亡数值太低,而且认为Medusa报得俄方死亡太高。
以下是第二篇文章的一个很短的提要,下面是按照UALosses原始数据画出的周死亡人数图,我们把战役一标就一目了然,乌方报得战损与战役呈现周期关系,是高度吻合的,更不要说UALosses的第一大信源是俄方军事资金募集站http://lostarmour.info了。


本文的统计地图也能看出UALosses还把乌军非战斗减员也算进去了,理由是根本不是前线的地区也有人员死亡。
还有一个角度去看待这个数据,我们可以打印一张频数直方图:

整个统计区间一共132个周,我们可以看到,的确大部分的周分布不在了200-500这个区间内(91.67%),但这并不代表UALosses数据造假,反而向大家揭示了,目前俄乌战争的烈度对乌军造成的可确认姓名的损失的均值大约在350人/周左右。
因为,如果是使用随机数造假的话,那么现代计算机程序中的随机数程序都是伪随机,一般会选择在给定的范围内呈现均匀分布(Uniform Distribution)或正态分布(高斯分布,Gauss Distribution),如果真的为了造假,那么也可能会选择Beta分布(Beta-Distribution),然后设置特定的α和β值【没错,笔者连怎么造假都知道,只是笔者不用】。
我们来依次看一下这些检验:
首先,均匀分布肯定不是,这么明显的山峰,说均匀分布的那只能说可能不知道均匀分布指的是什么,可以去自学一下概率论与数理统计。
然后,正态分布,有点像但不是,下面是三个常见的正态分布检验的结果:
Shapiro-Wilk Test:
Statistic: 0.8418465053884059, p-value: 1.3716808432679038e-10
夏皮罗-威尔克检验,p值小的几乎等于0,这表明拒绝了正态分布假设,数据不是正态分布。
D'Agostino's K-squared Test:
Statistic: 75.75765337465909, p-value: 3.543517555609304e-17
D'Agostino(一直没有官方翻译)卡方检验,p值更小,可以直接认为是0,这表明也拒绝了正态分布假设,数据不是正态分布。
Anderson-Darling Test:
Statistic: 4.083741203735116
Significance Level 15.0: Critical Value 0.56
Significance Level 10.0: Critical Value 0.638
Significance Level 5.0: Critical Value 0.765
Significance Level 2.5: Critical Value 0.892
Significance Level 1.0: Critical Value 1.061
安德森-达令检验,比所有的Critical Value都大,拒绝原假设,不是正态分布。
最后,Beta分布,由于Beta分布的参数有两个,看这个形状,有可能是α=2,β=5,标准化后测一下柯尔莫可洛夫-斯米洛夫检验:
Kolmogorov-Smirnov Test:
Statistic: 0.37275613686523096, p-value: 5.68132480011471e-17
可以直接认为是0,所以也是过不了,大家可以自行试试其他参数,反正是找不出来一个能让p大于0.05的。
所以,这个数据是随机生成的可能性很小。
但是又有明显的规律性,这是为什么呢?
因为变量太多,加上乌军的阵亡率一直在降低,所以这是一个多重混合分布,想要把这个分布用随机数写出来,那你恐怕得把一堆大学教授叫过来一起猜,一起试。
认为UALosses报少了还情有可原,因为毕竟谁也不能做到100%统计,但是认为造假,可就有点说不过去了。相比之下,反而是报俄方战损的Medusa,严谨到离谱,还统计出来了70000人,到底谁损失大,一目了然。