网友质疑武汉大学杨景媛硕士毕业论文疑似使用 AIGC 完成，是真的吗？如果是真，会受到哪些处罚？ - 是这样的。有位老兄已经将她的错误整理如下...

是这样的。

有位老兄已经将她的错误整理如下了：

武汉大学诬陷案杨景媛-硕士学位论文疑点和错误8062 赞同 · 1363 评论文章

除了这些问题，还有一些关于她核心回归模型中（5.1.1)的技术问题的补充：

1、样本量数据对不上

10519=5230+5287？

8969=4475+4494！

10867=5510+5354？

大概率是做逻辑回归的时候，子样本有些组存在因变量一致的情况，回归结果自动删除了一些样本。

2、表5.1中数据汇报错误

5.34%汇报成5.4%（感觉AIGC没那么蠢，不应该识别错误）

5.4%-3.2%=2.1%???喵喵喵

3、变量定义操纵

5.1表中的核心自变量“是否生育多胎”应该理解为家庭是否有超过1个孩子，分为孩子数量大于1和孩子数量小于等于1。她的定义为：

莫名其名的定义，很大可能有p-hacking的嫌疑。表5.1的结果也显示，2010年的结果其实已经不显著了。无论是practical significance还是statistcal significance。按照这种趋势，说明2020年家暴的情况已经消失了，那她的研究还有撒狗p价值？

4、分样本回归有不小的问题。

针对第三点做一下补充。2010年，城市家庭因为独生子女政策的实施，应该没有多少大于2个孩子的家庭。如果用“孩子数量大于1和孩子数量小于等于1”这两类来定义她的核心自变量“是否生育多胎”，那么就会出现城市样本的值几乎95%以上都是0，那还怎么跑逻辑回归？标准误估计大得吓人，自然无法得到显著的结论。这应该是她故意修改核心自变量定义的根本原因。

5、AI行文风格特征：

AI在分析回归结果的时候，经常喜欢用一个单位这样的行文措辞。一会一个水平、一会一个单位，大概率是杨女士忘了调整。

6、关于杨女士到底是用的逻辑回归还是LPM的问题

因为因变量是0-1变量，我一开始就默认对方是用的逻辑回归。但是她汇报的是t值，不是z值，那么应该还是用的LPM，草率了。但是LPM丢样本的可能性却反而没有逻辑回归大（OLS和MLE估计方法的差异），费解。

还没有人送礼物，鼓励一下作者吧

编辑于 2025-07-28 21:46・上海