原创:黄博

 两个假设

3月2日,《》官方微博发了一条新闻,介绍钟南山院士团队最新发表的一篇关于新冠病毒趋势预测的论文。截图如下。

粗看上去,这篇微博也没什么特别。不过很快就有评论指出该博选择性报道,并没有展现事实之全部。《新周刊》转发该微博时贴了一张图,并附加评论。

这两家媒体,分别引述该论文提出的两个假设——提早五天管控和推迟五天管控分别导致什么结果。两个假设的原文为:

“如果延迟5天实施干预措施,由于感染者平均每天接触的次数增加,传染系数(率)将会更大。病例数量呈指数增加,可能在3月4日达到高峰,达到173,372例现存确诊病例,疫情最终规模预估为351,874例确诊病例。如提前5天实施干预措施,全国疫情最终规模可能减少至40,991例确诊病例 (图2E)。”

结合论文图文,我们可以得到三个数据。

假如延迟5天,疫情最终规模预估为351,874例确诊病例。

如果提早5天,疫情最终规模可能减少至40,991例确诊病例。

如果按照目前的防控日期,其最终爆发总规模122122例。

简单计算可以得知,如果提早5天防控,最终确诊病例仅为现有防控日子的三分之一,与新周刊的微博所述一致。

要站哪边?

对于《环球时报》的“选择性”报道以及新周刊等媒体的“吐槽”,我们应该支持哪一方?

网友们习惯性地分成两派,一边挺“已经很好”,一边挺“本来可以更好”。

我们就不站队了,只想再细读两遍论文,搞清楚钟院士团队发布预测论文的初衷是什么。即便要站队,也不是站哪家媒体,而是站科学,站理性。

那么,论文的初衷是什么?这个问题一点不难回答,文章在开头部分,即把预测“结果”和研究“结论”明示。

“结果:推测本次疫情全国在2月下旬达到高峰,4月底趋于平缓。如管控措施推迟5天实施,中国大陆的疫情规模预估将扩大至3倍;如减低武汉管控力度,湖北可能在3月中旬出现第二次疫情高峰并延续至4月下旬。”

“结论:优化的SEIR模型及成功建立的人工智能模型能有效预测新冠病毒的流行趋势,证实1月23日起实施的公共卫生干预措施有效控制了疫情发展。”

这里的结果与结论有什么不一样?

首先是主体不同。“结果”的产生主体是预测模型,“结论”的产生主体是整篇论文或者课题。

其次是表现形式不同。“结果”是表现形式是数据或者趋势,“结论”则是一个明确判断。

第三是地位不同。“结果”是属于课题研究过程的一环,“结论”则属于课题研究目的。从逻辑推理角度来看,前者是后者的前提。也就是说,如果没有结果,是无法得出结论的。

花这么多笔墨来区分两者不同,是因为这是理解文章的题眼所在。理解了结论和结果,也就明白了,该论文发表的目的有两个。

一是验证预测模型的有效性,为未来预测类似流行疾病提供可靠的科学工具;二是验证防控措施的有效性,为下一步加强防控和未来的流行病防控提供科学依据。

这两个目的实质只有一个,就是希望借助科学工具预测疾病发展趋势,及时采取防控措施,将损失减到最低。

以上是论文呈现出来的事实和结论,没有任何先设立场。

科学本身是中立的,但是,科学研究结果发布之后,总是难逃被选择性解读或者过度性解读的命运,最终沦为各方互打嘴仗的工具。

在这个案例中,永远正确永远热泪盈眶的《环球时报》放大“两个假设”中的“延后五天防控”,表达了对现有防控措施的充分肯定。

而批评色彩较浓的《新周刊》则圈出了另外一个假设“提早五天防控”,暗含对《环球时报》选择性报道的讽刺,以及对当前防控力度颇有微辞。

事实上,两个角度并非水火难容,至少在数学上是可以统一的。

我们可以把提前五天防控标为-5,延后五天标注为5,虽然前者是负数,后者是正数,不过这只是一个纯数学的正负,而不是能量的正负。提前五天还是延后五天,都不过一个数学游戏,绝无赞美或者批评之意。

我们再从数学角度来计算。提前五天(A)、不提前(B)和延后五天(C)的数字分别是40991、122122和351874,B/A与C/B的结果都趋近于3,换言之,5天可以实现3倍增长,其增长率是基本一致的。

这些数据告诉我们一个事实,在防控这件事上,早肯定比迟好,紧肯定比松好,强肯定比弱好。

道理都懂,问题的关键是,什么时候启动防控才是最合理的呢?钟院士团队的文章中也提出了讨论,原文如下:

“COVID-19的暴发引发了对人口密集城市公共卫生流行病控制的重大挑战:决定何时实施控制措施。目前需要市或省疾控中心的阳性检测结果以确诊病例,这一过程至少需要30小时[15]。2月12日,湖北政府将根据影像学检查、中性粒细胞计数和流行病学关联等归为临床诊断病例,使得一夜之间增加了1.6万例病例。但除了湖北省以外,其他省份都没有采用这一分类方法,致使全国COVID-19确诊病例数出现了混淆。尽管有人可能认为临床诊断病例并不完全准确,但目前的PCR诊断方法也同样存在不足[15]。直到有更进一步确诊的方法之前,如血清阳性率流行数据可用于评估真实发病率,本研究可以预见的是,基于PCR确诊的流行曲线可能被低估。”

这段文字没有算出最佳的防控启动时机,只是讨论了两个重要的决定因素,一是诊断时间,二是确诊标准。两个因素一块决定了确诊人数的多少,从而为决策者提供依据。

文中指出,目前(2月12日)的确诊时间最快30个小时。这个速度不算慢,不过,在疫情刚开始的12月份,确诊时间要长得多。

二是确诊标准。在疫情前期,病患者确诊标准过高,包括去过华南海鲜市场等条件,再加上试剂盒缺乏,导致确诊人数远低于真实患病人数,不利于防控决策。

当然,诊断时间和确诊标准只是技术手段限制。何时采取管控措施,采取多大力度的措施,还不仅仅是个技术问题,还受政治、经济和社会等非技术因素的综合影响。在某些时候,非技术因素对决策的影响可能更大。详情可以看财新、财经相关报道,这里不赘述。

总而言之,遇到双方吵架时,别忙着站队,先看看他们吵什么,多掌握一些材料,有助于自己了解事情的全貌,而不至于陷入无休止的情绪争夺战中。

 

CDS档案 | 环球时报