当谷歌遇上流感:透视网络技术监测传染病优劣
今年流感在美国的暴发比往年要早,在肆虐的流感面前,一项用来监测流感暴发的技术也暴露出了自身的缺陷。和传统监测系统的对比数据显示,通过和流感相关的互联网搜索,来估计流感传播状况的谷歌流感趋势系统(Google Flu Trends),大大高估了流感的峰值水平。专家说,对于这项具有前景的战略来说,这次的故障不仅仅是一个暂时的挫折,更意味着谷歌需要改善它的算法系统。由于流感跟踪技术是基于网络数据挖掘和社会媒体扩散,谷歌发生的这个插曲也是个适时的提醒:如今的技术并不能*取代传统的流行病学检测网络,它们只能起到补充作用。
挑战传统
法国监控网络创始人、巴黎第六大学的流行病学家Alain-Jacques Valleron说:“脱离现有的系统是无法进行疾病检测的。新系统的运行在很大程度上依赖于过去的检测系统。”
自2003年以来,今年是美国流感暴发zui早的一年,从2012年11月起流感开始蔓延,圣诞节刚过似乎就直逼上限。这也导致了更多严重的疾病和死亡案例,尤其是对老年人的杀伤力更大。因为正如2003年一样,今年引发流感的病毒也是H3N2——它是3个主要季节性流感病毒中zui致命的一种。
传统的流感监测在一定程度上取决于来自内科医生所报告的病例。他们通过国内网络报告疑似流感病例(ILI)。这类病人通常具有一系列症状,例如高烧。这些病征可用来确诊是否罹患流感。这种监测在随后得到了改进:通过检测一定数量具有类似症状的群体,来确定哪些人患有流感,哪些人不是。
自从1984年建立起监控网络以来,法国成为*个开展电脑化监控的国家。之后许多国家也开发了类似的网络:例如由位于亚特兰大的疾病控制和预防中心(CDC)监控的美国系统包括2700个医疗中心,每年约发现3000万例患者。
然而,当今几乎覆盖的互联网和迅速发展的社交媒体平台(例如推特)让人们看到了希望:这些技术可以更容易、更快速地估评ILI,并覆盖更广泛的人群。
这些新系统源自谷歌在2008年推出的技术。基于谷歌和CDC的研究,新系统依赖数据挖掘记录和计算机模型的结合,谷歌搜索引擎会显示与流感相关的搜索字词。该系统得出数据的准确性和CDC自身的监测数据不相上下,而且它的速度比CDC快,可以提前CDC数日发布数据。该系统已被推广到29个国家,并被拓广到监测另外一种疾病——登革热。