自进入2020年以来,新冠病毒感染的肺炎疫情迅速霸占了各大社交平台的热搜榜。疫情发展到今天,我们经历了一回最少人次的春运,一次最感人的春晚和一场最特别的无人元宵晚会。新冠病毒给全国带来了方方面面的影响,也让举国人民处在紧张不安之中。
最开始,我们每天醒来的时候看到的是指数增长的确诊病例数。在党中央的领导下,全国人民众志成城抗击疫情,现如今已经得到了大幅好转,看到日渐下降的确诊病例和日渐增长的治愈人数。尽管如此,我们依然不能放松警惕,而是需要针对前期的病毒扩散进行总结与反思,追溯疫情散播的始末,提取散播过程中的主要特点,助力疫情的后续防控,以做到更好地防范于未然。
依托各省疾控中心发布的病例数据和各大新闻媒体发布的确证患者的行踪路线,欧宝app官方网站下载Acemap团队借助可视化手段以及相关的大数据处理、文本分析和知识图谱技术进行了确诊病例数据、患者行踪路线以及新闻数据的数据整合建模,构建了一系列数据的可视化图谱,病例地图、患者迁徙地图以及省-市-区-县患者行踪图谱。下面将分别对各类可视化成果进行展示与剖析。
人口的迁徙与病毒的爆发:政策正确性限制了病毒的扩散
对此,我们绘制了病例图与迁徙图,分别介绍如下:
从1月24日起,各省疾控中心群提供公开的病例数据,此图就是从2020年1月24日记录到了2月17日。每日的数据更新均是来自各省疾控中心的公开数据。
从2020年1月1日百度鹰眼便提供了人口迁徙系数的数据,我们结合人口比例计算出了人口迁移的人流比例,记录了2020年1月1日到2月17日的人口移动变化。每日更新数据均来自百度鹰眼API。
在这两个动图的对比中我们可以发现,在疫情发展的早期,人口迁徙各省之间从武汉迁出的是维系在一个相对均衡的水平线上,我们发现从1月21日开始就已经有明显的人口迁移数目的下降,这比武汉1月23日封城提早了两天,但是考虑到钟南山院士在1月20日的采访中说明了新型冠状病毒具备人传人的特性,说明人们还是有相当大的自觉性,公民的公共卫生意识有所体现。以Acemap团队所在实验室的很多同学为例,他们大都表达了原本已制定节假日走亲访友以及旅游的计划,但在钟南山开始强调事态的严重性之后纷纷取消了原有的出行计划。
若我们将两幅图结合起来进行对比观察,不难发现,封城在大大减少人口迁徙的同时,也可以将病毒锁定在当时的位置。虽然这可能带来一定的经济社会发展的牺牲,但是在全国范围内来看,对疫情的控制是非常正确和及时的手段。这也不得不佩服武汉,佩服湖北,这是一个英雄的城市、英雄的省!
各省确诊患者行踪图谱:每个省市均有自己的总体病例特点
由于湖北内的病例数据量非常庞大,病例数据在短时间内更新自然是一件很难做到准确的事情,于是我们暂时致力于除去湖北省外全国其他各省的患者传播轨迹上的异同。
我们将各大媒体提供的各省市确证病例的行踪轨迹数据爬取下来,按照虚拟点映射的方式缩到各省实际的确诊病例的数目,同时对每名患者的行踪路线进行基于LDA的文本主题识别,划分为探亲、聚餐和乘坐交通工具等五个行动,绘制了除湖北省外所有的以及各省的确诊患者的行踪路线图谱。下图罗列了其中一部分原始数据。
基于上述绘制依据,我们首先给出全国范围内的患者行踪图谱,该图谱是基于全国范围内(除湖北)的5072份确诊病例进行绘制的:
通过这个图,图中的点占有的空间越大,就意味着占的比重最大,通过这幅图我们明显发现密切接触的带来的传染可能性最大。所以如果大家在此期间一直处于宅家模式,没有与确诊病例进行过密切接触,大可不必在居家过程中产生无故的恐慌。同时,我们发现过年探亲带来的感染比重非常小,说明在回家的列车上面存在传染源但是比重很小,所以为保证自己不受感染,用距离暂存亲情是最好的方式。毕竟,当前形势下,家人聚餐少一次,亲情守护多一点。
与此同时,我们也分析了各省之间的病毒传播模态的相似性,并相应绘制了全国除湖北外各省市自治区和特别行政区的病患传播知识图谱,由于篇幅的原因,在此不尽数罗列,我们在此挑选了几个有代表性的:
下面我们看看省与省之间的病患传播轨迹异同之处。
我们发现这两个省都是外来人口大省,广东是外来务工人员最多的省之一,河南是返乡务工最多的大省之一,存在着华南和华北地区最大的交通枢纽城市广州和郑州。有着非常大的疫情爆发的压力,但是由于政府的管辖得到,最早宣布进入一级戒备和相关举措,除了涌现出很多网红的村支书,还很好的将人们劝说到了家中,所以家属感染占绝大多数。
这两个省的图就可以很明显看出来,黑龙江省有着比较明显的患病年龄段,以及大量的病例集中在了哈尔滨市,而重庆没有特别明显的传染途径,各种传染方式在重庆比较均衡,这说明两个省或直辖市的人员流动的特点,重庆市作为西南地区的特大城市,在传染病的传播途径下也是非常复杂的,这给重庆市政府带来了很多的难题,而黑龙江省则是具备年轻人出来务工的数量占大数的特点。
按照从1月24日到2月17月日的时序的角度看待这四个省市,我们会发现,随着时间,各省市都有突然的爆发期,但是在这些省市的有效控制下,还是有着不错的防控结果。
确诊患者迁徙轨迹数据可视化:四通八达的交通加速了病毒的传播
根据各地卫健委公布的患者迁徙轨迹信息,我们对信息进行整合,完成了轨迹文本中地名信息的提取。并根据百度地图API提供的地理编码功能,实现地名向经纬度的映射,从而根据经纬度得到确诊患者在区县级迁徙的轨迹,从而完成较细粒度的轨迹提取,并得到格式化的轨迹数据。然后我们根据这些数据完成了确诊患者迁徙轨迹数据的星云图可视分析。
上图包含省份,市,区县等行政区,以及确诊患者节点。省市区县患者之间通过行政区之间的归属关系建立连边。省与省,市与市,区县与区县之间通过确诊患者的迁徙数据建立连边。红色节点代表省级行政区,绿色节点代表市级行政区,蓝色节点代表区县级行政区,其余节点代表确诊患者。行政区节点的大小与该地区确诊患者数目呈正相关,可以发现湖北省处于图的正中心,且确诊人数最多。其中图的绿色部分展现了患者在不同城市之间的迁徙情况,湖北省的各省市,包括武汉市处于中心位置,这使得大多数的迁徙轨迹均经过这些城市,该类型的轨迹实现了病毒的直接传播;但是也存在少量轨迹并未与这些城市相连,这些节点分布在绿色区域的边缘,这说明病毒完成了间接传播。例如,西藏自治区的唯一一例患者,其迁徙轨迹并未与武汉市直接相连,而是通过青海省的西宁市进行了疫情的传播,即完成了病毒的间接传播。幸运的是,由于武汉及时封城,这些节点所代表的城市并没有出现大规模病毒爆发,从而有效抑制了病毒的传播。
下面根据确诊患者迁徙数据,将以上大图拆分成三张省与省,市与市,区县与区县之间的确诊患者迁徙数据的星云图,并进行分析。
省级确诊患者迁徙数据可视化:患者人数与省份在星云图上与湖北省的距离正相关
该图为基于确诊患者迁徙数据绘制的患者省际之间迁徙的星云图,非常明显湖北省处于图的正中间,其确诊患者数目最大;图的配色采用热力图的配色方式,颜色越深,代表确诊患者越多;节点的大小与该省确诊人数呈正相关,边的粗细与患者在两省之间迁徙的轨迹数目正相关,可以发现,确诊人数较多的省份与湖北省在图中的欧氏距离较近,确诊人数较少的省份与湖北省在图中欧氏距离较远,可以得出与湖北省在星云图上越近的省份越容易感染肺炎。
将图的局部进行放大,我们可以发现广东省、河南省、山东省、重庆市等省级行政区处在湖北省外最邻近的一环,且这些省份或直辖市确诊人数高于其他省份,并且可以发现这些省份或直辖市与湖北省之间存在较粗的连边,这说明湖北省与这些省份之间存在较多的患者迁徙,从而导致这些省份疫情的大规模爆发。而处于图边缘的节点相比内部节点来说,确诊个数较少,且与湖北省直连的边权重较小,可以得到除湖北省以外的省份对于病毒传播的加速作用也不容小觑。由此也可以发现在交通运输高度发达的今天,对于疫情防治,切断疫情的传播途径是多么重要。
市级确诊患者迁徙数据可视化:轨迹多起源于湖北省各市
该图为基于患者迁徙数据绘制的患者城市之间迁徙的星云图,非常明显武汉市处于图的正中间,其确诊患者数目最大;同样,该图采用热力图的上色方法,颜色越深表示确诊人数越多。
在局部放大图中可以发现,确诊人数较多的均为湖北省下属市与省属直辖县,这表现由于这些市级行政机构与武汉存在地理位置上的邻近,所以导致在并未采取有效防治措施之前,患病者在这些区域的大量迁徙,导致这些城市疫情的大规模爆发。除此之外,我们也发现图中存在一个迁徙路径的汇聚点,位于右图的左下角,这个点代表的城市为山东省济南市。济南市为北方各大城市之间重要的交通枢纽,有大量患者的轨迹相交于此。由此可知,若早期对各大交通枢纽城市进行相关疫情排查,防治患者通过交通枢纽向全国迁徙,可有效防治疫情的进一步传播。
除此之外,亦存在一些并未与湖北省各市直接相连的轨迹,因此在城市之间,对外来人员的全面排查,可有效防止包括湖北省各市以外的其他省市外来人对于疫情的传播。
县级确诊患者迁徙数据可视化:排查轨迹相交区县可对预防疫情起到积极意义
该图为基于患者迁徙数据绘制的患者区县之间迁徙的星云图,非常明显武汉市相应区处于图的正中间,其确诊患者数目最大;同样,该图采用热力图的上色方法,颜色越深表示确诊人数越多。
在局部放大图中可以发现,确诊人数较多的均为武汉市相应区,并且在图的上部发现少量节点存在大量轨迹相交的现象,可在这些节点相应的县区,进行相应疫情的排查与管控工作,从而有效切断病毒的传播,得到抑制病毒传播,控制疫情扩散的效果。
区县级星云图能够为疫情的防治提供较细粒度的参考,在轨迹相交的区县进行重点监察与防疫,可使得各方面资源利用达到最优程度,大大提高疫情的防治效率,从而有效控制疫情的传播。
总结