新冠肺炎疫情发生以来,思享广告利用互联网大数据对其进行持续追踪研究,就目前的数据表现来看,疫情已基本得到控制,建议大家保持适当警惕,但不必过度恐慌。
基本逻辑:基于个人体验明显、与疫情关联紧密的疾病症搜索趋势,对疫情发展进行研究。举例来说,一个人有可能因为种种原因隐瞒病情,但一旦觉得有感染的可能性,一定会自己在家里悄悄的搜索相关的关键词。从这个角度来说,搜索数据在反映疫情发展方面,有很好的参考价值,可以作为官方统计数据之外的一个补充。官方的统计对确诊和疑似价值较大,但也有人为因素所导致的偏性(如瞒报、漏报屡屡发生)。而搜索大数据追踪对于新发的患者及热点疫区早期发现价值更大。
此外,以下研究所涉及的搜索词内容,集中在患者自己体验明显的、与肺炎关联较强的疾病症状;由于媒体报道等所引发的恐慌性搜索(如口罩、双*连等)不在本研究范围内。
以下进入到具体研究内容:
一、哪些症状和疫情相关度更高?
从上图可以看到,干咳、发烧、呼吸困难、乏力等是与肺炎疫情关联较强的症状,且都在稳定下行中。
二、以武汉为代表的重灾区,哪些症状更突出?
图中第一列标特殊颜色的症状是武汉百度指数超过或者接近北京的一些词条(通常北京网民基础数量大,传统和自媒体机构多,一般现象都是北京的百度搜索数据远远大于武汉),所以中等网民规模的武汉高居榜首的病症搜索更值得持续跟踪。
三、各地疫情发展趋势判断
为了判断湖北,以及全国其它地区有没有出现新的疫区,以及疫情的变化趋势,我们从能够区分的最小数据颗粒度,对多个城市进行了分析。
疫情每天都在变化,但每天的数据会有波动,因此我们以5天为周期分段对比。
主要的发现:
1、从全国来看,跟疫情共振较强的词都在下降通道,即,总的说来,全国范围内疫情已经得到了基本控制。因为一般人们只是在疾病初期且没有确诊阶段会疯狂的搜索相关词条,一旦确诊或者入院后就不再拼命搜索了。所以通常在恐慌性搜索之后,如果没有新发病例,所有与疫情共振较强的词的搜索就会迅速下降,只有当不断有新的病例发生时,相关搜索才会持平甚至于上升。
如上图所示,第二节中提及的武汉搜索量较高、最能代表疫情的关键词搜索量来看,大部分省份处在连续下降区间。如果疫情在持续扩散,这一搜索量理论上会上升或者持平,但是目前最近的两个5天时间段均为下降。
2、从湖北省内来看,各个城市,代表性强的症状中,连续两个5天,各地基本都是下降的:
但是也要注意到,目前这些城市相关词的日搜索量,仍在疫情发生前的3~5倍,大家还是不能
放松警惕。
3、全国多个城市中,没有在最近两个5天持续上涨的:
综上,基本可以断定,重灾区武汉在平稳下降,全国其它地区也是控制的比较好的。不出意外,全国的疫情已经基本得到控制了。(如果想了解更详细的原始数据,可留言与作者联系。)
本文分析所用数据来源:百度后台搜索数据,以天为单位持续跟踪。
希望大家读完后点右下角的“在看”,能够让更大范围更多人受益,为抗击疫情尽自己的一份力。
大数据监测疫情系列好文推荐:
大数据新发现:“干咳(咳嗽)”对自我早期发现新型冠状病*肺炎更有价值
预览时标签不可点收录于话题#个上一篇下一篇