15天完成14亿人口普查数据登记,如何做到的?

机电学院浏览次数:  发布时间:2020-11-10

澎湃新闻记者 张若婷

11月1日,第七次全国人口普查正式进入登记阶段。此次普查是我国首次使用电子化方式进行登记,由腾讯云联合企业微信提供云计算、大数据等核心技术支持。如何在短短15天内完成我国14亿人口的普查数据登记?如何缩短登记时间同时保证数据安全?澎湃新闻记者采访了国家统计局工作人员与负责普查电子采集器技术开发的腾讯云、企业微信相关人员。

腾讯政务云副总裁王景田向记者介绍道,此次人口普查的技术方案利用了企业微信这一现成产品,同时把普查需要的特定数据审核关系架构在上面。

这就意味着,如果公众选择自主申报,那么打开个人微信扫描普查员出示的二维码即可;而对于700万入户普查员来说,则可以把他们看成一个公司,在企业微信的框架基础上,普查员将进行数据的电子化登记及加密上传,实现“智能终端做普查”。

据介绍,我国第七次全国人口普查项目筹备于今年3月启动。腾讯云、企业微信相关员工与国家统计局工作人员合作,在新冠肺炎疫情期间完成了电子化的所有准备。

“我们应用了TDSQL和Tbase的数据库产品,目前它们一起承接了每秒接近50万次更新,这标志着我国的国产数据库技术完全可以满足政府金融的数字需求,而且在任务量这么大的极端情况下安全可靠。”王景田表示。

王景田称,这一技术在研发实施的过程中,首先面临着“人和户要对应起来”的难题,这是一个复杂关系,也是时刻变动的关系,要把信息捕捉准不容易。

“项目开始后,我们发现我们对业务理解还是简单了,登记的这15天里所有人员是流动的,比如一个人今年在北京,第二天又在深圳,”他举例称,由于一个人在15天内可能在多个地点出现,其数据可能被多次重复登记,所以需要后期进行校验,有一个“数据排重”的过程。

同时,在普查员完成登记后,要把数据间的逻辑关系搞清楚。例如普查员上门进行登记后,会发现家庭关系、父母子女关系、夫妻关系等多种社会关系,这些关系在数据处理工作中意味着,每一个数据都需要经过700多条业务规则的校验,这对整个系统来说是十分复杂的。

“大量的数据要收集上来,同时数据的更新和数据的查询是互相交错的,所以我们做了双数据库设计,一个数据库专门用来做生产系统的处理,另一个数据库用来查询。”王景田说。

此前,北京市昌平区统计局副局长、区人口普查办常务副主任王建华曾对澎湃新闻记者表示,入户登记阶段基本上是1个普查员负责一个普查小区,工作量在250到300人之间。

通过配置了“定制版”企业微信的Pad或手机电子采集器,普查员通过询问户主进行包括个人基本信息、住房、婚姻生育、死亡等情况的登记,再用电子采集器扫描、自动识别身份证号码等信息,点击上传,一次入户登记就完成了。与2010年全国第六次人口普查的纸表入户登记方式相比,电子采集的方式将登记时间缩小到了20分钟以内,也很大程度上降低了后期数据录入、处理的难度。

普查员电子采集器工作台展示

在此前接受澎湃新闻记者专访时,国家统计局副局长、国务院七人普领导小组办公室主任李晓超曾表示,在数据传输过程中,这次普查采用互联网云技术、云服务和云应用部署,按照国家网络安全三级等保的标准进行安全管理。同时移动端和服务器端采取了严密的数据加密和脱敏技术,数据传输过程全程加密,保证公民个人信息不在互联网通道泄露和落地,确保公民个人信息的安全。

王景田对于数据传输过程中的安全保护进一步介绍道,数据采集之后,从留存本地到链路过程中全部有加密程序。同时,数据采集后将直接到达统计局的数据中心,中间没有任何节点。他表示,保护个人隐私,一直是移动互联网业务拓展过程中很重要的方面,截止到目前,此次人口普查的登记工作中还没有发现出过数据安全问题。

值得注意的是,基于移动端的电子化普查手段,不仅是我国普查工作的一个技术革命,同时也引领了国际上普查手段的技术进步。

目前,国外的人口普查大多是基于PC端的,但我国此次采用的移动化终端采集可以说是电子化普查的最新手段,因此在国际的普查数据采集方面都起到引领作用。

王景田称,在15天的入户普查登记结束后,将是数据整理、分析的过程,腾讯云仍将对后期数据分析等环节独家提供技术支持。

本期编辑 常琛