漫话数据扶贫

2014-06-27 19:52林鄂平
中国扶贫 2014年8期
关键词:试衣间准点晚点

林鄂平

随着国务院扶贫办印发《扶贫开发建档立卡工作方案》,全国大规模的建档立卡工作拉开帷幕。

建档立卡是做什么?概括地说,就是在全国范围内建立贫困户、贫困村、贫困县和连片特困地区电子信息档案,以此为基础,构建全国扶贫信息网络系统,为精准扶贫工作奠定基础。

这次全国性有组织的建档立卡工作,核心是“数据”,虽然距离“大数据”尚有一段长路,但这个工作的挑战性和时代感,给人以乐观的想象。

《大数据时代》这本书,开篇讲了Google通过人们在搜索引擎上搜索关键字留下的数据,成功地预测了2009年美国H1N1的爆发地与传播方向,以及可能的潜在患者的事情。Google的预测比政府提前将近一个月,而且其预测与政府数据的相关性高达97%,这个数字就是大数据时代预测结果的相对准确性与事件的可预测性的最好证明。通过这一事以及其他的案例,作者维克托提出了在大数据时代“样本=总体”的思想。

回过来看看“建档立卡”的几个数据要求:以2013年农民人均纯收入2736元的国家农村扶贫标准为识别标准;规模原则上以国家统计局发布的2013年底全国农村贫困人口规模8249万人为基数,省级统计数大于国家发布数的可在国家发布数基础上上浮10%左右,个别省级统计数与国家发布数差距较大的,上浮比例可适当提高。内容包括家庭基本情况、致贫原因、帮扶责任人、帮扶计划、帮扶措施和帮扶成效六个方面。

这几个数字说明了什么?当样本无限趋近于总体的时候,通过计算得到的描述性数据将无限地趋近于事件本身的性质,而 “样本<总体”的做法很大程度上无法做到更进一步的描述事物。这次建档立卡虽然主题还是基础性数据收集,但几乎全覆盖式的“样本=总体”的测算方式,正是大数据时代的主流。

举一例,是关于奢侈品营销的。PRADA 在纽约的旗舰店中每件衣服上都有RFID码。每当一个顾客拿起一件PRADA进试衣间,RFID会被自动识别。同时,数据会传至PRADA总部。每一件衣服在哪个城市哪个旗舰店什么时间被拿进试衣间停留多长时间,数据都被存储起来加以分析。如果有一件衣服销量很低,以往的作法是直接干掉,但如果RFID传回的数据显示这件衣服虽然销量低,但进试衣间的次数多,那就能另外说明一些问题,也许只是某个细节的微小改变就会重新创造出一件非常流行的产品。

再举一例,中国的航班晚点很普遍,相比之下美国航班准点情况好很多。这其中,美国航空管制机构的一个做法发挥了作用。说起来也非常简单,就是美国会公布每个航空公司、每一班航空过去一年的晚点率和平均晚点时间,这样客户在购买机票的时候就很自然会选择准点率高的航班,从而通过市场手段牵引各航空公司努力提高准点率。这个简单的方法比任何其他管理手段都见效。

两个例子意在说明,海量数据的产生、获取、挖掘及整合,使之展现出巨大的商业价值,这就是最通俗的大数据解释。信息技术发展,数据指数级增长,正在改变政府、社会、商业群体的传统决策方法,形成一种数据驱动的决策方法。

于此,我们可以提出一个概念:数据扶贫。这次开展的全国大规模建档立卡工作,是通过收集全面、准确的数据建立网络信息平台,整个运作体系和内容实质就是数据扶贫。

大数据时代对人类的数据驾驭能力提出了新的挑战,未来的扶贫开发工作,决策将日益基于数据和分析而作出,而并非基于经验和直觉。扶贫数据平台一旦建立,驾驭数据就不是一个简单机械的“更新”所能承载,如何盘活数据资产将是一个具有无限潜力和空间的议题。

对于数据扶贫的未来,你想象到什么了呢?

猜你喜欢
试衣间准点晚点
基于马尔科夫链的高铁列车连带晚点横向传播
晚点的火车(外三首)
“称霸”试衣间
准点
返古试衣间
准点率前十,日本机场占五席
高速铁路初始晚点致因-影响列车数分布模型
淘宝试衣间
值得期待的购物技术
圆锥曲线“准点”的又几个性质