“大数据”从“小”做起,小数据也有大作为

2016-09-18 08:09 来源:上海大数据联盟
浏览量: 收藏:0 分享

2.jpg

  数据不能因为大小和多少来定义它们的用处,有针对性和创新的设计、收集和分析才能让数据发挥最大的作用。在“大数据”的浪潮中,从“小”做起或许会是个更有效的起点。

  近几年来无论在公共还是私营部门,数据的收集-分析-使用,特别是所谓的“大数据”,成为了最炙手可热的技术和话题。在政府和企业都享受着数据带来的红利之际--例如评估现状、改善经营、提高效率和生产力等,相对的,公益界在这方面却显得有些”落后“,甚至对大数据浪潮感到有点”不知所措“。这种情况不仅在发展中国家出现,在公益机构运营相对更成熟的发达国家中,非盈利组织对于数据的使用也存在很多困难和挑战。在很多公益人眼里,数据的收集-分析-使用是一项奢饰品,不仅要先进的技术还需要聘请专业人员对数据进行分析,更别提收集数据需要占用项目人员本来已经不够用的工作时间。在没有看到数据带来的红利之前需要先投入大量的财力和人力建立数据系统,这对于很多经费紧张的草根公益组织来说并不合算。

  在美国,为了降低收集和分析数据的成本,一些机构和基金会创建了各种低花费甚至免费的平台和工具供旗下的草根组织使用。 科技的创新与进步也为降低数据的“门槛”带来了希望。例如,各种支持问卷设计和多渠道发布的在线工具(SurveyMonkey,腾讯问卷等)为数据收集带来了前所未有的便利。在政府方面,为了鼓励数据的使用,很多部门都有针对数据的能力建设和专项基金,为包括非营利机构在内的各种组织提供技术培训和支持。笔者在评估工作中也参与过大大小小的针对数据方面的能力建设项目,包括提供数据收集和分析的解决方案和帮助机构使用已存在的各种数据来解决问题。

  然而,即使科技的进步和各种针对性的帮助降低了对使用数据在技术和预算上的要求,非营利组织在这方面的发展仍然不尽如人意。在参与项目的过程中,笔者留意到除了以上两个因素,对数据,特别是“大数据”的错误理解也成为了阻碍数据使用的一大障碍。

  每当谈到数据,很多人就联想到“系统”、“全面”等关键字,正如“大数据”字面所暗示的,似乎只有广而深而多的数据才能解决问题。虽然像“数据越多越好”这样的说法有失偏颇,但不可否认,数据的多少确实很大程度上关系到信息的准确度和全面性。因为这种想法的存在,很多草根公益组织在开始进行数据收集或建立数据系统的时候,总希望能测量尽可能多的指标,建立尽可能完善全面的系统,而这也往往导致了这类系统的失败。主要原因有二:1。很多指标收集了数据却没能使用上;2。摊子铺得太大以致人力物力难以为继。当资源有限而数据之“大”又不可实现时,很多草根组织就认为他们的“数据之路”不再有出路而因此放弃了数据。那么,数据是不是除了“大”就无路可走了呢?

  美国的“社区在学校”(Communitites in Schools - CIS)是一个有着40多年历史的针对学生辍学问题的公益组织。他们与全美各地的初中和高中合作,在防止学生辍学、提高毕业率和大学升学率方面作出了很多努力和贡献。最近,CIS与蒙大拿州一个小镇的高中接触,希望能帮助他们解决日益严重的辍学问题。根据学校的老师反应,学生辍学后就很难让他们回到学校,所以老师们希望CIS能帮助他们发现“准辍学”的学生并阻止辍学的发生。

  拥有多年理论和实践的经验,阻止辍学本来就是CIS的强项——当他们知道谁要辍学的时候。按照传统的法子,CIS会在学校建立一个数据系统,然后对每个学生进行多次多方面包括心理、家庭环境、学习成绩等的测量和评估,最后根据结果判断出最需要关注的“准辍学”学生。但是迫于小镇高中非常有限的资源(包括缺少资金和老师来对每个学生进行评估),CIS的团队不得不放弃了他们传统的方法,改而在公共数据和学校已有的数据中寻找解决途径。他们发现这个学校要求学生每天上课都交给老师一个“报道”卡,里面简单的记录了学生的出勤情况和作业完成情况。老师们通常都只是在上课前看看这个报道卡,然后就把它们锁在抽屉里了。这个看似简单的报道卡却引起了CIS团队的注意,虽然里面的数据很简单,但他们觉得如果把学生每天的情况连起来看,或许能发现辍学的端倪。

  他们用EXCEL做了一个简单的数据收集模板,并要求老师们把每个学生的报道卡输入到模板中,这个过程大概需要老师每天花费10-15分钟的时间。老师们都觉得这个数据收集程序简单易用并且花的时间也不长,因此他们都能坚持数据收集。一个学期以后,数据积少成多,CIS团队继续用EXCEL为每个学生画出了出勤和作业情况图表。通过对比他们发现有的学生在某段时间会突然连续出现迟到或不上学的情况,作业的质量也比以前降低。根据他们过去的经验,这些学生可能正徘徊在辍学的边缘。CIS团队在第二个学期对这部分学生进行了跟进,发现他们确实因为各种原因有辍学的念头。团队专家为这些学生提供针对性的咨询和指导,挽回了大部分有可能辍学的孩子。

  笔者相信资源紧张的情况对很多草根公益组织来说并不陌生,以上的案例让我们看到“小数据”也可以大有作为。数据不能因为大小和多少来定义它们的用处,有针对性和创新的设计、收集和分析才能让数据发挥最大的作用。在“大数据”的浪潮中,从“小”做起或许会是个更有效的起点。

标签:

责任编辑:admin
在线客服