大数据,倾听民生的耳朵

2016-06-29 16:06 来源:杭州数梦工场科技有限公司
浏览量: 收藏:0 分享

  “6月份便民服务热线共接到市民有效电话4753个,本月民众关注的热点话题为:过户、入学、社保卡、幼儿园等。其中值得注意的是,根据历史10个月的热线记录分析,预测在车辆管理方面的咨询在下月将会增长达到15%,可适当增加该方面对于市民的知识普及宣传。从拨打热线的区域上看,A区对于教育政策咨询量一直最多,该区域学区较多且学校即将开学;而B区和C区对于热线的咨询集中在劳动社保以及车辆管理方面……”

  ——这是一则利用大数据分析后某城市的便民服务热线工作简报。

  传统热线业务的分析结果呈现可能是这样——

0.webp (1).jpg

  然而,作为连接百姓和政府的重要信息窗口,便民服务热线长期积累了成千上万条由话务员输入的大量文本数据,其背后所蕴藏的海量信息却常就此埋没。当大数据遇上民生热线,再施展一些可视化的“魔法”,便民服务热线的分析后台则可以这样呈现——

640.webp.jpg

  其实民生可以这样听

  民生数听是数梦工场推出的基于热线类业务的大数据解决方案,通过收集民生相关数据,利用自然语言处理、机器学习、LBS统计分析等大数据相关技术,可以通过关键词、事件内容、时间等维度对热点事件进行全局统计展现;通过算法判断相关热点民生、事件发展走向;利用位置信息进行事件区域定点。为政府、相关企业等提供决策支持。

  民生数听能够听到什么?

  热线系统后台记录着大量对于民生业务描述的语义复杂的中文文本,“民生数听”能够“听”懂人话,并得出分析结论,关键在于两点:一是对于文本数据的分析;二是分析算法引入“话题”概念。

  众所周知,非结构化数据处理往往需要攻破技术难关,“民生数听”能够从这些文本数据中通过中文分词、关键词提取、同义词识别、文本分析、话题识别等自然语言处理技术将文本信息格式化,提炼出重要信息,然后再通过统计建模等算法进一步深入分析。

  同时,热线电话常会就同一种事件分类询问不同子话题,如“公积金”相关的有“住房、购房、社保、商业贷款”等。与此相应,民生数听引入“话题”的概念,基于对超大规模文本语料进行训练,结合在自然语言处理方面的经验积累,进行语义联想,对已知事件分类的基础上进一步细分、提取,并通过自动化手段结合话题、历史变化、区域分布等多维度综合分析当时、当地热点事件情况和走势。从而帮助政府相关单位更好的“听”懂民情——

0.webp (2).jpg

  除了面向高层汇报以及参观展示的可视化大屏方案,民生数听还提供了面向数据分析人员的交互查询方案,能实现事件搜索、事件洞察、区域洞察等功能。对关键词、关键区域和关键时间进行搜索查询,也能实现对于关键词下不同话题的比例。

  不止于“听”民生

  民生数听作为定制化产品,分析和呈现数据的维度均可定制化,事件不局限于民生类数据,其他文本数据如企业、公安热线、案件系统,均可以支持定制化开发处理,以实现文本分析并进行可视化数字化呈现。

  享受数据技术带来的价值,将贴近百姓的民生服务和数据技术结合产生碰撞的火花,挖掘数据的价值,在具体应用场景下使用成熟的大数据平台和领先的算法技术,不仅驱动互联网+政务服务,也助力民生幸福。


标签:

责任编辑:admin
在线客服