JimoHD为Hadoop提速的大数据方案产品

2015-12-02 10:12
浏览量: 收藏:0 分享

  JimoHD完美结合Hadoop的稳定性、成熟性与JimoDB高性能、全功能优势,提供基于Hadoop的大数据完整解决方案。JimoHD大幅提升Hadoop的业务能力,实现了快速查询、快速统计报表、多维数据库以及实时大数据等原生态Hadoop无法覆盖的应用领域。JimoHD适用于已经购买或使用了Hadoop产品但对功能支持不满意、查询速度慢、应用开发难的企业。

  JimoHD集成Hadoop,数据仍然保存在Hadoop上,为Hadoop提供数据库服务、快速查询、快速数据分析、自助式数据集市、可视化大数据应用开发。

JimoHD的特色优势

在Hadoop上实现极速查询

  大数据的核心价值不仅是“大”,更重要的是“快”,大数据唯有快方显其商业价值;大数据真正的挑战也不是“大”,而是“快”。Hadoop将“大”做到极致,但在性能上尚有较大差距。

  一个大数据系统其战略不仅仅要关注如何将数据放到系统中,更重要的是如何将所需的数据实时快速地拿出来。而原生态Hadoop本身并不支持索引,数据查询只能通过MapReduce全表扫描,无法实现快速查询。

  JimoHD通过为Hadoop上的数据创建索引实现快速查询,利用JimoDB的“Dynamic Prunable Index”专利技术,上万亿条数据的查询基本都可以在10秒内完成。而创建索引可以通过SQL很容易完成。当Hadoop数据变化时,Hadoop将通过JimoDB提供的API实时更新索引。

在Hadoop上实现快速统计报表

  用户通过JQL(JQL是JimoDB提供的SQL,从多个方面扩充了SQL,包括统计功能)建立统计模型,JimoDB根据所建统计模型实时从Hadoop上获取相应数据,为这些数据做相应预处理并创建与之对应的统计数据库。当数据发生变化时,Hadoop通过JimoDB提供的API实时更新统计数据库。JimoDB强大的快速统计报表功能实现上万亿条数据统计基本都在10秒内完成。

在Hadoop上实现多维数据库

  JimoDB是一个多态数据库,内置高性能文档型数据库、关系型数据库、列数据库和全内存数据库。JimoDB采用Hybrid Database体系结构,数据只保存一遍,各数据库之间采用统一的数据结构,避免了数据库之间大量搬迁、重复存储。而其他同类产品往往是多个数据库的混合体,缺乏统一设计、统一存储。

  在JimoHD 中,数据仍然存储在Hadoop中,JimoDB为这些数据建立统一抽象数据,数据管理、处理、查询、统计、分析等由JimoDB智能地确定什么样的应用场景用什么数据库实现,结构化与非结构化在统一的框架下完美结合、关系型数据库、文档型数据库、列数据库、全内存数据库在统一抽象数据打造一个强大、灵活、高性能NoSQL/SQL数据库。

在Hadoop上实现实时大数据

  Hadoop源于搜索引擎,架构在以批处理为核心的MapReduce之上,取得了非凡的成就。但随着大数据的深入,MapReduce慢慢成为Hadoop的软肋,影响着Hadoop的发展。 JimoDB源于实时数据库,系统由C++开发,高性能是JimoDB的核心。JimoHD 完全放弃Hadoop的MapReduce,通过紧密集成HDFS,从多个方面为Hadoop加速:

  ●流数据处理引擎

  ●快速查询引擎

  ●快速统计报表引擎

  ●全内存数据库

在Hadoop上提供数据分析平台

  JimoHD 提供了自主研发的灵活易用的数据分析平台(Adaptive Analytics Platform)。客户使用该平台可以快速创建查询统计,并可以实时预览。若用户对创建的查询统计不满意,用户随时可对查询统计进行修正直至满意。同时,JimoHD 的Adaptive Analytics Platform为用户提供了丰富的数据查询统计结果的可视化视展现方式,用户可以创建多种可视化的数据查询统计分析图表。在数据查询统计结果方面,平台也提供了结果报表的在线生成及导出功能,由于查询统计结果存储在云端数据库,用户也可以把在线结果分享给他人。 无论需要处理的目标数据量有多大,上述一切工作都可以非常快捷的完成。可以说JimoHD 的Adaptive Analytics Platform“消灭”了数据科学家,因为“人人都是数据科学家”。

在Hadoop上提供可视化大数据应用开放平台

  通过传统手段开发大数据应用极为困难,即使对有经验的开发工程师来说也是巨大的挑战。在一般系统中微不足道的诸如拷贝数据这样的操作,在大数据里都可能变得极为棘手。为此JimoHD 提供了一个基于可视化无编程的大数据应用开发平台。该开发平台将大量的海量数据处理的功能平台化,开发者可以在不写一行代码或非常少的代码下,快速开发各种大数据应用。即使是运营商级别的大数据处理系统的开发时间也可以控制在数周以内,而且可以做到边开发边测试,开发完成即可交付使用。


标签:

责任编辑:管理员
在线客服