一个完整的BI解决方案中有多种工具来完成BI系统中各个阶段的工作。

ETL工具

数据抽取、转换和加载工具。优秀的ETL工具应该具有以下特性:

1、Workflow Management, Job Execution and Scheduling Manager。能方便地定义流程并自动化执行ETL任务。

2、Centralized Metadata Repository and Management。集中存储和管理符合业界标准的元数据。

3、Data Profile and Validation。可以检验数据的质量。

4、High Performance。在大负荷的任务执行中仍然有良好的性能。

5、Scalable, Platform Independent。具有良好的弹性,支持多种操作系统和数据库系统,能操作多种异构的数据源。

6、Open Architecture and API。具有开放的架构和易于使用的二次开发接口。

目前较为知名的开源ETL工具有:

1、KETL,由具有IBM和KPMG背景的Kinetic Networks公司开发,现在已经有三年多的产品应用历史,成功应用于一些产品中,在点击流(ClickStream)分析应用中表现出色。KETL采用Plug-in的架构,使用Java开发。

2、KETTLE,为一个元数据驱动的ETL工具。已经加入Pentaho。

3、Clover ETL,为一个基于Java的ETL Framework,可以用来开发自己的ETL应用。

4、Enhydra Octopus,为一个基于Java的ETL工具,使用JDBC来连接各种数据源,易于使用和部署。曾有人应用于电信网络资源分析系统中。

报表工具

优秀的报表工具通常具有以下特性:

1、支持多种数据源。

2、直观的可视化设计器,简单易用的报表定制功能。

3、方便的数据访问和格式化,丰富的数据呈现方式。

4、符合数据呈现的通用标准,能和应用程序很好地进行结合。

5、易于扩展和部署。

目前较为知名的开源报表工具有:

1、JasperReports,一个优秀的Java报表工具,始于2001,现在JasperSoft公司持续开发和支持该工具。该工具类似于商业软件 Crystal Report,支持PDF、HTML、XLS、CSV和XML文件输出格式,现在是Java开发者最常用的报表工具。

2、OpenReports,提供基于web的灵活报表解决方案,通过浏览器自动生成动态PDF,XLS,HTMLCSV 和Chart报表,它是用Java开发的,使用JasperReports 作为报表引擎,利用到的开源技术有Hibernate,Veloctiy,Webwork。

3、JFreeReport,现在是Pentaho的一部分,它是一个优秀的用来生成报表的Java类库。它为Java应用程序提供一个灵活的打印功能并支持输出到打印机和PDF, Excel, HTML和XHTML, PlainText, XML和CSV文件中。

4、Eclipse BIRT,是Eclipse下面的一个企业智能和报表 工具,能为J2EE的WEB应用程序创建漂亮醒目的PDF或者HTML格式的报表,它提供了核心的报表功能。

OLAP工具

联机分析处理工具。目前开源的OLAP工具也分为MOLAP、ROLAP和HOLAP,优秀的OLAP工具通常有以下特性:

1、良好的执行性能,能快速地进行分析处理工作。

2、良好的适用性和可伸缩性。

3、开放式接口和丰富的API。

目前较为知名的开源OLAP工具有:

1、Mondrian,是Pentaho的一部分,为一个用Java开发的OLAP服务器,实现了MDX语言、XML解析和JOLAP规范,可以不写SQL就能分析存储于SQL 数据库的庞大数据集,可以封装JDBC数据源并把数据以多维的方式展现出来。

2、JPivot,是一个JSP 自定制的标签库,可以绘制一个OLAP表格和图表。用户可以执行典型的OLAP导航,如下钻,切片和方块。它使用Mondrian 作为其OLAP服务器。它使用WCF (Web Component Framework) ,基于XML/XSLT来渲染Web UI组件。JPivot在元数据缓存方面的过于简化的整体性初始化装载的做法将限制它只能处理很小的立方体(Cube)。

本文地址:开源BI系统中的工具

Tag :, , , , , ,

暂无留言我要留言 »

必填

必填,绝不公开