技术白皮书
版本:5.0
天津南大通用数据技术股份有限公司
目录
第一章 产品概述
产品介绍
GBaseBI V5是南大通用公司面向海量异构数据分析,以独特的语义映射和内存计算为基础,以“可视化”展示为重点的一款高性能数据分析平台;具备满足企事业单位对KPI指标监控、数据预测、数据预警、数据汇总和数据可视化展示等需求的能力。
GBaseBI V5整体采用B/S构架,Server端采用J2EE构架,完美支持各种操作系统;客户端采用Flex和Html技术,兼容主流浏览器。GBaseBI V5功能模块组成主要包括:
1.集成服务(BIServer)
BIServer是整个系统的核心,负责存储并管理用户、目录、数据源和模型信息,验证目录访问、数据源和模型数据查询,并记录日志和处理数据迁移,为产品安全、稳定及可靠性提供重要保障。
2.门户(Workshop)
统一的内容和应用发布及使用平台,可定制属于用户自己的工作空间,更贴近业务需要,支持多种展现平台。
3.吉图,可视化分析与应用 (gChart)
创造性的将复杂的可视化分析应用采用零编程工具实现,赋予数据分析全新的方式。从而脱离简单的统计图形和数据的静态堆砌,创建内容丰富、交互灵活和效果精彩的可视化分析应用。
4.吉查,即席查询(gQuery)
无需了解数据结构和编写程序,即刻快速查询所需数据,并可对查询结果进行再计算。预警规则设置和绘制统计图形等功能,便于更清晰地解读数据。
5.吉阅,阅读与交互分析(gShow)
用于阅读图表内容和使用分析应用进行互动式数据分析的多个工具集合,同时支持早期PC浏览器(Flash技术)和新浏览器及移动设备(HTML5技术)。充分考虑用户系统和设备的多样性,确保跨平台提供内容阅读和数据分析能力。
产品定位
GBaseBI产品定位如下图所示:
图1-1 产品定位
GBaseBI定位于企事业单位,能够提供从数据报告、分析到展示全过程的解决方案。
GBaseBI的用户分析大致在如下三个层次上。
图1-2 用户层次划分
模型完成数据查询和组织,提供业务支撑。吉查和吉图能根据业务对数据进行汇总分析,而管理者和决策层只需要关注吉阅,即查看交互分析结果,从中发现数据规律、发现业务价值。
产品架构
GBaseBI V5是完全基于B/S构架的数据分析工具,其总体构架如下图所示:
数据存储层
数据访问层
服务层
设计层
展示层
访问层
数据集
数据源
数据模型
数据落地
行函数
聚合函数
数据回写
数据缓存
数据源权限
数据挖掘
语义映射
数据行、列权限
统一认证与授权
数据查询
CMS
任务调度
GIS
配置管理
即席查询(吉查)
交互图表(吉图)
浏览器
客户端PPT
门户
Show吉阅
文件数据
关系数据库
大数据
图1-3 产品构架
在展示及设计层面的门户、吉阅、吉查和吉图在实现中都是相互独立的Web项目,系统自带优化的Jetty服务器,门户、吉阅、吉查和吉图都集成在系统自动的Jetty服务器中,他们都依赖于服务层和数据访问层,服务层的功能集中在BIServer项目中,以OAUTH2.0协议接口的形式提供文件管理和查询。门户中显示的个人文件数据均需要调用BIServer对应的接口才能显示和操作。数据访问层以Jar包的形势嵌入到其他模块中,从而进行统一的数据权限验证。
各个独立的项目构架将在下一章进行介绍。
产品价值
目前信息化已经深入到政府和企业部门的各个角落,经营者和决策者也意识到信息系统中的数据蕴含着巨大的价值,因而BI(Business Intelligence)无疑成为社会关注的焦点。BI能够将分散在各地的数据集中起来进行分析形成知识,进而帮助决策者做出科学的经营决策。
把数据转化为经营决策需要经过很多环节,每个环节都需要大量严谨的工作,让这些环节对用户透明或者用户能够十分便捷完成并达到最好的效果,就是GBaseBI商业智能平台的使命。GBaseBI能够将企事业单位的数据快速抽象汇总,以简洁、直观的界面展现企业各个环节的经营数据,结合多种交互形式为企事业单位的决策者提供决策帮助。GBaseBI商业智能平台具有如下特征:
- 可视化
GBaseBI是国内领先的可视化数据分析平台,也是首家以数据可视化为着眼点的BI工具,从数据抽象到数据展示后的交互,都可以“可视化”的进行。让客户更形象,更直观,更方便的使用数据,带来全新的数据体验。
- 全数据
BI系统重要指标就是数据处理能力。GBaseBI能够处理各种数据,包括主流关系型数据库数据(Oracle、Sybase IQ、DB2、SQL Server、MySQL、PostgreSQL等)、文件数据(Excel、CSV等),以及大数据平台,如HADOOP(HIVE、impala、spark)和列存数据库等,同时还支持主流国产数据库平台,如GBase 8a分析型数据库。数据集支持数据库方言接口的扩展,在实际业务应用中可以支持更多数据库平台。
- 易扩展
用户的业务复杂性是无法预料的,但GBaseBI能够通过自定义函数和动作完成各种复杂的数据逻辑计算和业务逻辑跳转。度量上可以绑定9大类100多个高级函数。
- 快集成
GBaseBI的分析结果全部通过gShow模块展示,不同的分析结果具有不通过的URL地址,集成者可以方便在自身系统中嵌入gShow结果。另外,GBaseBI提供Java二次开发接口,方便用户定制。
GBaseBI本着客户利益最大化的原则,为用户提供了一套可视化数据分析展示的工具集,使用类型丰富的交互式图表替代了传统的单一的报表展现形式,展现灵活、快速、高效的数据分析优势,挖掘更大的数据价值。
为企业达成理想目标,提供处理数据的“驱动力”!
第二章 产品模块
GBaseBI是基于B/S构架,浏览器端负责数据查询设计和展示,服务器端提供数据查询等服务,产品模块在上一章产品构架节中得出,产品包括门户、吉阅、吉查、吉图和BIServer和数据查询gData模块,gData模块对用户是透明的,本章将详细介绍各个模块的构架和主要特色功能。
集成服务BIServer
BIServer是GBaseBI商业智能系统的核心,控制着用户、数据、文件和它们的权限,其构架如下图:
Flash前端
后台服务
权限认证
用户及角色管理
系统升级
对外接口
OAUTH2.0授权认证
目录访问接口
数据源查询接口
模型查询接口
数据源管理
系统监控
模型管理(gData)
导入与导出
模型权限管理
在线关机
内容分发
系统日志
OAUTH2.0权限管理
H2系统数据库
图2.1 BIServer系统构架
它的主要功能如下:
- 数据源管理,支持主流关系型类型数据库,如MySql、Oracle、MSSqlServer、DB2等,也支持大数据数据库,如GBase、Hive、Impala及Spark等,支持针对特殊客户数据库环境,通过扩展支持更多数据库类型。
- 用户、角色权限及文档信息管理,基于RBAC的权限控制,权限控制灵活易用。
- 用户行为审计,记录用户的行为信息,包括系统操作日志、登陆日志和慢SQL日志。
- 服务器资源实时监控,及时监视用户正在执行的文件,使用模块情况。
- 内容管理系统,对共享的文件夹和文件进行资源管理和分配,即时生效。
- 支持导入与导出,数据迁移模块,支持文件、数据源、模型、用户及用户权限,支持将测试环境数据内容直接导入到生产环境。
- 系统备份与还原,直接自动备份系统数据、手动还原。
- 对外提供基于OAUTH2.0协议的认证和系统访问接口。
- 内容分发,可以将用户文件分发给不同的用户,分发内容支持计算后导出PDF和Excel并以附件的形式发送到用户邮箱,不同的用户在数据权限不同的情况下得到的计算结果是不同的。
对于模型相关的功能和特点见下节。
模型gData
GBase BI5通过元数据管理、数据视图来管理系统业务数据,实现物理层-逻辑层-主题层的建模工具。大幅简化设计和开发BI系统工作,提供把数据从复杂的IT语言转换为直观、清晰地业务语言的桥梁。
模型gData是GBaseBI V5中的核心功能模块,系统中数据查询均需要使用gData进行查询,模型是对用户业务数据的语义映射,它面向最终使用用户,使用户在查询设计时候无需面对复杂的业务数据结构。模型的设计在BIServer中完成,通过BIServer提供的接口进行模型访问和模型查询,模型的构架如下图所示:
PMML
模型查询接口
模型
文件
临时结果集
SQL拼装及优化
查询对象优化
查询对象解析
模型查询对象
模型解析
模型验证
BIServer模型权限信息
分表与预聚合优化
分表预聚合配置文件
数据库
数据挖掘算法
图2.2 gData构架
模型gData的主要功能如下:
- 提供图形化的模型设计器,用户只需鼠标拖拽完成模型的制作,界面简单易用;
- 数据模型管理,将用户数据复杂的逻辑进行语义映射,支持星型和雪花模型,支持ROLAP技术;模型可视化新建编辑,能够设置虚拟维度、度量,支持时间维度的自动识别,可以让业务人员快速生成年、季、月等时间维度;
- 支持数据挖掘和预测,模型能够关联PMML文件构建虚度量,支持的算法包括决策树、聚类、朴素贝叶斯、神经网络、回归、广义回归、规则集、支持向量机、时间序列、基线、K-最近邻、得分卡等数据挖掘算法;
- 模型数据查询支持用户业务库分表和预聚合,用户在数据量较大的情况下,通常会做分表处理,而在我们的系统中的模型设计时候只需要按照主表设计,分表和预聚合配置保存在一个配置文件中,模型查询即可智能选择在哪个分表和聚合表查询。
- 支持对数据源和模型单个节点设置数据查询权限,能够实现某个用户对数据源或某模型节点的是否可见,还可以限制用户只能查询某个维度中指定的数据值。数据源和模型的权限设置后,对系统的吉阅、吉查和吉图各个模块都起作用。
- 提供统一的模型设置,模型设置后支持系统各个模块使用;
- 后台数据更新后,模型无需刷新即可正常使用;
- 通过元数据管理功能,可以把模型、数据库对象导出,可以在其它GBaseBI环境中导入。
门户Workshop
Workshop 是企业和个人使用GBaseBI工作的平台,前端采用HTML实现,将不同模块均集成在Workshop中,可以在其中打开系统任意模块。
UI组件
目录树
搜索页面
HTML
展示层
目录树操作菜单
KPI设置
SWF嵌入
吉阅 FOR PC
异步数据请求引擎
控制器
BIServer认证插件
KPI管理
BIServer目录访问接口
控制层
服务层
图 2‑3 Workshop门户
Workshop整体采用MVC的构架,但模型层面没有自己真正的后台的服务和安全控制,用户认证通过调用BIServer提供的OAUTH2.0认证接口,相关的用户、文件夹及文件数据也全部通过BIServer接口来访问。
用户登录系统后,可以直接打开吉图或吉查进行数据查询设计,保存后的文件在Workshop的左侧资源树中显示。通过将文件发布到“系统发布磁盘”和“个人发布磁盘”共享工作成果。若是管理员角色的账户,在Workshop中可直接进入集成服务中进行系统管理。
Workshop集成了有关的BI应用程序,一次登录就可以使用不同的系统功能。主要特点如下:
- 统一的模块入口,在Workshop中登陆之后,进入其他模块无需再次登陆。
- 提供内容导航,以资源树的方式展示,通过简单的双击,弹出菜单对资源进行操作。
- 支持搜索,通过关键字搜索资源树中全部资源。
- 发布管理内容,能够将个人磁盘文件发布到共享磁盘,如“个人发布磁盘”或“系统发布磁盘”。
- 多窗口多任务机制,能够同时打开吉图和吉查,通过任务栏中的页签进行切换。
- 采用异步请求机制,在一个用户操作未完成情况下,可以进行其他操作,以支撑高并发请求的处理。
吉图gChart
吉图gChart是基于Web的可视化分析设计工具,帮助用户快速的构建一个丰富,清晰的数据可视化分析报告。吉图同样采用B/S构架,前端全部采用Flex开发,后端采用J2EE技术,gChart构架如下图:
根据数据集数据来源不同调用不同的接口
调用不同的接口
数据库
结构落地存储
结果
数据集
描述文件
数据
集缓存
数据库
自定义数据库
模型、数据源查询接口
调用不同的接口
数据集设计器
gShow
变量管理
查询设计
组件管理
交互设计
异步数据查询
预警设计
解析器
调度引擎
计算处理
模型
数据集
文件
数据集
JDBC
数据集
其他
数据集
查询条件vo
查询条件vo
SQL语句
查询
查询
查询条件vo
图 2‑4 数据集构架图
吉图使用数据集进行数据查询,数据集能够整合模型、数据库和文件等数据,在内存中进行复杂的函数运算,通过智能分析运算逻辑,尽量将数据统计操作交给下层处理,如模型查询和数据库查询,只有在下层查询不支持情况下才在内存进行运算。
数据集还具有内存预警和内存运算等能力,在开启缓存的情况下,吉图的数据分析全部在内存进行,如分组求和等直接在内存操作完成,效率比数据库查询结果快10-40倍。
在上述的构架基础上,吉图具备如下特性:
- 所有图表设计全部通过拖拽式鼠标操作,无需任何编程即可完成。
- 数据多样性,gChart支持模型、数据库、数据文件等数据源。用户通过数据集设置模块,可以将不同的数据来源,组织成需要的数据集结构。多源数据源关联查询,如excel和数据库表关联,支持数据落地和缓存。
- 数据查询效率高,支持缓存,支持内存计算,支持离线存储,离线情况下能够像连接数据库一样的查询数据,离线的数据条数根据部署服务器的内存和性能有关,建议在100000数据量以下。
- 数据集支持自定义函数,能够扩展数据计算方法。
- 丰富的可视化组件,gChart提供了多种可视化组件,过滤组件以及绘图组件,满足用户多样的可视化需求,支持的可视化组件包括饼图、饼环图、柱图、百分比柱图、堆栈柱图、条形图、百分比条形图、堆栈条形图、区域条形图、线图、曲线图、折线图、面积图、百分比面积图、堆栈面积图、平滑面积图、百分比平滑面积图、堆栈平滑面积图、区域面积图、蜡烛图、雷达图、气泡图、热区图、散点图、漏斗图、表格、MAP、堆叠图、金字塔堆叠图、45度仪表盘、180度仪表盘、360度仪表盘、齿轮图、温度计、KPI组件、子弹图、GIS区域着色、GIS气泡、GIS散点图、MAP区域着色、MAP散点、MAP气泡图、多度量气泡图、人口金字塔、组合图、文本显示组件、视频组件、图片组件、音频组件。支持的过滤组件包括滑竿组件、数据回放组件、单选下拉、多选下拉、单选组件、复选组件、日期组件、文本过滤组件、枚举组件和定时器。
- 支持GIS组件,通过拖拽即可实现地图组件的载入。并支持地图组件与其他图形组件的联动,以及地图区域数据的钻取功能,GIS组件颜色深浅、气泡大小、气泡颜色深浅可实现三个分析指标的绑定,可直接访问地图图层文件,并可与ArcGIS Server等无缝集成。
- 数据互动分析形式多样化,支持数据联动、数据钻取、数据筛选、数据预警、超级Tooltip、修改数据、定时刷新、数据回放、公式可视化、切换图表页、URL联动等多种联动方式。
- 多种事件交互,gChart提供了常用的鼠标交互事件,在鼠标单击、悬停或离开时候,通过不同的行为实现用户不同的交互需求,对整个系统可以执行数据回写、打开URL、执行表达式、执行JS表达式、弹出窗口、关闭窗口、改变变量等操作。对于某个组件还可以产生维度联动、改变顺序、数据重置、数据下钻、旋转组件和改变组件某些属性的效果。
- 提供多页签功能,组件之间可以跨页签间联动。
- 丰富的属性设定,gChart组件支持丰富的属性设置,用户可以根据需要灵活的调整,可以设置X/Y轴、背景属性、标题/副标题等下面14类317个属性。
- 操作快捷,舞台区域提供多种快捷键,如delete(删除),ctrl+c/v/x(复制粘贴剪切),上/下/左/右(微调)等。
- 支持变量,利用变量可以联动,可以设置图形属性,并且变量可以利用URL赋值。
- 支持数据回放,按照某维度值顺序依次作为图形过滤的维度值,定时刷新显示结果。
- 支持数据回写,可以对显示维度或度量值手动输入新值,并且相关的维度和度量统计结果会自动刷新。
- 支持图表发布,可适用于各种浏览器、移动设备和离线分析,支持图形的导出功能,导出方式支持导出为图片、PDF等,并支持导出为可嵌入PPT的Flash方式离线数据包。
吉查gQuery
吉查是简单快速灵活的数据查询工具。用户通过简单拖拽,任意组合查询内容及查询条件,其构架如下图所示:
后台服务
结果集分页缓存
查询对象
查询解析
分页处理
模型查询接口
模型查询
即席查询设计器
查询结果列表
数据查询
预警设置
查询设计
自定义成员管理
图2-5 吉查
gQuery的数据查询依赖gData的模型查询接口,因此具备数据查询权限限制。该模块功能特点如下:
- 面向业务的数据字段,结构清晰,易于理解。
- 快速、灵活的组织数据查询,并通过过滤、排序、自定义列的方式获取想要的数据结果。
- 无需编程,基于数据模型可全拖拽实现数据查询;查询条件灵活组合;
- gQuery提供汇总、小计等功能,不需要复杂的操作即可得到汇总值,提供四则运算等基础函数,同时还提供同比、环比等统计分析函数;
- gQuery支持数据预警,通过表达式的方式,将满足预警条件的数据突出显示。
- 后台分页查询,业务表数据量再大也能够及时显示查询结果。
- 智能分页缓存,当结果数据多于一页的情况下,缓存下一页数据,能够快速响应页数跳转。
- 圈选数据作图,圈选表格中的数据,以图形的方式展现该部分数据,图形类型包括饼图、柱形图、线图,面积等。支持迷你图展示单行数据度量变化趋势;
吉阅gShow
吉阅gShow是可视化图表的展示模块,包括PC、PAD和手机端。该模块具有以下特点:
- 轻量级,整个gShow的加载大小不到1M,加载快速。
- 易集成,支持通过URL方式嵌入到客户系统中。
- 配置灵活,gShow提供丰富的参数设置和API接口,方便用户系统集成gShow,并根据具体情况订制界面,如控制工具条的显示与否,控制工具条中按钮的显示与否。
- 跨浏览器,gShow包含Flex和HTML5两个版本,兼容了市场上的主流浏览器。例如:IE8+,Firefox,Chrome,Safari等
- 多设备,gShow可以在PC、移动设备上展示。
- 刷新机制,能够按照固定间隔刷新显示结果。
- 显示结果能够导出为PDF、图片或Excel。
第三章 产品特点
技术特点
- 产品整体采用J2EE技术,平台安全、稳定、高效,模块间实现高内聚、低耦合,并具备良好的跨平台性。
- 集成服务(BIServer)实现了OUATH2.0的服务器端协议,支持基于OAUTH2.0协议的单点登录系统和模块数据交互,对外提供OAUTH数据查询和系统数据访问接口,数据返回为标准的json格式,方便第三方应用集成。
- GBaseBI V5数据查询考虑到超大数据量问题,当用户数据库事实表数据量太大,支持事实表分表和预聚合优化,数据查询能够智能识别查询目标表所在哪个分表或聚合后的表,提升大数据量下的查询效率。
- 丰富的图表样式和图表功能,柱图、饼图、堆叠图、面积图、仪表盘、温度计图等多种图形类型,支持图表的联动,图形的钻取,数据显示和分析更加灵活、清晰。
- 完全基于Flex技术实现图表设计器,效果更绚丽,拖动更平滑,功能更强大。
- 在GBaseBI V5中,包括交互式图表、即席查询等所有BI内容均以独特的GBRF(GBase Resource Files)资源文件包的形式存在于内容管理中,用户可以轻松管理并使用任意的商业智能功能。
- 平台全方位支持Windows系列(如Windows 2000、Windows 2003、Win2008、Windows7等)、Linux系列(如RedHat、CentOS、SUSE Linux等)、国产操作系统(如中标麒麟)等各种主流操作系统平台,具有良好的跨平台能力。
- 自带系统数据库H2,简单、轻量、稳定、快速,完美支持数据备份和迁移。
- GBase BI自带数据库连接池管理功能,同时对数据库查询的SQL拼装实现了SQL优化功能,保证数据库SQL运行效率,提高数据库查询速度。
- 数据集采用全内存计算和存储,在服务器内存足够大支持的情况,可以将数据库数据全部加载到数据集,在数据集中进行聚合、汇总、分组、过渡等计算,速度比数据库快10-40倍。给用户带来更加快速的查询汇总体验。
- 移动端gShow采用HTML5实现,具有显示和响应更加快速的特点。
- 不同用户打开相同文件夹中文件,不会互相影响结果。当他们的权限不同时候,显示的结果会不同。
- 支持在线升级,当提供在线升级包后,系统可以在线升级。
应用特点
1. 高效率挖掘数据价值
- 以业务主题为单位,面向业务的数据仓库存储形式。
- 任意角度分析数据,业务灵活,快速生成查询结果集。
- 无须编程,图文并茂,高效灵活的数据即席查询gQuery。
- 预警设置适合实时监控关键数据。
2. 可视化图形展现形式
- 类型丰富功能齐全的图表,替代传统单一报表。
- 统计数据叠加于地图的GIS(Geographic Information System,地理信息系统)和KPI指标的多种关键数据呈现方式。
- 多功能的数据筛选配合图表使用,方便数据查询。
- 几十种度量函数,需求范围更广泛。
- 图表多种属性,风格及颜色的设置。
- 多功能组合图形,让一张图表提供更多的实用信息。
3. 可定制的BI应用管理
- 可定制企业与个人门户,交互式设计器,图表,即席查询的统一登录入口。
- 用户、角色和权限配置实现系统业务的管理。
- 系统日志和监控功能,实时反映系统运行情况。
- 慢日志查询功能,分析定位前台业务、SQL拼装、数据库运行效率原因,以便有针对性的进行优化。
- 资源管理器方式,给用户建立自己的工作目录。
- 支持变量,变量参与数据查询或事件动作,并且可以外部传参形式给变量赋值。
- 在拖拽式进行图表、即席查询操作的基础上,GBaseBI支持自定义脚本、表达式的开发,以实现拖拽无法完成的复杂功能。
功能特点
1. 应用于多种展现平台
GBaseBI V5以J2EE为基础,采用WEB2.0技术,可广泛的应用于Web,Pad,Mobile等多种展现平台,实现了跨平台操作,客户端只需要支持Flash player 11.2及以上插件就可以访问系统,减少了产品的部署工作,便于产品的维护和升级。
2. 可视化语义映射设计,支持预测
面向业务人员的语义层映射为了便于业务人员创建自己的主题,并选择需要的维度进行统计分析。GBaseBI V5通过可视化的界面将数据库中的表的字段名称映射为业务相关术语,并且语义映射文件能够与PMML模型绑定,使模型查询具备数据预测功能。业务人员即使不懂编程技术,也能够方便的创建复杂的统计查询功能。
3. 随心所欲的探查数据
根据用户业务的需要,创建合适的主题,选择从哪些角度分析数据,设为维度,哪些指标需要查询分析,设为度量,将海量数据按照主题划分,用户需要查询哪个指标只需要知道它所在的主题,借助数据的钻取功能,度量在维度上所有的数据都可以轻易得到。
4. 简单、易用的图表设计与发布
GBaseBI V5的交互式图表设计器内置了多种统计图表,用户只需要简单的拖拽,设置图表的属性行和列,直接得到直观的展示统计分析结果,交互式图表通过gShow的形式展现,只要将图表保存为GBRF文件,即可在Workshop门户,与大家共享此图表。
5. 实时、可联动的数据监控与预警
图表间的联动,使用户可以全面的分析数据,同一度量通过图表既可以看到数据的整体趋势,又可以看到明细指标值,在把握整体业务的同时不会忽略细节数据价值。交互式图表中的仪表盘,适合关键指标数据的图形化展示,清晰显示当前数据值,在实时监控中得到了广泛应用。即席查询可以通过设置预警条件,超出预警范围的数据可以特殊显示,以达到方便寻找异常数据和分析的效果。
6. 数据回放与回写
数据回放能够按照某维度系列值分别作为过滤条件,以某时间间隔刷新图形,通过图形变化分析数据变化趋势,使展示页面显得更加生动、活泼。
在统计分析中若对某个统计值结果不理想,可以手动调整相关的维度或度量,利用数据回写功能将调整的数据写入后台缓存,相应的统计结果会根据最新的缓存数据自动重新计算并刷新。
7. 灵活的分析与直观展现
不仅仅是交互式图表提供美观的分析展现效果,gQuery吉查同样灵活分析数据,提供图表展现功能,任意圈选查询的数据,图表区域显示相应的图表分析,数据图形同时展示,更直观清晰体现数据间的关系,趋势等。
8. 个性化定制的门户
Workshop是BI产品数据分析工具集的统一门户。它是交互式图表设计器gChart,即席查询gQuery和集成服务的登录窗口,特有的根据业务定制的菜单栏和个性化的资源管理器,用户可以拥有一个完全属于自己的工作平台,方便业务数据的管理,提高工作效率。
第四章 运行环境
由于GBaseBI V5商业智能平台所需要处理的数据绝大多数情况是在服务器上,因此客户端只需要安装浏览器和Flash插件即可,但是由于GBaseBI V5的网络图表均采用Flash格式展现,因此对客户端内存的要求略高。
服务器端
组件 | 要求 |
处理器 | 建议2CPU以上 |
内存 | 推荐8G以上 |
磁盘空间 | 40G以上(不包括数据库服务器开销) |
操作系统 |
|
应用服务器 |
|
客户端
组件 | 要求 |
处理器 | 建议P4 1.5GHz以上 |
内存 | 推荐4G以上 |
操作系统 | 下列操作系统之一:
|
Web浏览器 | 支持FLASH PLAYER 11.8及以上 |
表格 4‑2
第五章 部署与集成
系统部署
GBaseBI V5可以单独部署在一个服务器上,在单套的情况下安装成功后不需要特殊的设置即可直接使用。某些用户的应用并发数可能很多,单个服务器处理请求太慢,GBaseBI V5支持集群和分布式部署。其中集群部署如下图所示:
图5.1 集群部署
在集群模式下,需要一个单独的服务器作为集成服务的服务器,然后将GBaseBI其余模块部署在多个服务器上,每个服务器中部署除了GBaseBI外的全部模块。各个服务器通过负载均衡节点分发用户请求。这种部署方式能应付多数并发过多的情况,但是通常在一个企事业单位中往往频繁的常访一个应用,如吉图或吉查,若只是某个应用并发过多的情况下可以采用分布式的部署方式,如下图所示:
图5.2 分布式部署
分布式部署即在不同的服务器上部署不同的系统模块,要求将Workshop(即企业与个人门户)和集成服务部署在同一台服务器上,其余相同的模块服务器节点通过负载均衡节点分发请求即可。
系统集成
GBaseBI V5是个完整的产品,拥有自己的运行容器、自己的文件资源、用户数据和权限等信息,但是V5中已经设计好的图表也可以十分简单的集成进入其他的系统中,GBaseBI V5具有以下集成特性:
- 系统内置多达20种主题样式和色板,以适应各种不同的其它系统风格,同时模板和色板支持扩展。
- 支持通过URL直接嵌入到用户系统中,该方式十分简单,不需要定义一些负责的标签或在用户系统中放入类库或文件。
- 支持通过JavaScript调用呈现器的方式集成到客户系统中。
- 图表中定义的变量支持通过URL中参数的形式赋值,因此当在图表中一些需要经常变动的参数或者在运行时候指定的参数可以通过URL参数形式赋值。
- 集成的图表的一些显示属性也可以通过URL中固定参数进行设置,不同的用户对于图表显示界面布局都要求不太一样,GBaseBI V5提供了丰富的参数来进行设置,如工具栏的位置,工具栏中各个功能图表是否显示等都可以通过参数进行设置。
第六章 性能
性能参数测试环境 | |
测试服务器 | 品牌:DELL E710 |
主频:2.26GHZ | |
CPU:E550*2 | |
内存:4G*8 | |
硬盘:1T*4 | |
测试客户端 | CPU:Intel(R) Core(TM) i5 CPU 750 |
主频:2.67GHZ | |
内存:3G | |
浏览器:支持安装FLASH PLAYER10.2及以上 | |
数据量 | 200,000 |
数据库 | GBASE 8a分析型数据库 |
表格 6‑1
集成服务BIServer | |||
序号 | 性能指标 名称 | 性能指标描述 | 结果值 |
1 | 执行处理 能力 | 程序执行速度,平均每次响应时间。 | 小于100MS,最好情况小于10 MS |
2 | SQL解析 | 把对象转化成结构化查询语言(SQL)耗时,尽量控制在500ms以下 | 小于100 MS,最好情况小于10 MS |
3 | SQL查询时间 | 结构化查询语言(SQL)查询时间,取决于数据库的性能,尽量控制在1s以内 | 严重影响因素如下:
支持手工映射语句优化 |
4 | 明细查询 | 查询数据明细耗时,根据查询结果集大小,取决于服务器的I/O性能。 | 同上 |
5 | 聚合查询 | 聚合查询,取决于数据库的容量,执行时间相对较长。 | 同上 |
表格 6-2
吉查gQuery | |||
序号 | 性能指标名称 | 性能指标描述 | 结果值 |
1 | 最大行数 | 支持的最大行数 | 5000 |
2 | 最大列数 | 支持的最大列数 | 500 |
3 | 最大响应时间 | 最大的响应时间 | 取决于BISERVER 的响应时间和查询时间,及SQL的复杂程度 |
4 | 最大维度数 | 当只有一个模型, 即席查询数据源结构树支持的最大维度数 | 数据仓库支持的最大列数 |
5 | 最大度量数 | 当只有一个模型,即席查询数据源结构树能支持的最大度量数量 | 数据仓库支持的最大列数 |
6 | 加载数据量 | 查询数据,一页加载的最大记录条数(包括图形控件) | 5000 |
7 | 初始化加载速度 | 打开浏览器,gQuery加载完毕所需的时间 | 小于5S |
8 | 点击响应时间 | 每次执行点击的响应时间 | 小于1S |
表格 6-3
门户Workshop | |||
序号 | 性能指标名称 | 性能指标描述 | 结果值 |
1 | 点击响应时间 | 每次执行点击的响应时间 | 小于1S |
2 | 打开GBRF的最大时间 | 点击打开一个GBRF文件的最大时间 | 3S |
3 | 任务栏最大KPI数目 | 任务栏能够放KPI数目 | 3 |
4 | 搜索响应时间 | 搜索文件的响应时间 | 小于2S |
5 | SHOW最大窗口数 | 最多同时打开吉图show数目 | 6 |
表格 6-4
吉图gChart | |||
序号 | 性能指标名称 | 性能指标描述 | 结果值 |
1 | 最大并发数 | 多用户同时请求数据,ICTD最大支持并发数 | 500 |
2 | GBRF文件最大图表个数 | 在同一个GBRF文件中,承载最多图表数目 | 25 |
3 | 最大响应时间 | 图形加载数据时间 | 严重影响因素如下:
|
4 | 前端稳定运行最长时间 | 连续稳定运行的最长时间 | 24H |
5 | 图形显示最大记录条数 | 一次能承载数据的最大记录条数,记录数即一个数据分区,以柱图为例,即图形中柱的个数 | 200 |
6 | 最大支持数据源数目 | 图形设计器,一次支持的最大的数据源种类数目 | 10 |
7 | 自定义函数最大运算时间 | 在度量为自定义函数的时候,能支持最大的运算时间 | 严重影响因素如下:
|
8 | 初始化加载时间 | 打开浏览器,加载完毕ICTD所需的时间 | 10M/真实网速 |
9 | 点击响应时间 | 每次执行点击的响应时间 | 小于1S |
表格 6‑5
吉阅gShow | |||
序号 | 性能指标名称 | 性能指标描述 | 结果值 |
1 | 最大并发数 | 多用户同时请求数据,SHOW最大支持并发数 | 500 |
2 | GBRF支持的最大图表数 | 在同一个GBRF文件中,承载最多图表数目 | 25 |
3 | 最大响应时间 | 查询数据的最大响应时间 | 严重影响因素如下:
|
4 | 前端稳定运行最长时间 | 连续稳定运行的最长时间 | 24H |
5 | 图形显示最大记录条数 | 图形设计器,一次能承载数据的最大记录条数,记录数即一个数据分区,以柱图为例,即图形中柱的个数 | 200 |
6 | 自定义函数最大运算时间 | 度量为自定义函数时候,能支持的最大运算时间 | 严重影响因素如下:
|
7 | 初始化加载时间 | 打开浏览器,加载完毕SHOW所需的时间 | 3.15M / 真实网速 |
8 | 点击响应时间 | 每次执行点击的响应时间 | 小于1S |
表格 6-6
结束语
如今,越来越多的企事业单位依赖于商务智能来获得有价值的数据关系和重要的KPI指标,帮助企业做出正确的预测和决策。GBaseBI使用户以全新的方式分析数据,数据可视化技术完美呈现工作成果。贴合业务的数据模型与简洁直观的操作方式,让用户全员都能迅速掌握,为您挖掘数据价值提供强劲的驱动力。




