期货交易自动化论坛

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 39|回复: 0

按需选用“数据仓库” - 金融行业 - ITPUB论坛-专业的IT技术社区

[复制链接] |主动推送

285万

主题

285万

帖子

855万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
8553710
发表于 2022-9-11 09:08:20 | 显示全部楼层 |阅读模式
现在许许多多的银行都正在实施“数据仓库”相关的项目。但是发现一个问题,大家对于“数据仓库”的理解不尽相同,经常由于名词理解的不同而产生分歧和争论。比较严重的是,不同开发商都在按照自己的理解推销“数据仓库”,许多客户自己也没有认真思考,结果被搞得无所适从。
在与各方面的交流中,发现目前存在四种对“数据仓库”的理解:
1, 按照INMON的定义,数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,这是目前一种主流的理解,毕竟INMON是DW之父,跟着主流错了也没关系。
2, 一些人认为,将若干数据集市集合在一起,就可以称为数据仓库。因为这也基本符合上面INMON的数据仓库的字面定义。
3, 一些客户(甲方)认为,数据仓库只是一种概念,凡是完整、一致的企业级数据集合,都可以称为数据仓库。
4, 从技术角度来说,对于数据库与数据仓库的区别,不少人都认为,多维的就是数据仓库,传统数据库是关系型的。
上述这些理解都是从不同角度出发的,确实显得比较混乱。那么银行需要的“数据仓库”到底应该是什么样的。其实这个问题提法的本身,就已经透露出答案的线索——银行需要什么,为什么要建“数据仓库”?把本质问题搞清楚,至于叫什么名字,那是次要的。

我们暂且先定义个名词——“业务主题”,每个业务主题对应一类产品或服务,所涉及的数据,按照业务本身的逻辑关系进行组织,都是客观的、相对稳定的。银行传统的业务处理系统,都是面向业务主题的。
我们同时再定义个名词——“管理主题”,每个管理主题对应管理决策者所关心的一类问题,都是主观的,相对变化的。银行的管理信息系统、决策分析系统,都是面向管理主题的。
在不同厂家所提供的数据仓库模型中,就存在这样两种不同的类型,一种就是按业务组织的,如存款、贷款、结算等,还有一种就是按照管理主题组织的,如资产负债、风险、利润等,两类模型的用途是有差别的。

当管理主题仅局限在一个业务主题之内时,两者的界限并不明显,典型的现象就是各个传统的业务处理系统自身就会提供不少的统计分析功能,最典型的就是传统的会计系统会形成大量的管理报表,这种情况至今都是普遍存在的。但是当管理主题跨越不同的业务主题时,原来的做法就无法支持,必须将不同业务主题的数据汇集在一起,才能回答管理主题中所提出的问题,目前这种需求也是普遍存在的。我们看到,银行在决定投资建设数据仓库时,往往都是面临着跨“业务主题”的“管理主题”的需求。因此,银行通过建立数据仓库,是为了形成全面(多业务主题的)、完整(包含以往历史数据)、一致(相同业务实体得到统一)的数据集,以支持层出不穷的管理主题的需要。作为真正的数据的使用者,这是建立所谓数据仓库的真正目的。无论范围大小、技术方式如何,凡是能满足这一需要、能管理这样的数据集合的系统,都可以称之为数据仓库系统。
由于数据仓库中存放了多个业务主题的数据,所以自然也可以支持原有业务主题本身的管理主题,所以我们看到,银行在建立了数据仓库之后,会将原来需要在业务系统中实现的报表,转而利用数据仓库的数据产生,不用改动原来的业务处理系统,这一便利也成为了银行建设数据仓库的因素之一,但这并非是本质的原因。
因此,数据仓库中的数据模型,必须能够同时反映业务主题和管理主题这两方面的特征。首先,能够按业务主题建立数据模型,反映业务本身内在的逻辑关系。其次能够将不同业务主题进行整合,统一不同业务主题中的同类业务实体,例如不同业务中的同一客户,在数据仓库中应具备统一的标识,不同业务系统中的货币标识,在数据仓库中也应该得到统一,只有经过这种处理,才有可能支持跨业务主题的管理主题的需要。第三,按照管理主题的需求,梳理相应的管理指标和管理口径,继续调整和完善模型以支持管理主题的需要。

有的银行在早期建立数据仓库时,就直接建立了管理主题的数据模型,从各个业务处理系统获取数据直接按照管理主题的数据模型进行组织,但后来随着管理主题的不断丰富,原来已经建立的面向特定管理主题的数据仓库已经难以扩充支持,结果就形成了业务处理系统数据与不同管理主题之间“多对多”的数据映射关系,数据管理复杂、效率低。为了解决这个问题,后来又重新建立了基于业务主题的数据仓库,作为各业务处理系统数据与各管理主题之间的中枢,作为不同管理主题共同的数据来源。

银行中的数据仓库,是全面的(多业务主题)、完整的(包含以往历史数据)、一致的(相同业务实体得到统一)、同时反映业务处理和管理决策特征的企业级数据集合。
原创么?那我顶一下
国内银行用数据仓库品牌多以NCR的Teradata为主,好像国内还没有自己的数据仓库品牌,但国家已经要求某院校开发了,希望能成功
在前文中我并未提及技术角度的“数据仓库”。不过确实现在还有一种“数据仓库”的说法,就是多维数据库产品。这是一种纯技术的定义。不应该把企业建立数据仓库这种改变整体信息架构的事情与某种具体的软硬件产品相提并论。
原帖由 song8528 于 2009-7-21 23:28 发表

原创么?那我顶一下
国内银行用数据仓库品牌多以NCR的Teradata为主,好像国内还没有自己的数据仓库品牌,但国家已经要求某院校开发了,希望能成功
不是我崇洋媚外,以我们现在的体制和技术,连可以商用的数据库都开发不出来,更别提数据仓库了。
商务智能软件技术门槛低些,国内有BI.OFFICE、润乾等,希望他们快点壮大。
谈到国内的bi公司,市场环境并不是很理想,润乾的选择很明智,主要就是做报表,不大,很稳。国内技术比较有特色的菲耐特,吉贝克等现金流都不是特别好,菲耐特被融通收购了,吉贝克现在害撑着。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|期货交易自动化论坛

GMT+8, 2025-9-6 11:54 , Processed in 0.082874 second(s), 28 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表