期货交易自动化论坛

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 43|回复: 0

外资银行面试问题,请求支援 - 金融行业 - ITPUB论坛-专业的IT技术社区

[复制链接] |主动推送

285万

主题

285万

帖子

855万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
8553710
发表于 2022-9-11 09:12:59 | 显示全部楼层 |阅读模式
4.数据仓库的初始载入量和增量分别是多少
5.数据仓库分区表的每个分区大小是多少,按什么分区
看来必须要有实践经验啊,这是外企著名银行的面试问题,小弟羞愧,请各位有实践经验的前辈指点
1.维表和事实表的字段数大概多少(维表100左右,事实表20左右)
2.各种表的记录数分别多少(账户表2000万,客户表200万,交易表2000万)
3.各种表的数据量分别多少(账户表6G,客户表3G,交易表1G)
4.数据仓库的初始载入量和增量分别是多少(20G,5G)
5.数据仓库分区表的每个分区大小是多少,按什么分区(一般是按照时间进行分区的)
原帖由 agot 于 2009-4-9 12:26 发表

外资银行面试问题,请求支援
是关于银行数据仓库的,如下:
在你所经历的银行数据仓库项目中:
1.维表和事实表的字段数大概多少
2.各种表的记录数分别多少
3.各种表的数据量分别多少
4.数据仓库的初始载入量和增量分别是多少
5.数据仓库分区表的每个分区大小是多少,按什么分区
看来必须要有实践经验啊,这是外企著名银行的面试问题,小弟羞愧,请各位有实践经验的前辈指点
面试官是要问你在数据仓库建设方面的经验,而不是理论知识。你做没做过,什么情况,直接就得。人家的经历,对你有什么用呢?
维表和事实表的字段数,应该是针对某个主题模型来说的。抛开主题,能有什么答案?
维表的字段数,如果是星型模式,其实就是该维度的层次数,比如时间,就可以能有分、时、半天、天、周、月、季、半年、年等多个层次,因此可以认为是9个字段,但如果以雪花模式来设计,则每个表只有两个字段。
事实表的字段数,是该主题模型所有维度和量度的总和,无论哪个行业,客户主题应该都是维度和量度最多的,单就维度来讲,多者可能达30-40个维度,量度也至少有10几个,因此总和可能会达到50-60个。
这些,结合你自已的项目经验就能回答。
表的数据量,初始量和增量,都是与银行数据的规模有关,全国性银行,省级银行和城商行完全不一样。而且也和各个维度的数据粒度有关,比如说如果时间维到分钟级,地区维到村区的话,数据量就比“天+市”要多出几百倍。也是与实际应用需求有关。
按什么分区就比较好说了,因为多维模型是不按索引查找的,因此无论按哪个维度来分区都没有意义,只有时间维是永远固定的,因此以时间维来分区是最可行的,这个凭常识都能回答出来。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|期货交易自动化论坛

GMT+8, 2025-9-6 23:00 , Processed in 0.082557 second(s), 27 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表