GBASE数据库支撑国内较大规模银行大数据平台
时间:2019-10-03 12:39

  众所周知,数据库是全球信息化系统领域中复杂程度最高、研发难度最大的大型软件之一,一款世界级数据库产品的诞生,离不开3-5年高强度复杂应用的压力磨炼,南大通用GBase 8a MPP数据库正是经历了这样一个生长过程。

  中国农业银行总行大数据平台项目从2014年上马,到今天的5年多时间,★△◁◁▽▼GBase数据库几乎可以说已经通过了全世界银行领域中,强度最高、复杂性最高、压力最大、覆盖最全的分析类业务场景考验。农行用户和南大通用共同见证这一款世界级数据库的诞生、◆●△▼●成熟,并走出银行业,支撑起了金融、●电信、◇…=▲政务、△▪▲□△军队等关键行业多个世界级的应用。★◇▽▼•GBase数据库从初期的不稳定,到现在已经支撑农行自主可控大数据平台稳定无故障运行超过1400天,★-●=•▽平台项目因此荣获了中国人民银行科技发展一等奖,农行也与南大通用签约共建联合创新实验室。▽•●◆

  农总行大数据平台项目建设以“数据是基础,□◁治理是保障,技术是支撑,分析是关键,应用是目标”为原则,GBase数据库帮助农行用户顺利完成了数据治理,★▽…◇提高数据质量,○▲-•■□从而满足了用户数据挖掘的需求,为数据价值在业务中的深入应用夯实了基础,实现了数据价值在业务应用中转变为生产力,◆■构建数据价值利用的有效闭环,•☆■▲△▪▲□△真正实现从数据支撑到数据运用的转变。

  目前主库的裸数据量超过2.5PB,每天的增量数据为3TB,最大表5000亿行;库内复杂作业15000多个,涉及SQL语句100000多个;日终加工时间为8小时,T+1时间的双活集群间同步3小时完成;目前共部署33套集群,共1156个节点,▲★-●裸数据总量超过20PB。

  海量数据管理:为用户提供了并行海量复杂数据处理平台,帮助客户形成PB级以上的业务数据单一视图,为客户提供及时高效的数据分析结果;

  满足监管需求:通过对数据统一的管理与治理,满足上层监管部门对上报监管数据的要求,保证数据的准确性、◇•■★▼◆▼及时性,▼▲完整性;

  通过数据指导业务:通过数据仓库的建立,对数据在生命周期内有效和高效的管理,•●证客户接入更全面的业务数据,满足市场营销、内部管理、内外监管的分析业务需求;

  支撑银行领域数据观念转变:随着数据技术和分析理论的发展,要求银行分析业务必须从抽样数据向全体数据,从绝对到效率,从原因分析到相关性分析转变,▪…□▷▷•数据仓库的建立,很好的支撑了这种转变,使理论成为现实;

  创新的大数据平台架构:将MPP数据库技术和Hadoop技术的混合使用并搭建组成大数据平台,是金融行业的大数据技术架构和应用的创新,▲●…△中国人民银行科技发展一等奖。目前农行的大数据平台服务器数量已经达到1156台,•□▼◁▼其中MPP支撑结构化数据达20PB,是国内金融行业最大的数据仓库和大数据平台。◇=△▲▪▲□◁