工行6·23事件内部通报首曝光 IBM软件缺陷惹祸

oschina
 oschina
发布于 2013年07月10日
收藏 26

近日,中国工商银行(601398,SH;1398,HK)信息科技部就6月23日工行系统故障事件(以下简称“6·23事件”)正式作出内部通报,这份通报称,工行数据中心(上海)主机系统出现故障,是由于IBM提供的主机DB2V10版本内存清理机制存在缺陷引发。

而在技术问题之外,工行本身的管理问题以及国内银行业信息系统落后的沉疴可能也是此次事件的诱因。

loading

2013年6月23日,一位市民从中国工商银行浙江省临安支行门前经过。 来源:胡剑欢 / 东方IC

事件原因直指IBM:软件存在缺陷

6月28日上午,工行某直属一级分行信息科技部员工陆续收到内部通报邮件。该通报就6·23事件的情况及原因作了基本描述,但对事件影响范围、内部处理能力判断均语焉不详。

通 报称,“6月23日上午,数据中心(上海)监控发现主机CPU利用率升高,经分析判断与6月23日凌晨实施的主机DB2数据库软件升级版本有关(从V9升 级到V10),在紧急回退升级系统软件版本后系统运行恢复正常。”同时,工行总行信息科技部将该事件直接原因归为IBM公司提供的软件产品存在缺陷,并称 这点“经IBM公司正式确认”。

loading

工行就6·23事件做出的正式内部通报文件

6月23日上午,全国多地中国工商银行柜台、ATM、网银业务出现故障,持续近1个小时。作为服务2.92亿个人客户及400多万公司客户的全国金融服务巨头,工行此次故障波及北京、上海、广州、武汉、哈尔滨等多个大中型城市。

当日,工行将该事故对外模糊描述为:“中国工商银行部分地区因计算机系统升级原因造成柜面和电子渠道业务办理缓慢。”这也是迄今为止工行就6·23事件向用户发布的唯一公开解释。

IBM公开官方资料显示,工行与IBM的合作始于1997年,至今16年之久。针对通报中提及的“经IBM公司正式确认”,记者联系多位IBM相关负责人,但均未得到回应。

工行IT运维能力遭质疑

这份内部通报由一位不愿透露姓名的工行在职员工提供。该员工表示,自己并不太满意这份解释:“对灾难备份只字未提,有意将管理问题规避为技术问题。”

通报也提及了一些管理问题,但表述颇为模糊,通报称,“(数据中心上海)没有按照‘第一时间恢复生产’的要求采取果断措施及时进行回退,并且回退过程不坚决,耗时较长。”

银行的灾难备份系统,是指银行对本地数据中心的数据、业务系统、软硬件等资源进行同城或异地备份,以确保发生某些不可预测的灾难后,重要信息系统的数据安全的一种预防措施。

据中国银行业监督管理委员会(以下简称“银监会”)发布的《银行业金融机构信息系统风险管理指引》,银行业金融机构应制定信息系统应急预案,并定期演练、评审和修订;全国性数据中心要实现异地灾备。

日 前,国内 最大的灾难备份服务商万国数据CEO黄伟在接受福布斯中文网采访时表示,“银行的IT系统永远面临信息安全的挑战,但悲哀的是,银行在IT系统和灾难备份 中不计成本,但遇到这样的大面积的安全问题依然无法在短时间内恢复系统。”他认为,长久以来国内银行的IT系统运作是在给这样的事件埋下伏笔,他最后指 出,“在国内银行,IT系统的搭建更像是给上级和银监会看的‘政绩工程’。”

2008年,现任银监会副主席郭利根曾就多起国内银行信息科技风险事件发表讲话。他说,工行等国有银行是国内在IT技术和风险管控上都比较先进的银行,它们的问题频发,“充分暴露出我国银行业信息系统的脆弱性。”

他指出,基础建设滞后、软硬件及核心技术受制于人和系统管理粗放是当时银行业信息科技建设存在的主要问题,“特别是在业务连续性规划、业务恢复机制、风险化解和转移措施、技术恢复方案等方面,存在明显的‘短板’。”

整整五年过去,工行6 23事件证明了这些问题仍旧没有得到有效解决。

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 OSCHINA 社区 [http://www.oschina.net]
本文标题:工行6·23事件内部通报首曝光 IBM软件缺陷惹祸
资讯来源:腾讯科技
加载中

最新评论(91

ZmmFly
ZmmFly
的确是这样的……
四十大盗与阿里巴巴
四十大盗与阿里巴巴

引用来自“yangle”的评论

引用来自“大竹叶青”的评论

引用来自“wooo”的评论

应该有灰度测试的啊,怎么一下子就全故障了。

弱弱问下 什么是灰度测试

可惜我交的那些税!!!

求给我们小白普及一下,什么叫灰度测试 .用什么工具,具体表现在哪些方面 @wooo
y
yangle

引用来自“大竹叶青”的评论

引用来自“wooo”的评论

应该有灰度测试的啊,怎么一下子就全故障了。

弱弱问下 什么是灰度测试

可惜我交的那些税!!!
shady
shady
呵呵,这样企业的单子都要考关系来做,外面的生瓜蛋子小企业进不去,通常都是不求但求最贵,有时甚至项目都做完了才开始招标,找各种企业来陪标。。。
鬼吹灯泡
鬼吹灯泡
听说银行宁可让系统瘫痪也不愿意启用灾备,因为启动灾备可能会丢失部分数据,这部分用户的钱出了问题要银行买单
jk1420
jk1420
估计有人不小心把备机给关了,像这种整个行里的数据库升级系统回切没那么快的。。。
唐海康
唐海康

引用来自“Raynor1”的评论

引用来自“CheckStyle”的评论

引用来自“Raynor1”的评论

引用来自“CheckStyle”的评论

引用来自“Raynor1”的评论

引用来自“luciferdragon”的评论

以后还是不要用DB2了

他们这一个是大型机呀。。只能买IBM的呀。。别的厂商没有数据库和大型机一体的,虽然现在的ORACLE也出了。。。

Oracle那个东西的RAS指标,根本干不过IBM的大机

我了个去啊。。有规定说ibm 的大型机装不上oracle吗?

小同学,人家是在说Oracle出的Exadata 机器.
至于你说的Z机器装Oracle,这当然没问题

所以看到你这一个回复我还以为你不知道IBM能装ORACLE。。

出了问题找oracle还是ibm……
唐海康
唐海康

引用来自“RisingV”的评论

引用来自“inuxor”的评论

引用来自“RisingV”的评论

我是很相信大I家的产品质量,基本是工行的维护出了问题。

不过这个行业或许也可以考虑廉价x86方案

ibm店大欺客不是一回两回了,出大篓子不认账也不是一回两回了。这次是系统升级,肯定得是ibm派出的实施工程师现场负责,出了问题ibm无论如何赖不了账的。

再欺客也欺负不到四大国行啊……不信你后续关注一下,IBM背完黑锅后,工行就增加对IBM的订单。这种事情貌似发生过……

IBM的大型机的质量还是很不错的。是不是店大欺客就不清楚了。但是软件、硬件就算出事了也应该有应对策略吧?这次貌似是操作系统的内存管理存在问题= =
返回顶部
顶部