突发!上交所系统被买崩了?股票交易量火爆挤瘫系统,IT 部门天塌了!

科技   2024-09-27 13:00   浙江  
转自:InfoQ - 冬梅


 股票买入量火爆,买崩交易所 IT 系统

近日,A 股行情持续走高,甚至因为买入量太过庞大,导致股票交易系统瘫痪。

9 月 27 日上午,有不少股民在社交平台反映,买入股票的时候出现卡顿、交易延迟以及闪退等情形,有投资者调侃称,“买入量太过火爆,把交易所系统都给买崩了。”

亦有网络流传截图显示有券商反映称,发现上交所报单有延迟,初步排查是交易所系统导致。南都湾财社记者就此事致电上交所,工作人员回应称正在处置排查。

图片来源网络

有券商亦反映称上海证券交易所交易(委托、撤单)异常(交易通道堵塞),上交所正在紧急处理,深交所、北交所正常。

华南某券商人士告诉湾财社记者,早盘确实有收到客户的反馈,说交易系统出现了异常, 但现已经恢复。

然而,异常虽然已经修复,但对于 IT 从业者来讲,出现了这样的事故简直是天都要塌了!

那么,此次宕机到底是哪里出了问题?

关于此次宕机事故的原因外界也是猜测不断,据运维圈人员透露,此次事故是上交所的网关出了问题。

InfoQ 在上交所技术平台网站了解到,上交所的网关采用的是全新自主研发基于流式接口的交易网关(TDGW)客户端报单软件。

上交所在网站的产品介绍中提到:“为满足上交所业务发展需求,提升交易服务水平,上交所全新自主研发基于流式接口的交易网关(TDGW)客户端报单软件。本次推出的交易网关具有高性能、低时延、跨平台、开放易用等优点,同时为支撑集约化管理提供集中监控终端和监控接口,以全面满足市场参与者对交易报单软件的业务价值需求。目前可支持股票期权委托申报,后续交易网关将逐步支持其他交易业务。”

此外,也有网友猜测是服务器扩容出了问题,“市场一火爆,数据量就激增,服务器跟不上,交易就卡壳了,交易需要尽快升级硬件和算法了”。

当然,以上原因仅为猜测,实际问题出在了哪里,我们无从得知,期待后续上交所的官方回复。

紧接着,上交所发布了《关于股票竞价交易出现异常情况的公告》:本所关注到,今日开盘后本所股票竞价交易出现成交确认缓慢的异常。本所已在第一时间关注到相关情况,正在就相关原因进行排查。

声明称,请广大投资者及时关注本所相关公告。如您遇到任何问题或者存在疑问,请迅速联系您指定交易的证券公司获得帮助。

而上交所的上次宕机,还是发生在 13 年前的 2011 年。

2011 年 8 月,上期所也因系统故障发生过一起事故,当时部分客户持有的铜、铝期货合约被强行卖出平仓,导致铜、铝期货价格出现大幅异常波动。据测算,客户损失可能在 1700 万元左右。最终,这部分损失全部由上期所买单。

2010 年 11 月 5 日,上交所发生系统故障,当日发布公告,暂停 ETF 申购和赎回。

据了解,当日上午 10:16,上交所交易系统的一台交易主机因故障引起宕机,另一台主机及时接管,但由于接管过程中实时订单的处理能力意外下降,市场出现报单整体变慢、行情缓慢,个别会员出现报盘机退出的现象。中午休市期间,上交所便对相关交易主机进行紧急处置和抢修,下午开市后恢复正常,并迅速将上午积压的保单处理完毕。

根据分析,5 日的事故只是影响 ETF 的申购赎回业务,只涉及部分机构投资者的程序化套利业务,影响面较小,并未影响到 ETF 的正常交易。

此外,2012 年初,由于数据问题,上交所出现过部分股票涨幅突破涨停板的意外。

股票交易所宕机事件时有发生

事实上,由于股票交易太过火爆导致交易所 IT 系统宕机的事情时有发生。距离今天最近的就是今年 6 月,纽交所突发技术故障,导致大约 40 只股票的交易被紧急暂停,有些股票甚至暴跌近 100%。

据报道,当时由纽约证券交易所子公司运营的合并报价系统(Consolidated Tape Association)正在更新控制证券信息处理器(SIP)上显示开盘价格的软件。CTA 负责管理不同场所之间的交易数据传播,SIP 负责处理和整合数据。

两个小时左右的时间后,技术问题已经解决、交易顺利恢复正常。

事后,纽交所解释称,此问题可能是由软件版本更新所引发的,发生事故后纽交所通过切换到运行旧版本软件的辅助数据中心解决了该问题。

2018 年 10 月,东交所的股票买卖系统发生故障,部分大型券商暂停了投资者下单。据报道,故障原因是某证券公司误发送大量电子数据,严重超出系统处理能力,连接系统的 90 家券商中不到 40 家受到影响。

东交所设法通过备用线路恢复交易。据悉,除股票外,ETF 等交易下单系统也发生故障,连接券商的 4 条线路中 1 条无法接通,东交所通知各券商使用其余 3 条线路(但出现了来不及切换的情况)。

2016 年 7 月 22 日,LME 电子交易系统中断,当日早盘伦敦 3 个月铜、铝、铅、锌、镍、锡等金属无开盘数据。港交所发言人表示,LME 金属交易暂停是因为链接问题。

历史上,LME 曾多次发生宕机。例如,2013 年 9 月 24 日,LME 因技术故障于当日早间暂停了电子平台交易,暂停时长约 3 小时。LME 提前 15 分钟发布了通知,之后于北京时间 16 时 58 分有控制地暂停了电子交易,以免技术故障造成损失。

2016 年 7 月 14 日,因系统出现重复的交易确认信息,新交所开盘两个多小时候便进入“调整期”,暂停股票交易。当日新交所发布公告,预计下午 2 点重启交易,但因系统原因,直到 15 日才恢复交易。星展银行、新加坡航空股等受到影响。同年 12 月,发生了部分衍生品合约开盘交易延误两个半小时的意外,新交所事后并未说明发生故障的原因。

早在 2014 年 11 月,由于断电事故,新交所交易暂停近 3 个小时;之后不到一个月,因为软件升级引起交易系统技术故障,推迟开盘。事后新加坡成立高级别调查委员会进行调查,次年新交所公布了调查报告,并宣布投资 1500 万美元改善基础设施。然而 2015 年。其衍生品市场交易在 8 月和 10 月各中断过一次。

2014 年 8 月 24 日(当地时间),芝商所的全球电子交易系统平台开盘后因技术问题发生停顿,导致期货市场电子交易暂停长达 4 小时,受影响的合约包括美国股票指数、美国国债、原油及黄金、白银等衍生品。

同年 4 月 8 日,芝商所因技术问题导致部分合约交易中断 90 分钟以上,这一差错导致玉米、小麦、活牛和生猪等产品的期货和期权交易中断,但作为芝商所最大收入来源的利率和股指期货等合约未受影响。

2012 年 5 月,Facebook IPO 时纳斯达克交易系统出现故障,很多证券交易所的交易员未能及时对订单进行确认,导致了市场参与者在数小时、甚至几天的时间内都无法获知他们持有 Facebook 股票的风险。

次年,纳斯达克宣布将对当时遭受损失的市场参与者赔偿最多 4160 万美元,且相关公司需在 12 月 23 日前同意不起诉纳斯达克,随后才能获得一次性赔偿。但据多家做市商估算,此次事故造成他们共损失 5 亿美元左右。此外,美国证券交易委员会亦对纳斯达克做出 1000 万美元罚款。

上文只是列举了一部分。近年来发生过系统故障的海外交易所还包括孟买证交所、芝加哥期权交易所、费城交易所、纽约交易所……其中,多家交易所不止一次出现故障。

交易所系统的稳定性直接关系到市场的正常运行和投资者的利益。通过对一些成功案例的分析,我们可以得到以下几点启示:

  • 备用系统的建设:建设完善的备用系统是保障交易系统稳定运行的关键。当主系统发生故障时,备用系统能够迅速接替,确保交易的连续性。然而,备用系统的设计和维护也需要考虑到潜在的风险,如切换时间、备用系统的处理能力等。

  • 充分的风险预警:在交易开始前,交易所应加强对系统的监测,一旦发现潜在风险,及时通知相关方,避免因系统故障导致交易中断。

  • 充分的压力测试:通过模拟极端情况,评估系统在面对突发事件或高并发访问时的稳定性,同时找出系统在高负载下最薄弱的环节,以便进行优化。

总结来说, 一个稳定的交易系统需要综合考虑硬件、软件、应急机制等多个方面,并不断进行优化和完善。

参考链接:

http://news.china.com.cn/2024-09/27/content_117453995.shtml

http://www.caishiv.com/insight/detail?id=899

https://www.infoq.cn/article/pFaNeO97XGZ7xH7U1GLV


推荐阅读  点击标题可跳转

1、通透!一万字的统计学知识大梳理

2、图解 SQL 的执行顺序,优雅

3、多人同时导出 Excel 干崩服务器!新来的阿里大佬给出的解决方案太优雅了!

数据分析与开发
「数据分析与开发」分享数据分析与开发相关技术文章、教程、工具
 最新文章