猜测是底层平台挂了,比如机房之类的。上午了解到的情况是滴滴的内网都挂了,那肯定是公司底层核心出了问题。
第一批挂了以后理论上应该去做切流,假如说预案平台也挂了呢?那就得先恢复预案平台;
而且滴滴的核心交易链路应该也挂了,b端业务复杂,需要的依赖很多,内部可能是雪崩式的塌方,比如a服务依赖b服务启动,b服务依赖c服务启动,c服务依赖a服务生效,层层叠叠的,导致一次性拉起困难。
结果滴滴内网和公司IM也挂了,好家伙,现在研发人都找不到,听说是微信拉群解决的(真离谱
凌晨发了通告,应该是拉起恢复正常了,但是不稳定,结果早高峰流量一上来,又把平台打崩了,这下滴滴自己的员工都没办法上班了,导致中午12点还没止损(离谱+1
稳定性这个东西就是,不爆炸的时候感觉什么都不重要,爆炸的时候1-2个组根本挽救不回来,年年搞演练,年年出故障,干打雷不下雨,走个过场,结果线上真倒霉了。
这不会是最后一次,底层的雷多着呢,现在就看击鼓传花下一场是谁家的故障了。
发布于 2023-11-28 16:45・IP 属地北京