不懂航天技术,但复杂系统架构还是懂的。
一般来说,一套复杂系统,如果出现偶发故障,那么局部小修小补,是有可能给fix掉的。
但如果连续失败,而且连续fix都不生效的话,那么就往往意味着整个系统架构上有致命缺陷。而且,整个系统的各个关键指标都可能处于非常紧密耦合的状态,也就是说,当初整体架构设计时留下的裕度/冗余已经被之前的各种迭代修改吃光了。所以才出现局部的修补,反而造成按下葫芦浮起瓢,怎么调都两头出事的情况。
这个时候,还想快速迭代去fix,是不行的。老老实实停下来,重新从整体到细节,分析整个架构,然后再确定修改方案——往往意味着这是一个不小的改动。
当然,还有一种可能性,前几次炸,都没有真正去fix,只是头铁的去炸——在软件领域,这种做法不奇怪,因为有时候数据采集不全,那么可以修改数据采集点后,反复炸来收集数据。但老马会不会在航天领域也这么玩,就不知道了。