Dopo la perdita, il lavoro immediato non fu un lutto nel senso ordinario, anche se ci fu abbondanza di delusione e dolore professionale. Si trattava di ricostruzione. Gli ingegneri della NASA e di Lockheed Martin iniziarono ad assemblare gli eventi che avevano portato al fallimento dell'inserimento, utilizzando dati di tracciamento, registri software, storia della telemetria e documentazione delle interfacce. Il processo fu lento perché il fallimento era distribuito tra organizzazioni e assunzioni. Nessun singolo pezzo rotto spiegava tutto. Il sistema aveva fallito come sistema, e gli investigatori dovevano districarlo un livello alla volta.
Il primo compito fu determinare se ci fosse stato qualche problema con la navetta stessa durante l'approccio finale. Le prove disponibili indicavano altrove. L'orbiter stava volando su una traiettoria sempre più incoerente con una cattura di Marte riuscita perché la soluzione di navigazione era errata. Quella errata era una questione pratica, non un'astratta curiosità matematica. Era la ragione pratica per cui l'orbiter entrò troppo in basso e scomparve. Il bilancio quindi iniziò con una caccia a dove nella catena erano entrate le unità sbagliate nell'analisi e per quanto tempo fossero rimaste invisibili.
Negli uffici e nelle sale conferenze dove si svolse l'indagine, l'atmosfera era di imbarazzo disciplinato. La NASA non poteva trattare la perdita come un'anomalia di routine. Si trattava di un grave fallimento della missione, e la credibilità dell'agenzia dipendeva da una spiegazione esatta. L'inchiesta doveva esaminare non solo l'errore di calcolo, ma anche la struttura di gestione che aveva permesso a presupposti incompatibili di sopravvivere tra i team. Non c'era conforto nel trovare un bug; la vera domanda era perché nessuno avesse costretto il bug a venire alla luce prima.
Quella necessità di chiarezza fu intensificata dalla scala di ciò che era stato perso. Il Mars Climate Orbiter, una navetta che era costata circa 125 milioni di dollari per essere costruita e lanciata, era stata progettata per servire come monitor climatico e atmosferico per Marte e come asset di rilancio per operazioni future. Invece, scomparve nel momento che avrebbe dovuto essere il trionfo della missione: l'inserimento orbitale del 23 settembre 1999. Una missione progettata per accumulare conoscenze scientifiche era diventata un caso di studio su come un piccolo fallimento dell'interfaccia possa cancellare anni di pianificazione e investimento.
Una scena dalla fase di risposta è il lavoro del team d'indagine e del personale di progetto che esaminano i prodotti dei dati riga per riga. I documenti venivano confrontati, i percorsi software tracciati e la gestione degli impulsi di navigazione esaminata. Il prodotto di un appaltatore, le assunzioni di una missione e le aspettative operative di un'agenzia venivano tutte messe sotto la stessa luce forense. La tensione nel processo derivava dalla realizzazione che l'errore non era nascosto in un raro evento cosmico, ma in un'interfaccia umana familiare a tutti i coinvolti. L'indagine non aveva bisogno di una spiegazione esotica; aveva bisogno di una mappa fedele del lavoro ordinario che non era stato controllato rigorosamente.
Il Mars Climate Orbiter Mishap Investigation Board ufficiale, presieduto da Donald K. Davis, concluse che la causa più probabile della perdita fu il fallimento nell'uso delle unità metriche nell'interfaccia software tra il team della navetta e il team di navigazione. Quella frase, secca nella forma, portava un pesante significato: la missione era stata persa perché un'assunzione dell'interfaccia era stata consentita a sopravvivere senza una verifica sufficiente. Il consiglio trovò anche debolezze sistemiche nelle comunicazioni del team di navigazione e nella supervisione della gestione del progetto. In altre parole, il disallineamento delle unità era la scintilla; l'organizzazione aveva fornito l'ossigeno.
Le conclusioni del consiglio non erano meramente descrittive. Erano forensi, costruite su prove che potevano essere tracciate attraverso i prodotti della missione e i registri operativi. Il rapporto del Mars Climate Orbiter Mishap Investigation Board identificò un'interruzione specifica nel flusso di dati tra Lockheed Martin Astronautics, che forniva dati sulle prestazioni della navetta in unità imperiali, e il team di navigazione del Jet Propulsion Laboratory, che si aspettava che le informazioni fossero in unità metriche. L'errore non era un singolo errore di battitura, quanto piuttosto un fallimento della disciplina dell'interfaccia—una conversione assente in un punto in cui tutti assumevano la compatibilità. Quella assunzione, lasciata incontestata, divenne fatale.
Un fatto sorprendente dal dopoguerra è che la morte della missione non rivelò semplicemente un errore tecnico, ma uno culturale. L'inchiesta descrisse carenze nella verifica delle uscite dell'interfaccia e nell'assicurare che i team di missione comprendessero le unità e le convenzioni utilizzate da diverse organizzazioni. Tali errori sono spesso invisibili fino a quando non diventano catastrofici perché tutti credono che qualcun altro abbia già controllato. Il Mars Climate Orbiter divenne un caso di studio su come la competenza professionale possa coesistere con la cecità organizzativa. Nulla nel record suggerisce una mancanza di intelligenza o impegno. Il pericolo risiedeva in un sistema che trattava la compatibilità come un dato di fatto piuttosto che come una condizione da verificare.
L'emergenza acuta di spiegazione si stabilizzò gradualmente man mano che le scoperte si consolidavano. A quel punto, la missione era già irrimediabile. Ciò che rimaneva era la responsabilità: il dovere di dire cosa fosse fallito, chi possedesse quale parte del fallimento e quali misure di sicurezza fossero state assenti. Per gli ingegneri, la lezione dolorosa fu che la precisione non è semplicemente una proprietà degli strumenti; è un contratto tra istituzioni. È scritta nei passaggi, nelle riunioni di revisione, nelle interfacce software e nella disciplina di chiedere se due team intendano la stessa cosa quando usano lo stesso numero.
Il pubblico sentì le linee generali attraverso annunci ufficiali e reportage, ma il bilancio interno avvenne all'interno delle agenzie e dei team di appaltatori. Non c'erano soccorritori da estrarre dai detriti, nessun letto d'ospedale da riempire, nessuna via di evacuazione da liberare. I resti erano procedurali e scientifici. L'emergenza si stabilizzò solo quando la causa fu nominata con sufficiente onestà da rendere possibile la riforma. Anche allora, le conseguenze si estendevano oltre una navetta scomparsa. La NASA dovette affrontare non solo un fallimento tecnico, ma anche le implicazioni per le missioni future che avrebbero dipeso da un'integrazione molto più stretta tra costruttori di navette, specialisti di navigazione e manager di missione.
Il processo investigativo chiarì anche quanto fosse dipendente da una documentazione di routine che, a prima vista, sembrava amministrativa piuttosto che drammatica. Documenti di interfaccia, assunzioni sulle unità e procedure di verifica—materiali spesso trattati come documentazione di sfondo—si trovarono improvvisamente al centro di un evento che poneva fine alla missione. Il fallimento del Mars Climate Orbiter mostrò che i registri non sono archivi passivi. Sono la memoria operativa di un programma, e quando quella memoria è incompleta o non esaminata, l'errore può viaggiare fino a un altro pianeta.
Alla fine dell'indagine, il fatto centrale era diventato ineludibile: la navetta era stata persa perché i sistemi umani non erano riusciti a mantenere uno standard di misurazione semplice coerente attraverso una missione complessa. La catastrofe era stata silenziosa, ma la risposta non poteva rimanere tale. Il prossimo compito era prevenire che lo stesso errore si ripetesse. Ciò significava più che riconoscere il disallineamento delle unità. Significava ricostruire le procedure affinché le assunzioni dovessero essere verificate, le interfacce dovessero essere confermate e nessun team potesse presumere in sicurezza che un altro team avesse già effettuato la conversione.
