lunes, 7 de diciembre de 2009

Watergate Climático: "El código informático revela que los calentólogos cocinaron sus resultados"


Gráficas como el palo de hockey no se derivan directamente de los datos; estos deben tratarse para poder obtener el resultado final. Pero hay formas y formas de hacerlo, y los calentólogos introdujeron modificaciones arbitrarias para que los datos dijeran lo que debían decir.

Daniel Rodríguez Herrera
Uno de los argumentos más utilizados por los climatólogos cuyos correos electrónicos han sido desvelados en uno de los mayores escándalos científicos de los últimos años es que lo que escribían había sido sacado "fuera de contexto". Pese a que ese argumento puede ser válido para una parte de los mensajes, no lo es para todos, pues en muchos casos el contexto queda bien claro en cuanto se leen en el orden correcto.

En cualquier caso, hay algo que no puede mentir, y es el código fuente utilizado para dibujar esos palos de hockey con los que han convencido al mundo de que se encuentra al borde de la peor de las catástrofes. Y, efectivamente, el código no miente: es más, demuestra que lo hicieron los científicos del clima. Después de volcarse en lo más fácil de analizar de la filtración, los más de mil correos electrónicos entre la planta mayor de la calentología mundial, expertos de todo el mundo están centrando su mirada en el resto de ficheros contenidos en el ya famoso dossier: los datos de temperaturas, documentos y código fuente empleado en los estudios del CRU.

Un desastre total

Lo primero que ha llamado la atención de los informáticos que están analizando la filtración ha sido el fichero llamado "HARRY_READ_ME.txt"( http://www.anenglishmanscastle.com/HARRY_READ_ME.txt ), donde se pueden contemplar las tribulaciones de Ian "Harry" Harris, miembro del CRU ( http://www.uea.ac.uk/mac/comm/media/press/CRUstatements ), a la hora de analizar e intentar corregir el código fuente empleado para generar las alarmistas gráficas del palo de hockey de este grupo de científicos.

El archivo fue actualizado constantemente y contiene los comentarios seguramente de varios años de esfuerzos para poner algo de orden y lógica en el código y, sobre todo, en las bases de datos de temperatura del CRU, las más grandes del mundo y, por lo que se puede deducir del texto del pobre Harry, imposibles. Ambas cosas forman parte de lo que científicos como Steve McIntyre han pedido para poder reproducir los pasos dados por los creadores de palos de hockey y evaluar si son o no correctos. Siempre se han negado a proporcionarlos.

Dejemos por un lado lo que nos dicen los correos sobre la integridad de estos científicos. Este fichero dice mucho de su incompetencia:

De modo que... no tenemos los ficheros con los coeficientes (sólo gráficas .eps de algo). ¿Pero donde están esos ficheros mensuales? NO LO SÉ, NO ESTÁ DOCUMENTADO. Allá donde miro, hay ficheros de datos, pero no existe información sobre qué son aparte de sus nombres. Y eso es inutilizable. En el ejemplo anterior, los nombres de los ficheros en los directorios _mon y _ann son idénticos, pero los contenidos no. Y la única diferencia es que un directorio es aparentemente "mensual" [mon=monthly] y el otro "anual" [ann=annual], pero los dos contienen ficheros mensuales.

La conclusión de Harry, en otra parte del fichero, es la siguiente:

No existe una integridad de datos uniforme, sólo un conjunto de problemas que crece según son encontrados.

El fichero, no obstante, consta de más de trescientas páginas impreso, y todavía podría argumentarse que no es código en sentido estricto, sino comentarios de un programador, por muy reveladores que sean. Pero es que hay más.

Cocinando los resultados

La principal acusación a la que se puede enfrentar un científico es la de haber cocinado sus algoritmos y/o los datos originales para que muestren un resultado predeterminado. De ahí que el "truco de Mike" para "ocultar el descenso" haya sido el correo electrónico más destacado de los más de mil que forman parte del dossier.

El "descenso" que querían ocultar está claro. Para poder calcular las temperaturas de antes de que hubiera termómetros que las registraran los científicos deben usar lo que se denomina como "variables proxy" o directamente proxys. Son datos que sí se pueden recopilar hoy y que tienen relación con la temperatura de modo que se pueda establecer una relación matemática entre los datos del proxy y las temperaturas que sí se conocen. Así, a partir de los datos del Proxy podremos obtener las temperaturas que no sabemos.

El problema es que según la relación matemática usada por estos científicos la temperatura a partir de 1960 desciende en lugar de subir, como hacían los termómetros. ¿Solución? "Ocultar el descenso", de modo que la relación matemática obtenida a través del proxy no muestre el "óptimo climático medieval", una época en la que las temperaturas eran más altas o al menos similares a las actuales, de modo que este cambio climático sin precedentes tendría uno bien cercano, que impediría la propaganda catastrofista.

El código está lleno de comentarios que documentan el uso del "truco de Mike" para truncar los datos y que no fastidien el resultado. Pero lo más notable es este fragmento, destacado por el gurú del código abierto Eric S. Raymond ( http://esr.ibiblio.org/?p=1447 ), uno de los programadores informáticos más conocidos y respetados del mundo:

;
; Apply a VERY ARTIFICAL correction for decline!!
;
yrloc=[1400,findgen(19)*5.+1904]
valadj=[0.,0.,0.,0.,0.,-0.1,-0.25,-0.3,0.,- 0.1,0.3,0.8,1.2,1.7,2.5,2.6,2.6,$
2.6,2.6,2.6]*0.75 ; fudge factor
if n_elements(yrloc) ne n_elements(valadj) then message,’Oooops!’
;
yearlyadj=interpol(valadj,yrloc,timey)Aparte de la evidente incapacidad del programador por deletrear correctamente la palabra "artificial", que se escribe igual en inglés que en español, este código demuestra que los datos se están cocinando mediante unos valores completamente arbitrarios. O, para ser exactos, que parecen completamente arbitrarios. Raymond los ha colocado en una gráfica:
Este fudge factor ( http://en.wikipedia.org/wiki/Fudge_factor ), como puede verse, tiene como objetivo una reducción en los años 30 –que fueron muy cálidos; de hecho, en Estados Unidos, fueron los más cálidos del siglo XX– y un claro palo de hockey desde 1950 a 1980. Es decir, dado que los datos no se ajustaban al resultado deseado, cocinaron los resultados.

Cabe esperar que según pasen los días habrá más ejemplos de este tipo de manipulaciones, especialmente cuando científicos como McIntyre y McKitrick, que llevan años reclamando los datos originales y el código fuente empleado para generar estos palos de hockey, hayan podido estudiarlo a fondo.

No hay comentarios:

Publicar un comentario