Laboratorio de estadística.

Fuente original: https://www.nature.com/articles/d41586-023-00820-9

Introducción.

En el presente laboratorio, estudiamos la difusión de gases tóxicos en el aire, a partir del incidente ocurrido en Ohio el 3 de febrero de 2023.

En dicha fecha, un tren de mercancías con 20 vagones cargados de mercancías peligrosas descarriló liberando estas sustancias, que se evaporaron y difundieron por el aire. Además, las autoridades realizaron una quema controlada de la mercancía restante, propiciando que los gases tóxicos multiplicaran su concentración en el aire, causando problemas a la población.

Lo que haremos es sacar ciertos parámetros estadísticos para poder comprobar cómo ha sido la difusión de estos compuestos volátiles en el área afectada, viendo la media de la concentración en los respectivos días y dependiendo de las ubicaciones e intentando encontrar una tendencia para ver si la concentración tiene visos de descender a medio plazo.

Analizaremos el residuo de Benceno que quedó dispersado en el aire. No era el compuesto más peligroso, en comparación con otros como el cloruro de vinilo. Sin embargo, supone un riesgo para la salud de las personas que están en la zona.

Para poder realizar el proceso que arriba especificamos, utilizaremos el programa R, con fragmentos de código que quedarán en el presente documento.

Metodología.

El método que hemos utilizado es el siguiente, enumerado según ha ocurrido:

Creación del algoritmo.

Primero, declaramos las librerías utilizadas y modificamos el directorio de trabajo del programa.

library(readr)
setwd("~/src/labstat")

Una vez realizada la parte declarativa, introducimos los datos obtenidos.

a01 <- read_csv("data/ubi/A-01.csv")
uw <- read_csv("data/ubi/UW.csv")
dw <- read_csv("data/ubi/DW.csv")
wa1 <- read_csv("data/ubi/WA-01.csv")
wa2 <- read_csv("data/ubi/WA-02.csv")
wa3 <- read_csv("data/ubi/WA-03.csv")
wa4 <- read_csv("data/ubi/WA-04.csv")
wa5 <- read_csv("data/ubi/WA-05.csv")

Ahora podemos trabajar con estos datos desde R. Podemos ver los datos con el comando de R:

View(a01)
View(uw)
View(dw)
View(wa1)
View(wa2)
View(wa3)
View(wa4)
View(wa5)

Obtenemos la media de cada conjunto de datos con el comando mean(). Además, podemos crear una línea de tendencia de los datos.

mean(a01$Result_Final_Txt)
mean(uw$Result_Final_Txt)
mean(dw$Result_Final_Txt)
mean(wa1$Result_Final_Txt)
mean(wa2$Result_Final_Txt)
mean(wa3$Result_Final_Txt)
mean(wa4$Result_Final_Txt)
mean(wa5$Result_Final_Txt)

Dicha línea la creamos del modo siguiente:

  • Utilizamos el comando plot() para hacer un gráfico de los datos.
plot(a01)
  • Utilizamos posteriormente el comando abline(lm()) para que en la gráfica se vea la línea de tendencia. Veremos así si la correlación es positiva o negativa según la pendiente.
abline(lm(a01$Result_Final_Txt~a01$Differential))
  • Como tenemos los datos separados según la ubicación, podemos saber dónde sube la concentración de Benceno y donde baja, así como uicar en el mapa los lugares de medición.

Análisis de los datos obtenidos.

Hemos obtenido las siguientes gráficas con sus rectas de ajuste:

  • Conjunto de datos A-01: a01
  • Conjunto de datos UW: uw
  • Conjunto de datos DW: dw
  • Conjunto de datos WA-01: wa1
  • Conjunto de datos WA-02: wa2
  • Conjunto de datos WA-03: wa3
  • Conjunto de datos WA-04: wa4
  • Conjunto de datos WA-05: wa5

A la vista de las gráficas vemos, en primer lugar, que la correlación de los datos es muy baja y casi nula, lo cual da cuenta de la relativa fiabilidad de las rectas de ajuste. Vemos puntos extraordinariamente separados del resto de mediciones, lo cual propicia que la dispersión sea muy alta. Esta alta dispersión es debida a pocos datos, lo cual podría indicar que las medidas no se han realizado correctamente, en línea con lo que el artículo que nos ocupa sostiene. Sin embargo, podemos sacar conclusiones interesantes.

  • Hay varios conjuntos en los que la tendencia alcista de la concentración de Benceno es clara, aun eliminando los datos dispersos. Esto nos permite concluir que puede ser pronto para volver a la vida normal en el área, al menos en lo que al benceno atañe.
  • Los conjuntos de datos denominados con la etiqueta WA-XX tienen en la última medición un dato claramente mayor al resto. Esto podría deberse a un escape o, muy probablemente, a un fallo de medición. Recordemos que trabajamos sobre resultados aún preliminares.

Conclusiones.

Se han expuesto en el apatado anterior algunas cuestiones relevantes que se han encontrado al tratar los datos del descarrilamiento del tren de mercancías en Ohio. Este incidente ha puesto a prueba el sistema de emergencias estadounidense y algunas voces de la población local consideran que la respuesta por parte del sistema no ha sido del todo satisfactoria.

En base a los datos oficiales aportados por la EPA, todavía podemos ver como la concentración de ciertos compuestos es nociva para los seres vivos y, por tanto, el área de East Palestine es inhabitable. Los datos aportados, sin embargo, están lejos de ser totalmente correctos, según algunos estudios independientes. Por ende, convendría esperar a tener evidencias de la seguridad del lugar y, tal y como piden ciertas voces a nivel nacional, depurar responsabilidades ante la oleada reciente de este tipo de sucesos en el país.