Autor: Mauro Montoya Arenas
EDA: Análisis exploratorio de datos
Utilizaremos para este análisis el software R studio y el lenguaje de programación R. Empezamos explorando el formato de cada columna y su información relevante:
creando la columna “Estado_Tipo”, que contendrá el tipo de estado según el valor de la columna estado. La
siguiente tabla muestra la relación entre el número de Estado (idEstado) y el nombre del estado:
A partir de esto hacemos la siguiente programación:
Algo similar hacemos con la nueva columna “placa_embarcacion”, que la obtendremos a partir de los valores de
la columna “placa”
Ya creadas estas columnas. Empezamos con el análisis. Vamos a crear un boxplot con los valores de la presión
medida por el sensor:
A simple vista parece que no hay valores atípicos. Pero usaremos la fórmula para comprobarlo:
Como se pueden ver, no existe valores atípicos supriores ni inferiores.
Ahora pasamos a analizar los valores de cada embarcación, empezando por la embarcación Poseidón.
De esta grafica podemos observar que existe un valor atípico en el inicio de la descarga (presión =27.4799 ). Para
observar porque ocurre esto. Tenemos que ver la tabla.
Podemos observar que 2 minutos después el proceso se detiene (Estado=6). Lo cual es correcto, dado que es un
valor atípico que podría ser perjudicial.
Ahora hacemos el mismo análisis, con la embarcación Leaviatan:
En la embarcación Leviatán, no hemos encontrado valores de presión atípicos. Por ende pasamos a la
embarcación Perseo: