Proyecto Setas

Este proyecto se centró en el tratamiento de un dataset extremadamente sucio y lleno de valores faltantes, cuyo objetivo final era determinar si una seta era venenosa o comestible. El valor principal de este trabajo no residía tanto en el modelado, sino en la limpieza exhaustiva, análisis exploratorio y tratamiento de datos faltantes, aplicando técnicas de imputación y reducción de variables con bajo valor informativo.

Trabajo realizado

 

Limpieza e imputación de datos

  • Eliminación de variables sin varianza o irrelevantes (como veil-type, que tenía un único valor).

  • Identificación de columnas con muchos valores nulos.

  • Imputación basada en la distribución de otras variables y el conocimiento del dominio.

  • Conversión de variables categóricas a numéricas mediante codificación adecuada.

- Análisis estadístico

Se usaron pruebas de hipótesis para analizar la relación de cada variable con la clase objetivo. Por ejemplo, se identificó que la variable odor tenía un p-valor extremadamente bajo, siendo altamente significativa para predecir si una seta era venenosa.

- Modelado con ML clásico

Tras la limpieza, se aplicaron modelos como:

  • Random Forest

  • Support Vector Machine

  • K-Nearest Neighbors

Estos modelos ofrecieron muy buenos resultados gracias a la calidad de los datos procesados.

- Red neuronal

Se construyó también una red neuronal multicapa (MLP) con Keras/TensorFlow, que alcanzó una alta precisión en la predicción binaria de la clase venenosa. La red fue optimizada con técnicas de regularización y normalización.

Este fue el dataset recibido:

Un poco de la limpieza realizada:

Red Neuronal

Red neuronal secuencial de 3 capas ocultas, diseñada para clasificación binaria:

- Entrada: 14 variables (tras PCA).

- Primera capa densa: 64 neuronas, activación ReLU.

- Segunda capa densa: 32 neuronas, activación ReLU.

- Capa de salida: 1 neurona, activación sigmoide → devuelve una probabilidad (0 a 1).

Es una red sencilla pero eficaz para tareas de clasificación binaria con entrada vectorial reducida.

Crea tu propia página web con Webador