Proyecto Setas
Este proyecto se centró en el tratamiento de un dataset extremadamente sucio y lleno de valores faltantes, cuyo objetivo final era determinar si una seta era venenosa o comestible. El valor principal de este trabajo no residía tanto en el modelado, sino en la limpieza exhaustiva, análisis exploratorio y tratamiento de datos faltantes, aplicando técnicas de imputación y reducción de variables con bajo valor informativo.
Trabajo realizado
- Limpieza e imputación de datos
-
Eliminación de variables sin varianza o irrelevantes (como veil-type, que tenía un único valor).
-
Identificación de columnas con muchos valores nulos.
-
Imputación basada en la distribución de otras variables y el conocimiento del dominio.
-
Conversión de variables categóricas a numéricas mediante codificación adecuada.
- Análisis estadístico
Se usaron pruebas de hipótesis para analizar la relación de cada variable con la clase objetivo. Por ejemplo, se identificó que la variable odor tenía un p-valor extremadamente bajo, siendo altamente significativa para predecir si una seta era venenosa.
- Modelado con ML clásico
Tras la limpieza, se aplicaron modelos como:
-
Random Forest
-
Support Vector Machine
-
K-Nearest Neighbors
Estos modelos ofrecieron muy buenos resultados gracias a la calidad de los datos procesados.
- Red neuronal
Se construyó también una red neuronal multicapa (MLP) con Keras/TensorFlow, que alcanzó una alta precisión en la predicción binaria de la clase venenosa. La red fue optimizada con técnicas de regularización y normalización.
Este fue el dataset recibido:

Un poco de la limpieza realizada:

Red Neuronal

Red neuronal secuencial de 3 capas ocultas, diseñada para clasificación binaria:
- Entrada: 14 variables (tras PCA).
- Primera capa densa: 64 neuronas, activación ReLU.
- Segunda capa densa: 32 neuronas, activación ReLU.
- Capa de salida: 1 neurona, activación sigmoide → devuelve una probabilidad (0 a 1).
Es una red sencilla pero eficaz para tareas de clasificación binaria con entrada vectorial reducida.
Crea tu propia página web con Webador