Análisis Multivariante Exhaustivo para Salud Pública
Desarrollé un análisis estadístico multivariante exhaustivo para identificar y caracterizar los principales factores de riesgo asociados con la obesidad en una población específica. El estudio aplica cinco técnicas estadísticas complementarias para revelar patrones ocultos y proporcionar insights valiosos para el desarrollo de estrategias de prevención efectivas y personalizadas.
Objetivo Principal: Examinar en profundidad los factores de riesgo desde antecedentes familiares hasta hábitos de vida cotidianos, aplicando técnicas estadísticas avanzadas para identificar patrones, relaciones y grupos de riesgo que aporten información crucial sobre las principales causas de la obesidad.
Cada metodología fue seleccionada estratégicamente para revelar diferentes aspectos de los datos, desde la reducción dimensional hasta la clasificación supervisada, proporcionando una visión 360° del problema de la obesidad y sus factores asociados.
Peso y altura como predictores más significativos confirmados en todos los análisis
Variable crucial para clasificación y agrupación de casos de obesidad
Factor clave similar al IMC en identificación de grupos de riesgo
Los análisis convergieron en la identificación de patrones claros: existe una separación natural entre individuos obesos y no obesos, mientras que las categorías intermedias presentan mayor solapamiento. Los factores antropométricos emergen consistentemente como los predictores más poderosos.
Precisión alcanzada con LDA en clasificación de niveles de obesidad
Accuracy con Naive Bayes en categorías de clasificación reducidas
Variabilidad explicada por PCA en las dos primeras dimensiones
El Análisis Discriminante Lineal mostró excelente clasificación para casos extremos (peso insuficiente y obesidad tipo III), mientras que Naive Bayes demostró versatilidad especial en la identificación de obesidad tipos 2 y 3. El análisis de clustering reveló 2-3 grupos óptimos con clara separación entre categorías.
Framework principal para análisis multivariante y PCA avanzado
Implementación robusta de Análisis Discriminante Lineal
Visualizaciones profesionales y matrices de correlación avanzadas
Machine learning con Naive Bayes y evaluación rigurosa de modelos
El stack tecnológico utiliza el ecosistema R especializado en estadística avanzada, garantizando implementaciones matemáticamente rigurosas y visualizaciones de calidad académica. La integración de múltiples paquetes especializados permite un análisis comprehensivo y reproducible.
El proyecto demuestra dominio completo del pipeline de análisis estadístico en salud pública, desde la conceptualización metodológica hasta la interpretación clínica de resultados. La capacidad para aplicar múltiples técnicas complementarias y extraer insights coherentes refleja competencias avanzadas en ciencia de datos aplicada al sector salud.
Aplicabilidad Clínica: Los insights generados proporcionan guías basadas en evidencia para profesionales de la salud en la identificación temprana de factores de riesgo y desarrollo de estrategias de intervención personalizadas, contribuyendo directamente a la prevención efectiva de la obesidad.
La metodología rigurosa y los hallazgos convergentes entre diferentes técnicas estadísticas proporcionan confianza científica en los resultados. El enfoque multifactorial identificado sugiere que las estrategias de prevención más efectivas deben considerar tanto variables físicas como comportamentales, información crucial para políticas de salud pública basadas en evidencia.
Análisis comprehensivo de 15 variables predictoras abarcando características demográficas, antropométricas, hábitos alimenticios y factores de estilo de vida
Proyecto desarrollado como demostración de competencias avanzadas en Análisis Estadístico Multivariante y Ciencia de Datos aplicada a Salud Pública