Volver

Estudio Estadístico de Factores de Riesgo en Obesidad

Análisis Multivariante Exhaustivo para Salud Pública

Descripción del Proyecto

Desarrollé un análisis estadístico multivariante exhaustivo para identificar y caracterizar los principales factores de riesgo asociados con la obesidad en una población específica. El estudio aplica cinco técnicas estadísticas complementarias para revelar patrones ocultos y proporcionar insights valiosos para el desarrollo de estrategias de prevención efectivas y personalizadas.

Objetivo Principal: Examinar en profundidad los factores de riesgo desde antecedentes familiares hasta hábitos de vida cotidianos, aplicando técnicas estadísticas avanzadas para identificar patrones, relaciones y grupos de riesgo que aporten información crucial sobre las principales causas de la obesidad.

5 Técnicas Estadísticas
15 Variables Analizadas
85% Precisión Máxima

Metodologías Estadísticas Implementadas

PCA Reducción dimensional e identificación de patrones principales
LDA Clasificación optimizada con 85% de precisión
Clustering Identificación de grupos naturales de riesgo
Naive Bayes Clasificación probabilística con 70-78% accuracy
PLS Evaluation Análisis crítico de aplicabilidad metodológica

Cada metodología fue seleccionada estratégicamente para revelar diferentes aspectos de los datos, desde la reducción dimensional hasta la clasificación supervisada, proporcionando una visión 360° del problema de la obesidad y sus factores asociados.

Principales Factores de Riesgo Identificados

⚖️

Variables Antropométricas

Peso y altura como predictores más significativos confirmados en todos los análisis

📅

Factor Edad

Variable crucial para clasificación y agrupación de casos de obesidad

🧬

Relación Peso-Altura

Factor clave similar al IMC en identificación de grupos de riesgo

Los análisis convergieron en la identificación de patrones claros: existe una separación natural entre individuos obesos y no obesos, mientras que las categorías intermedias presentan mayor solapamiento. Los factores antropométricos emergen consistentemente como los predictores más poderosos.

Resultados de Rendimiento

85%

Precisión alcanzada con LDA en clasificación de niveles de obesidad

78%

Accuracy con Naive Bayes en categorías de clasificación reducidas

41.3%

Variabilidad explicada por PCA en las dos primeras dimensiones

El Análisis Discriminante Lineal mostró excelente clasificación para casos extremos (peso insuficiente y obesidad tipo III), mientras que Naive Bayes demostró versatilidad especial en la identificación de obesidad tipos 2 y 3. El análisis de clustering reveló 2-3 grupos óptimos con clara separación entre categorías.

Tecnologías y Herramientas Estadísticas

R & FactoMineR

Framework principal para análisis multivariante y PCA avanzado

MASS Package

Implementación robusta de Análisis Discriminante Lineal

ggplot2 & GGally

Visualizaciones profesionales y matrices de correlación avanzadas

e1071 & caret

Machine learning con Naive Bayes y evaluación rigurosa de modelos

El stack tecnológico utiliza el ecosistema R especializado en estadística avanzada, garantizando implementaciones matemáticamente rigurosas y visualizaciones de calidad académica. La integración de múltiples paquetes especializados permite un análisis comprehensivo y reproducible.

Competencias Técnicas Demostradas

Análisis Multivariante
Estadística Aplicada
Machine Learning
Visualización de Datos
Investigación en Salud
Interpretación Clínica

El proyecto demuestra dominio completo del pipeline de análisis estadístico en salud pública, desde la conceptualización metodológica hasta la interpretación clínica de resultados. La capacidad para aplicar múltiples técnicas complementarias y extraer insights coherentes refleja competencias avanzadas en ciencia de datos aplicada al sector salud.

Valor e Impacto en Salud Pública

Aplicabilidad Clínica: Los insights generados proporcionan guías basadas en evidencia para profesionales de la salud en la identificación temprana de factores de riesgo y desarrollo de estrategias de intervención personalizadas, contribuyendo directamente a la prevención efectiva de la obesidad.

La metodología rigurosa y los hallazgos convergentes entre diferentes técnicas estadísticas proporcionan confianza científica en los resultados. El enfoque multifactorial identificado sugiere que las estrategias de prevención más efectivas deben considerar tanto variables físicas como comportamentales, información crucial para políticas de salud pública basadas en evidencia.

📊 Dataset y Variables Analizadas

Análisis comprehensivo de 15 variables predictoras abarcando características demográficas, antropométricas, hábitos alimenticios y factores de estilo de vida

🔢 Variables Numéricas

  • Altura y Peso (antropométricas)
  • Edad (demográfica)
  • Consumo de vegetales y agua
  • Frecuencia de actividad física
  • Uso de dispositivos tecnológicos

🏷️ Variables Categóricas

  • Antecedentes familiares
  • Hábitos alimenticios
  • Patrones de snacking
  • Consumo de alcohol y tabaco
  • Medio de transporte utilizado

Proyecto desarrollado como demostración de competencias avanzadas en Análisis Estadístico Multivariante y Ciencia de Datos aplicada a Salud Pública