Saltar a contenido

🚀 Exploraciones Extra: Investigando Más Allá del Curso

Esta sección presenta exploraciones adicionales realizadas de forma autónoma para profundizar en técnicas de Data Science y Machine Learning Ético. Cada análisis complementa las unidades temáticas del curso con datasets reales de Kaggle y casos de estudio actuales.


📊 Resumen de Exploraciones

3
Exploraciones
Completadas
3
Datasets
Analizados
15+
Técnicas
Aplicadas
20+
Gráficos
Creados

📊 Proyectos de Exploración

📱 Social Media & Mental Health - Análisis Exploratorio de Comportamiento Digital

Dataset: Social Media and Mental Health Dataset (Kaggle) - Datos de estudiantes universitarios sobre uso de redes sociales y salud mental. Incluye tiempo de uso diario, plataformas preferidas (Instagram, TikTok, Facebook, Twitter, Snapchat), indicadores de bienestar psicológico (depresión, ansiedad, autoestima) y datos demográficos.

🎯 Objetivos del Análisis

  • Investigar correlaciones entre tiempo en redes sociales y salud mental
  • Identificar plataformas con mayor impacto en bienestar psicológico
  • Detectar grupos de riesgo según patrones de uso
  • Visualizar tendencias y distribuciones demográficas
  • Extraer insights accionables sobre comportamiento digital

💻 Stack Tecnológico

Python 3.8+ Pandas NumPy Seaborn Matplotlib Análisis Estadístico EDA Kaggle Hub

🔗 Recursos

📄 Ver Reporte Completo →
📓 Descargar Notebook →


💳 Credit Card Fairness - Detección y Mitigación de Sesgo en Aprobaciones Crediticias

Dataset: Credit Card Approval Dataset (Kaggle) - 438,857 solicitudes de crédito con datos demográficos (género, edad, nivel educativo, estado civil) y financieros (ingresos, empleo, historial crediticio). Dataset con desbalance significativo: 68% mujeres vs 32% hombres.

🎯 Objetivos del Análisis

  • Detectar sesgo demográfico en decisiones de aprobación de crédito
  • Cuantificar disparidades entre grupos protegidos con métricas de fairness
  • Evaluar impacto del sesgo en precisión del modelo (accuracy, precision, recall)
  • Experimentar con técnicas de mitigación (ExponentiatedGradient + DemographicParity)
  • Analizar trade-offs entre accuracy y fairness en contexto regulatorio

💻 Stack Tecnológico

Fairlearn 0.10+ Scikit-learn 1.3+ Python 3.8+ Pandas NumPy Random Forest ExponentiatedGradient Ética en IA Compliance Legal Kaggle Hub

🔗 Recursos

📄 Ver Reporte Completo →
📓 Descargar Notebook →


🛒 Retail Rocket - PCA y Feature Selection en E-Commerce

Dataset: Retail Rocket E-commerce Dataset (Kaggle) - 2.7M+ eventos de comportamiento de usuarios en una plataforma de e-commerce durante 4.5 meses. Incluye views, add-to-cart y transactions de 1.4M usuarios únicos sobre 235K productos.

🎯 Objetivos del Análisis

  • Transformar eventos granulares en features agregadas por usuario
  • Aplicar PCA para reducción dimensional y análisis de varianza
  • Comparar Filter Methods (F-test, Mutual Information) vs Wrapper Methods (RFE)
  • Evaluar trade-off entre complejidad del modelo y performance predictiva
  • Identificar features más predictivas para conversión en e-commerce

💻 Stack Tecnológico

Python 3.8+ Scikit-learn PCA RFE Random Forest Pandas Feature Engineering Kaggle Hub

🔗 Recursos

📄 Ver Reporte Completo →
📓 Descargar Notebook →


🎓 Relación con el Curso

Estas exploraciones se alinean directamente con las unidades temáticas del curso de Ingeniería de Datos de la Universidad Católica del Uruguay:

Exploración Unidad Relacionada Temas Aplicados Habilidades Demostradas
Social Media & Mental Health UT1 - Análisis Exploratorio EDA, Visualización, Estadística Descriptiva, Correlaciones Análisis de datos, storytelling con visualizaciones
Credit Card Fairness UT2 - Calidad & Ética Fairness Audit, Bias Detection, Ethical AI, Compliance Machine Learning ético, métricas de fairness, regulación
Retail Rocket PCA UT3 - Feature Engineering PCA, Feature Selection, RFE, Filter Methods Reducción dimensional, selección de variables, modelado predictivo

← Volver a Inicio | Ver UT1 → | Ver UT2 → | Ver Proyectos →