sociología + investigación + datos


Proyecto N°1 - Fintech vs. Banca Tradicional: ¿Qué opinan los usuarios sobre las apps Mercado Pago y Santander?

El objetivo de este proyecto fue simular el rol de un Analista de CX para una compañía de fintech y/o seguros, identificando los principales dolores, necesidades y oportunidades de mejora en la experiencia digital del sector, basándolo en la voz pública de los clientes.

💼 Rol: Analista de datos y experiencia del cliente.

🗄️ Datos: 1.000 reseñas de Google Play (Mercado Pago vs. Santander).

⚙️ Técnicas: Web Scraping, ETL, EDA, NLP, Visualización.

🛠️ Tecnologías: Python, Pandas, Seaborn, NLTK, WordCloud

📅 Fecha de Realización: Junio 2025.

Fase 1: Recolección de la voz del cliente

El proyecto partió de una pregunta central: ¿qué opinan realmente los usuarios sobre las principales apps financieras y de seguros en Argentina? Mi objetivo inicial fue trabajar con cinco aplicaciones relevantes: Mercado Pago, Ualá, Naranja X, La Caja Seguros y Banco Santander. Sin embargo, durante la fase de recolección de datos surgieron algunas limitaciones técnicas. La librería de Python google-play-scraper, utilizada para extraer las reseñas desde la Play Store, no logró acceder de manera estable al contenido de todas las apps.

Frente a esto, tomé una decisión metodológica importante: priorizar la calidad del análisis sobre la cantidad de apps. Por eso, el estudio se enfocó en Mercado Pago y Santander, las dos aplicaciones que ofrecían un volumen suficiente de reseñas y una extracción confiable. A partir de ahí, reuní un total de 1.000 reseñas (500 de cada app), que sirvieron como base para el análisis exploratorio posterior.

Fase 2: Limpieza y preparación de datos

Después de reunir las opiniones de los usuarios, el siguiente paso fue revisar y ordenar toda esa información. Muchas veces, los datos no vienen prolijos: hay columnas que no sirven, comentarios vacíos o fechas que no están bien formateadas. Por eso, antes de analizarlos, decidí hacer una limpieza general.

Lo primero fue quedarme solo con la información realmente importante: qué dijo el usuario, qué puntaje le dio a la app, cuándo lo escribió y a qué aplicación pertenece el comentario. Eso ya me permitía empezar a comparar experiencias.

También revisé si había opiniones vacías o mal cargadas, y las descarté para que no afectaran los resultados. Finalmente, ordené bien las fechas para poder analizar más adelante cómo fueron cambiando las opiniones con el tiempo.

Con todo eso listo, terminé esta etapa con una base de datos más simple, clara y confiable. Una vez hecho ese trabajo de limpieza, ya estaba en condiciones de pasar a la parte más interesante: ver qué dicen realmente los usuarios y qué patrones empiezan a aparecer.

Fase 3 - Análisis Exploratorio de Datos (EDA)

Con el dataset ya limpio y estructurado, se continuó con la Fase 3. El objetivo fue empezar a conocer mejor los datos y comparar el rendimiento general de las aplicaciones.

Para eso utilicé las librerías Matplotlib y Seaborn, que me permitieron hacer visualizaciones rápidas y claras. Realicé tres análisis principales:

  • Distribución de puntuaciones: Visualicé cuántas reseñas recibió cada app según la calificación que les dieron los usuarios (de 1 a 5 estrellas). Esto sirvió para detectar rápidamente si predominaban las opiniones positivas o negativas.

  • Promedio de calificaciones: Calculé el puntaje promedio de cada app, como una forma simple y directa de comparar la satisfacción general de los usuarios.

  • Análisis temporal: Intenté ver cómo evolucionó el volumen de reseñas a lo largo del tiempo. Aquí surgió un punto importante.

Durante el análisis, detecté un sesgo por volumen: Mercado Pago recibe muchísimas más reseñas que Santander. Al pedir 500 reseñas para cada app, las de Mercado Pago estaban concentradas en pocos días, mientras que las de Santander se distribuían a lo largo de casi un año. Esto hacía que el gráfico temporal no reflejara una comparación justa.

Por eso, decidí no avanzar con ese gráfico en la presentación final, ya que no aportaba una lectura clara ni equilibrada. En su lugar, enfoqué el análisis en métricas que sí podían compararse directamente, como el promedio de puntuación y la distribución de opiniones.

Esta fase fue clave para entender los primeros patrones y ajustar la estrategia de análisis en base a las características reales del dataset.

Fase 4 - Análisis de Texto y Nubes de Palabras

Para descubrir el "porqué" detrás de las puntuaciones, realicé un análisis de texto utilizando técnicas de Procesamiento de Lenguaje Natural (NLP). El objetivo fue identificar los temas clave que los usuarios mencionan cuando expresan satisfacción o frustración con cada aplicación.

El proceso se dividió en los siguientes pasos:

  • Segmentación: Separé el dataset en cuatro grupos distintos: reseñas positivas (4-5 estrellas) y negativas (1-2 estrellas) para Mercado Pago, y el mismo par para Santander.

  • Pre-procesamiento: Limpié el texto de cada reseña, eliminando "stopwords" (palabras comunes como "de", "la", "que", etc.) que no aportan significado, para enfocar el análisis en los términos verdaderamente relevantes.

  • Visualización con nubes de palabras: Para cada uno de los cuatro segmentos, generé una "Nube de Palabras". Esta técnica de visualización muestra las palabras más frecuentes en un texto, representando con un tamaño mayor aquellas que más se repiten.

El resultado es una comparación visual e intuitiva de los temas dominantes. Estas nubes de palabras nos permitieron identificar rápidamente los puntos fuertes que los clientes aman de cada servicio y, de manera crucial, los puntos de dolor específicos que generan las malas experiencias, proporcionando insights accionables que orientan la toma de decisiones a la hora de incluir nuevas actualizaciones en las apps.

Una vez recolectados los datos, el siguiente paso crítico fue un proceso de limpieza para asegurar la máxima calidad del análisis. Utilizando la librería pandas, realicé varias tareas cruciales:

  • Selección de datos: Para enfocar el estudio, seleccioné las columnas de mayor valor: el contenido de la reseña (content), la puntuación (score), la fecha (at) y el nombre de la aplicación (appName).

  • Detección y filtro de idioma: Durante una inspección inicial, detecté que la muestra de Santander contenía una mezcla significativa de reseñas en portugués. Para corregir esto y centrar el análisis exclusivamente en el mercado de habla hispana, implementé un paso de detección de idioma utilizando la librería langdetect. Filtré el dataset para conservar únicamente las reseñas identificadas en idioma español.

  • Validación de integridad: Finalmente, convertí los campos de fecha a un formato datetime estándar y eliminé cualquier registro que no contuviera un texto en la reseña.

Este meticuloso proceso de limpieza y filtrado fue fundamental para transformar los datos crudos en un dataset confiable y preciso, creando una base sólida para un análisis de sentimiento y temáticas verdaderamente enfocado.

Conclusiones finales
  • 1. Santander muestra mayor satisfacción promedio que Mercado Pago, según las calificaciones analizadas.

  • 2. Las expectativas de uso son distintas:
    Mercado Pago es evaluada como una herramienta transaccional del día a día (¿Es rápida? ¿Es fácil?), mientras que Santander es evaluada como una plataforma bancaria (¿Puedo entrar? ¿Es estable? ¿Es segura?).

  • 3. La relación con Mercado Pago es polarizada:
    Quienes la usan destacan la velocidad y simplicidad para pagos y transferencias, pero cuando estas funciones fallan —y el soporte no responde— la frustración es alta. Se pasa del entusiasmo al enojo con facilidad.

  • 4. En el caso de Santander, el principal valor es simbólico: la seguridad asociada al “banco”.
    Sin embargo, el punto más crítico para los usuarios es la inestabilidad técnica de la app. Muchos usuarios relatan no poder iniciar sesión o hacer operaciones básicas con regularidad.

  • 5. Recomendación general:
    Toda app financiera debería priorizar la estabilidad básica y un acceso confiable. Solo cuando eso está resuelto, se puede competir en velocidad, diseño o funcionalidades extra. Mercado Pago es fuerte en lo operativo, pero frágil cuando algo falla. Santander, al revés: tiene mayor reputación construida que genera confianza en sus usuarios, pero suele fallar en lo técnico.

lucas della torre.

2025 © Todos los derechos reservados.