Ir al contenido principal

Tendencias discursivas de los usuarios de YouTube durante el primer debate presidencial

 



Para este primer análisis pusimos a prueba nuestro algoritmo para identificar preferencia electoral implícita y explícita, a partir de los comentarios que los usuarios realizaron en YouTube durante y después del primer debate presidencial (Proyecto CEO). Asimismo, aplicamos la técnica de procesamiento de Lenguaje Natural conocida como N- gramas para reconocer patrones de texto a través de tres secuencias de palabras asociadas con mayor frecuencia (trigramas). En total se analizaron 40 mil comentarios que se recuperaron en cada uno de los sitios de YouTube donde se transmitió el encuentro entre los tres candidatos presidenciales.

Antes de empezar, es pertinente aclarar que las tendencias vertidas en este blog reflejan solo la preferencia electoral del número de comentarios en cita, por lo que no se consideran estadísticamente representativas del territorio. Quizá con un mayor volumen de datos podamos superar esta barrera, pero eso es justo lo que estamos intentando probar en esta etapa de nuestro proyecto.

Dicho lo anterior, y tras correr el algoritmo, encontramos que Claudia Sheinbaum concentró el 79% de las muestras de apoyo en tanto que Xóchitl el 21%. Al validar nuestro algoritmo con el método de aprendizaje supervisado K-Vecinos Cercanos, encontramos que la distribución es consistente con nuestros hallazgos (Zona Roja es Claudia Sheinbaum; y Zona Verde es Xóchitl Gálvez.



Una vez más nuestros resultados muestran similitud con las tendencias de las encuestas (Encuestas Presidenciales 2024), aunque la precisión y la representatividad continúan siendo un reto a superar.

Continuando con nuestro análisis, observamos que la conversación que gira en torno a Claudia Sheinbaum está marcada por muestras de apoyo positivas más que negativas. En su mayoría, podemos observar trigramas que exaltan el nacionalismo asociado a Claudia, al presidente López Obrador y al partido (viva-mexico-viva, claudia-viva-claudia, claudia-viva-mexico, viva-amlo-viva, viva-morena-viva); el grado académico de la candidata morenista (felicidades-doctora-claudia, dra-claudia sheinbaum); la proyección de victoria en las urnas (claudia-presidenta-claudia, nuestra-futura-presidenta, claudia-futura-presidenta, proxima-presidenta-claudia) y de respaldo popular (apoyo-total-claudia, todo-nuestro-apoyo); la identificación de los partidos que integran la coalición Sigamos Haciendo Historia (morena-pt-verde); las críticas con los que simpatizantes, o personas afines a la  4T, identifican a la oposición (roban-prian-jajaja, hasta-tiempo-roban, minutos-roban-prian, robaron-tiempo-claudia); el tema de la reducción del tiempo en el turno de la morenista (tiempo-claudia-sheinbaum, quitaron-tiempo-claudia, dieron-mas-tiempo, nos-dimos-cuenta); el plan C propuesto por AMLO y con el que también se identifica a la candidata (c-plan-c, claudia-plan-c, plan-c-viva) y el llamado al voto (claudia-voto-masivo, voto-masivo-morena). Del lado contrario, y con menor frecuencia, usuarios no afines a su candidatura le señalaron la posibilidad de ser castigada legalmente (ir-carcel-corrupta) y de ser derrotada en las urnas dadas las reacciones que manifiesta en las intervenciones de Xóchitl (contadas-perder-presidencia, horas están contadas, estan-contadas-perder, perder-presidencia-e, tic-tac-tic, cada-gesto-horas, gesto-horas-estan). Finalmente, y como es de esperarse, identificamos la presencia de usuarios afines a Xóchitl Gálvez que intentan contrarrestar el flujo de apoyo hacia Claudia mediante la mención de su nombre (xochitl-xochitl-xochitl) o bajo la expectativa de que morena deje de ser gobierno (dios-nos-libre).






Por lo que respecta a Xóchitl Gálvez, su caso puede ser aún más revelador; quizá no en términos de preferencia, pero sí en razón de violencia política. Pero, vayamos por partes. De manera positiva, dentro de la secuencia de trigramas que identificamos como favorables a ella, notamos que la secuencia más frecuente se asocia con la expectativa de que puede obtener el cargo (nuestra-próxima-presidenta, xóchitl-presidenta-mexico, xóchitl-galvez-presidenta, xochitl-presidenta-xochitl), con el posicionamiento de su nombre (xochitl-xochitl-xochitl), con la coalición y sus integrantes (pri-pan-prd, pan-pri-prd) y con la idea de que al gobierno en turno y su candidata le queda poco tiempo (tac-tic-tac). Negativamente, se distingue que los usuarios no afines a Xóchitl Gálvez la señalaron  duramente por el hecho de haber puesto el escudo nacional de cabeza bajo el argumento de no respetar y hacer un mal uso de los símbolos patrios (falta-respeto-nuestro, usar-simbolos-patrios, poner-bandera-reves, nuestro-simbolo-patrio, puso-bandera-reves, asi-puso-bandera, poner-escudo-bandera, falta-respeto-mexicanos) . En defensa de la acción, grupos afines respondieron con argumentos de que la bandera se colocó así porque es una representación de la situación del país (asi-esta-pais, mexico-esta-cabeza) y también como una señal de protesta (reves-señal-protesta). Adicionalmente, formaron parte de los argumentos de ataque de los opositores el tema de la guardería ABC (abd-abc-abc); y de defensa, el hecho de que las externalidades negativas dejadas por la pandemia, señaladas por la candidata panista, se entienden por el hecho de que fue una emergencia mundial (pandemia-fue-mundial).


Dada la evidencia anterior, creemos que esta estrategia o error es lo que hace que en el análisis de Xóchitl aparezcan la secuencias de risa (onomatopeya: jajaja) con mayor frecuencia que en el caso de Sheinbaum. Respecto a sus cualidades personales, se observan trigramas orientados a etiquetarla desfavorablemente como una candidata mentirosa (puras-mentiras-ratera, dice-puras-mentiras, mentiras-ratera-xochil, desde-inventaron-pretextos, verguenza-hablar-puras), corrupta (xochitl-vieja-corrupta, ratera-xochil-vieja, xochitl-corrupta-claudia), que no representa a ningún partido (representa-ningun-partido, pertenece-ningun-partido, ningún-partido-politico), que nadie le cree (nadie-cree-nada, bla-bla-bla), que no tiene propuestas (propuestas-solo-ataques) y que no es una digna representante (pena-ajena-mujer, tienes-verguenza-hablar, siquiera-puede-decir).

De lo anterior, se aprecia que la manera de cuestionar las capacidades y habilidades de la candidata por parte de usuarios no afines a ella suele utilizar un lenguaje duro y denostativo (vieja, ratera) o clasista (pobre-chicles-galvez). Para nuestro equipo de investigación, estas y otras formas de calificar a la candidata no son nuevas en el tono de la conversación, toda vez que previamente las habíamos advertido durante el proceso de codificación manual. Posteriormente, y ya en los primeros conjuntos de prueba que levantamos entre el 11 y 15 de marzo para aplicar el algoritmo, fue posible corroborar estas primeras impresiones a través de una nube de palabras. En un análisis más cualitativo de los datos, hallamos que la palabra "señora", cuando se hace en referencia a Xóchitl Gálvez, se emplea para catalogarla como menos preparada; en contraposición a Claudia Sheinbaum, cuyas referencias a su grado académico se presentan con mayor frecuencia durante la conversación. En esta misma nube, de igual forma, salta a la vista el uso de la palabra botarga como un recurso retórico que busca estereotiparla con base en su apariencia física ("Xochitarga"). Igualmente, el señalamiento asociado a su forma de hablar (rotacismo) aparece en los trigramas dentro de los parámetros con los que los usuarios suelen juzgarla o evaluarla (tiene-verguenza-hablar). En este sentido, algunos medios de comunicación han alertado que esta manera de referirse a ella suele hacerse con la intención mofarse o burlarse de su manera de hablar ("Vamos a ganag"). Este hecho, por lo visto, sigue persistiendo en el debate.





Finalmente, al comparar la convergencia temática entre ambas candidatas, encontramos que las 11 secuencias de trigramas que resultaron del debate presidencial se concentran mayoritariamente en el llamado al voto (voto-masivo-morena), en la proyección de quien puede ganar la contienda (nuestra-proxima-presidenta) y en el entretenimiento o la ironía (jajaja). Un dato a considerar en el diálogo entre usuarios es que el único tema relacionado con el ámbito de la política (entendida como acciones susceptibles de la intervención gubernamental) que logra aterrizar en los comentarios es el plan C propuesto por el presidente. Ello, a reserva de someterlo a verificación, indicaría que tanto la candidata de la coalición encabezada por MORENA como la candidata de Fuerza y Corazón por México, han sido poco eficientes en la meta de colocar sus propios temas en la agenda pública. 


A manera de conclusión, se advierte que la presencia de redes de apoyo manifestada en YouTube es mayor en Claudia que en Xóchitl. Tras la evidencia, es posible sostener que esta redes estás mejor organizadas y más dispuestas a participar de la conversación a fin de contrarrestar las expresiones de apoyo que giran en torno a Xóchitl Gálvez. Un hallazgo que nos pareció importante es que, al parecer, la gente que dice apoyar a la candidata retadora al oficialismo es menos propensa a manifestarse en su favor, ya sea para posicionar su agenda, su persona, o bien, para defenderla. Esta es tan sólo una hipótesis, pero, fieles a nuestra vocación como investigadores, iremos sometiéndola a verificación en las mediciones subsecuentes.

Hay más cosas qué decir, pero, por hoy, hasta aquí llega mi reporte. Recuerda que si ves algo de interés que hayamos pasado por alto en este breve análisis, puedes colaborar escribiendo en la caja de los comentarios.

¡Hasta la próxima!




Ulises Cruz Valencia es Doctor en Ciencias de Gobierno y Política por el Instituto de Ciencias de Gobierno y Desarrollo Estratégico de la Benemérita Universidad Autónoma de Puebla (ICGDE-BUAP). Desde 2019 pertenece al Sistema Nacional de Investigadores (Nivel 1). Sus temas de interés son el análisis del discurso político en campaña -spots y debates, particularmente- y la aplicación de Inteligencia Artificial en redes sociales para distinguir actitudes, emociones y preferencias de los usuarios en campañas electorales. Actualmente, es profesor de Tiempo Completo en el Instituto de Investigación Aplicada y Tecnología (InIAT) de la Universidad Iberoamericana CDMX.


























Comentarios

Entradas más populares de este blog

Spots de precampaña 2024: ataques, vaguedades y falta de liderazgo

El spot político televisivo es uno de los dispositivos de comunicación más utilizados por los candidatos en campaña debido a su corta duración, facilidad de recordación y alto control que se ejerce sobre él.  De acuerdo con el INE , para esta elección  habrá un total de 22 millones de spots circulando a través de los medios de comunicación televisivos y de las diferentes plataformas digitales . Lo anterior, como habrán de imaginar, da pie a que nos adentremos en conocer más sobre la manera en que las/el candidatas (o) se comportaron discursivamente en estas piezas audiovisuales para lucir preferibles ante el electorado. Para hacerlo, primero  explicaré la posición teórica de observación   en la que nos situamos,   para después proceder al   análisis del contenido lingüístico de los spots de precampaña . Mirada Teórica La Teoría Funcional del Discurso Político en Campaña fue propuesta por William Benoit y sus colegas en 1998 y en ella se plantea que el Discurso Político en Campaña tiene

¿Puede la Ciencia de Datos anticipar al ganador (a) de una elección?

  En la actualidad se ha vuelto muy común escuchar los términos  Ciencia de Datos e Inteligencia Artificial , pero poco se sabe de ellas; y más si se relacionan con temas electorales. En esta entrega te diremos qué son y cómo las hemos aplicado en nuestra investigación. La Inteligencia Artificial es un área del conocimiento que se distingue por la aplicación de una serie de técnicas de programación orientadas a emular el comportamiento y las acciones humanas. En la actualidad, una de las formas más destacadas de observarla son las herramientas que recrean la interacción conversacional, tales como ChatGPT o Chatbot de empresas. La Ciencia de Datos , por su parte, es un campo interdisciplinario cuyo propósito es analizar y procesar conjuntos de datos para perfeccionar toma de decisiones o realizar predicciones. Durante los últimos años esta rama del conocimiento aplicado ha ganado particular relevancia por a) el impulso de los avances tecnológicos en sistemas de cómputo, que posibilitan