Este es un espacio de debate que no compromete la opinión de La Silla Vacía ni de sus aliados.
Twitter puede medir lo que sentimos, y más frente a un hecho como el plebiscito.
Este artículo lo hice con Andrea Mamprin
Twitter es espacio de exposición, lugar de interacción y campo de batalla cuando se trata de flujos de información. Para el caso del plebiscito el ambiente en la ‘tuitósfera’ colombiana se ha densificado con el paso de las semanas y con cada uno de los hitos que ha marcado el devenir del proceso de paz en sus últimas instancias.
Basados en metodologías de minería de datos y estadística aplicada, contando y analizando palabras, clasificándolas de acuerdo al sentimiento que denotan, le contaremos con gráficas y resolviendo preguntas cómo se mueven el Sí y el No en diferentes variables.
Metodología
La técnica utilizada para calcular el sentimiento de los trinos se basa en la categorización por parte de operadores de una muestra estadística de usuarios/trinos. Por medio del Twitter Public Rest Api se recolectaron trinos relacionados con el plebiscito del 18 hasta el 27 de septiembre 2016. Sucesivamente se escogió un trino por cada usuario para poderle dar el mismo peso a todos independientemente del número de veces que estuvieron trinando. Sobre esta base se saca una muestra estadística con muestreo sistemático.
A los trinos de la muestra se les aplican técnicas de procesamiento textual y de machine learning para poder asignar a cada trino el sentimiento correcto. Un operador valida manualmente la categorización de la muestra. La muestra sacada en este caso es de 661 trinos y se basa en un nivel de confianza de 0,99 y error estadístico de 0,5. De los 661 trinos se sacaron 60 por ser off topic, es decir que no estaban relacionados con el tema investigado.