GITT. Clasificador de perfiles sociales en Twitter
Abstract
El creciente uso de las redes sociales por particulares, empresas o
gobiernos las ha convertido en el medio de intercambio social más usado.
Creadas para compartir opiniones, información y elementos digitales, ofrecen
una gran cantidad de información que se ha llegado a convertir en un objetivo de personas, política y economía. Extraer la información a partir de las interacciones en redes sociales puede ayudar a medir riesgos, impactos de crisis, ataques reputacionales, estudios de mercados o incluso analizar influencers para un negocio.
Esta gran cantidad de información que se genera crece rápidamente y
requiere de métodos especializados para poder analizar su naturaleza,
encontrando bots, perfiles falsos y cuentas con variedad de identidades e
intenciones. Se puede llegar a encontrar un lugar para el crimen, estafas o
manipulaciones, haciendo necesario el estudio y clasificaciones de los perfiles en las redes sociales a través del desarrollo de mecanismos automáticos.
En este Trabajo de Fin de Grado (TFG), se ha diseñado un algoritmo,
basándose en mecanismos de machine learning, que permiten buscar patrones de comportamiento en base a unos datos de entrada. Se analizarán los mecanismos que esta tecnología ofrece, buscando el que mejor se adapte a las necesidades del proyecto teniendo en cuenta la extracción de datos, su preprocesado, clasificación y enlazando con una gran base de datos que permita almacenar toda la información.
El objetivo final será clasificar perfiles sociales de Twitter basándose en su
comportamiento, dividiéndolos en tres grupos: “Medios”, “Inflcuencers” y
“Otros”, almacenándolos en una base de datos y generando información relativa a la naturaleza de cada perfil, preparada para su análisis. El proyecto se centra en los perfiles de medios de comunicación: perfiles usados para entretener, formar opinión, informar, etc. Se buscará en primer lugar definir qué son, para luego caracterizar su comportamiento y finalmente diferenciarlos del resto de perfiles.