martes, 17 de abril de 2018

Los bots dominan 2/3 del tráfico de Twitter

Los bots en Twitter comparten dos tercios de los enlaces a sitios web populares: Pew

Natasha Lomas | Tech Crunch




Es oficial: los Bots están haciendo mucho trabajo de RR.PP. en Twitter, especialmente cuando se trata de promover sitios web pornográficos.

Esa conclusión, quizás poco sorprendente, sobre qué cuentas de Twitter automatizadas son compartir enlaces proviene de un nuevo estudio del Centro de Investigación Pew que se propuso cuantificar un aspecto de la actividad basada en bots en la Twittosfera.

Específicamente, los investigadores querían saber qué proporción de enlaces twitteados a sitios web populares son publicados por cuentas automáticas, en lugar de usuarios humanos.

La respuesta que se les ocurrió fue que alrededor de dos tercios de los enlaces twitteados a sitios web populares son publicados por robots en lugar de humanos.

Los investigadores dicen que estaban interesados ​​en tratar de entender un poco más acerca de cómo la información se propaga en Twitter. Aunque para este estudio no trataron de profundizar directamente en preguntas más complicadas (y complicadas) sobre bots, como si la información que es propagada por estos robots es en realidad desinformación.

Los investigadores de Pew tampoco trataron de determinar si la actividad de relaciones públicas con enlaces automáticos realmente llevó a niveles significativos de participación humana con el contenido en cuestión. (Algo que puede ser difícil de determinar para los investigadores externos porque Twitter no brinda acceso completo a la forma en que da forma a la visibilidad de los tweets en su plataforma, ni datos sobre cómo los usuarios individuales hacen uso de controles y configuraciones que pueden influir en lo que ven o no lo haga en su plataforma).

Por lo tanto, es seguro decir que muchas preguntas relacionadas con los robots aún no se han investigado exhaustivamente.

Pero aquí hay al menos otra información sobre qué cuentas automáticas están enfrentadas con los principales sitios web de medios, aunque, como siempre, estos resultados son calificados como "bots sospechosos" como consecuencia de lo difícil que es identificar definitivamente si una entidad en línea es humana o no. (Pew utilizó la herramienta de aprendizaje automático Botometer de la Universidad de Indiana para identificar bots sospechosos, basándose en un puntaje de 0,43 o superior para declarar una probable automatización, en base a una serie de sus propios ejercicios de validación).

La conclusión principal de Pew es que las cuentas automatizadas sospechadas desempeñaron un papel destacado al tuitear enlaces a contenido en el ecosistema de Twitter, con un 66% de todos los enlaces tuiteados a los sitios web más populares probablemente publicados por cuentas automáticas, en lugar de usuarios humanos.

Los investigadores determinaron la popularidad del sitio web al realizar primero un análisis de 1,2 millones de tweets en inglés que contenían enlaces (extrayendo datos de tweets de muestra aleatoria a través de la API de transmisión de Twitter), que se redujeron a una lista de 2.315 sitios populares, es decir, duplicados y enlaces muertos. eliminados.

A continuación, los clasificaron en dominios de contenido, con todos los enlaces que apuntaban a cualquier otro contenido en Twitter (es decir, no en forma externa) recopilados en una sola categoría de Twitter.com.

Después de eso, pudieron comparar cómo (sospechosos) los bots frente a los (probables) humanos compartían diferentes categorías de contenido.

A continuación, se muestran los resultados del contenido que muestran los bots sospechosos: como se mencionó anteriormente, no es de sorprender que esté dominado por contenido para adultos. Aunque se descubrió que los bots responden por la mayoría de los enlaces compartidos a los sitios web populares en toda la categoría. Ergo, los robots ya están haciendo una gran cantidad de trabajo duro de RR.PP. ...

(Considerando eso, una buena regla general parece ser que si una cuenta de Twitter comparte enlaces a sitios pornográficos, probablemente no sea humana). O bien, es una cuenta humana que ha sido pirateada.

Los investigadores también descubrieron que un número relativamente pequeño de cuentas automatizadas eran responsables de una parte sustancial de los enlaces a los medios populares en Twitter. "Las 500 cuentas de bots sospechosos más activas por sí solas fueron responsables del 22% de todos los enlaces a estos sitios de noticias y eventos actuales durante el período en que se realizó este estudio. Por el contrario, las 500 cuentas humanas más activas fueron responsables de solo el 6% de todos los enlaces a dichos sitios ", escriben.

Claramente, los bots no son retenidos por las debilidades humanas en relaciones públicas, como la necesidad de dejar de trabajar para comer o dormir.

Pew dice que su análisis también sugiere que ciertos tipos de sitios de noticias y eventos actuales aparecen como "especialmente probables" de ser twitteados por cuentas automáticas. "Entre los más destacados se encuentran sitios de agregación o sitios que compilan principalmente contenido de otros lugares de la web. Se estima que el 89% de los enlaces a estos sitios de agregación durante el período de estudio fueron publicados por cuentas bot ", escriben.

tl; dr: los Bots parecen estar menos interesados ​​en promocionar los informes originales. O, para decirlo de otra manera, a menudo se despliega el trabajo de bot grunt para tratar de obtener visualizaciones baratas del contenido de otras personas.

Otra observación interesante: "Las cuentas automatizadas también proporcionan una proporción algo superior a la media de enlaces a sitios que carecen de una página de contacto público o dirección de correo electrónico para ponerse en contacto con el editor u otro personal.

"La gran mayoría (90%) de los sitios populares de noticias y eventos actuales examinados en este estudio tenía una página de contacto pública, no Twitter. La pequeña minoría de sitios que carecen de este tipo de página de contacto fueron compartidos por bots sospechosos a mayor velocidad que aquellos con páginas de contacto. Alrededor del 75% de los enlaces a dichos sitios fueron compartidos por cuentas de bots sospechosos durante el período de estudio, en comparación con el 60% de los sitios con una página de contacto ".

Sin leer demasiado sobre ese hallazgo, es posible teorizar que los sitios sin ninguna página de contenido público o correo electrónico podrían ser más propensos a la desinformación. (Los investigadores de Pew no llegan tan lejos como para unirse a esos puntos exactamente, pero sí señalan: "Este tipo de información de contacto puede usarse para enviar comentarios de los lectores que pueden servir como base de correcciones o informes adicionales").

Dicho esto, Pew también descubrió que el contenido político tiene un interés relativamente menor para los bots frente a otros tipos de noticias y contenido de actualidad, al menos a juzgar por esta instantánea de tweets en inglés (tomada el verano pasado).

"[C] ciertos tipos de sitios de noticias y eventos actuales reciben una participación inferior a la media de sus enlaces de Twitter desde cuentas automatizadas", escriben los investigadores. "En particular, este análisis indica que las noticias populares y los sitios de eventos actuales que presentan contenido político tienen el nivel más bajo de tráfico de enlace de las cuentas bot entre los tipos de noticias y contenido de eventos actuales que analizó el Centro, manteniendo constantes otros factores. De todos los enlaces a fuentes de medios populares que presentan prominentemente contenido político o político durante el período del estudio, se estima que el 57% se originó a partir de cuentas de bot ".

Los investigadores también analizaron la afiliación política, para tratar de determinar si los bots sospechosos se tuercen hacia la izquierda o hacia la derecha en términos del contenido que están compartiendo.

(Para determinar la inclinación ideológica del contenido al que se está vinculado en Twitter, Pew dice que utilizaron una técnica estadística conocida como análisis de correspondencia, que examina el comportamiento del público de Twitter de las publicaciones para compartir el contenido en un espectro ideológico que va desde "Muy liberal" a "más conservador").

De hecho, encontraron que las cuentas automáticas publicaban una mayor proporción de contenido de sitios que tenían "audiencias humanas mixtas o centristas ideológicamente". Al menos en lo que concierne a los sitios populares de noticias y eventos actuales "con una orientación hacia noticias y asuntos políticos".

"El análisis del Centro encuentra que las cuentas autónomas sospechosas publican una mayor proporción de enlaces a sitios que son principalmente compartidos por usuarios humanos que puntúan cerca del centro del espectro ideológico, en lugar de aquellos compartidos más a menudo por un público más liberal o más conservador ," escriben. "Las cuentas automatizadas comparten aproximadamente entre el 57% y el 66% de los enlaces a sitios políticos que son compartidos por una audiencia humana ideológicamente mixta o centrista, según el análisis".

Pew agrega que las diferencias de derecha a izquierda en la proporción de tráfico bot "no eran sustanciales".

Aunque, sobre esto, vale la pena enfatizar que esta parte del análisis se basa en un subconjunto bastante pequeño de una instantánea de la Twittersfera que ya se enfoca exclusivamente en el idioma inglés y en los EE. UU. así que leer demasiado en esta parte del análisis parece imprudente.

Pew señala: "Este análisis se basa en un subgrupo de noticias populares y puntos de venta de eventos actuales que presentan historias políticas en sus titulares o tienen una sección de política, y que sirven principalmente a la audiencia de los EE. UU. Un total de 358 sitios web de nuestra muestra completa de 2,315 sitios populares cumplieron con estos criterios ".

Realmente, el estudio subraya una verdad fundamental acerca de los bots de Twitter: a menudo se utilizan con fines de spam / relaciones públicas: para tratar de dirigir el tráfico a otros sitios web. La esencia de lo que están promoviendo varía, aunque a menudo puede ser contenido para adultos.

Los Bots también se usan a menudo para tratar de generar clics de forma barata a un agregador de contenido barato o sitios de productos para que las entidades externas puedan cobrar de forma económica gracias a las vistas de anuncios y los ingresos mejorados.

Las campañas de desinformación política pueden resultar en un menor volumen de spam / PR generados por bot que las granjas de pornografía o contenido. Aunque el daño potencial - a los procesos democráticos y las instituciones sociales - es posiblemente mucho más serio. Además de ser muy difícil de cuantificar.

Y, bueno, en lo que respecta a la influencia de los bots, todavía tenemos muchas más preguntas que respuestas.

No hay comentarios:

Publicar un comentario