Análisis del fediverso hispanohablante

Aviso: Después de comentarios de varias personas creo que la metodología para descubrir las cuentas ha hecho que seá un análisis muy centrado en cuentas de España y ha dejado de rastrear cuentas de latinoamérica, habrá una segunda entrega donde trataré de solucionar esto.

Este es un análisis, con un trabajo de campo entre el 15 de diciembre de 2024 y el 15 de enero de 2025, he tratado de analizar la comunidad hispanohablante en el fediverso. He analizado los seguidores de 39.431 cuentas. Es probable que cuando leas esto (aunque sea el mismo dia que yo lo publique) ya esté este análisis desactualizado teniendo en cuenta la gran cantidad de usuarios nuevos que llegaron al fediverso a finales de enero de 2025. No descarto publicar una segunda entrega meses después para comprobar que efecto ha tenido la campaña #VamonosJuntas

El análisis ha detectado principalmente cuentas de Mastodon, esto puede venir viciado de inicio con la elección de las cuentas con la que iniciar la exploración.

En el análisis de la red se tiene en cuenta cada cuenta del fediverso y sus relaciones de seguimiento con otras cuentas sin considerar la instancia a la que pertenecen. El algoritmo que calcula la centralidad de cada nodo y la modularidad trata a los nodos como unidades independientes, sin tener en cuenta que se agrupan en instancias.

La centralidad es una medida que indica la importancia que tiene un nodo dentro de una red. Los nodos con mayor centralidad son aquellos que pueden comunicarse con el resto de nodo con menos conexiones/esfuerzo.

La modularidad se calcula con algoritmos que tratan de descubrir subcomunidades dentro de una red.

A partir de la centralidad se calcula el tamaño de los nodos, y a partir de la modularidad se asignan colores, y para generar la imagen de los nodos, concretamente para determinar en qué posición debe estar cada nodo, se utilizan algoritmos que simulan fuerzas donde los nodos se repelen entre ellos mientras que las conexiones entre nodos los atraen. Es este algoritmo el que tiene más coste computacional de todo el proceso.

Todo el fediverso no es público, muchas cuentas no comparten sus seguidores, esto no quiere decir que esas cuentas no aparezcan en este análisis, ya que las cuentas que siguen a estas cuantas si publican su lista de seguidos, pero si que habrá una parte del fediverso que esté oculto a este análisis.

La imagen resultante representa 39.431 nodos del fediverso, donde podemos ver como se agrupan en distintas comunidades.

De todas las cuentas analizadas, la instancia más usada es mastodon.social, con 14.2% y le sigue masto.es con un 7.8%. A mi parecer pese a que mastodon.social es la instancia más usada, con mucha diferencia, no llega a tener una posición de dominio ni parece que pertenecer a otra instancia sea un impedimento para participar en igualdad de condiciones en el fediverso ya que entre las diez cuentas con mayor centralidad encontramos 5 instancias distintas.

InstanciaCuentas
mastodon.social14.197%
masto.es7.796%
mastodon.world6.084%
tkz.one5.115%
paquita.masto.host4.595%
mastodont.cat4.458%
mas.to3.558
mast.lat3.555%
mstdn.social3.396%
masto.nobigtech.es3.206%
mastodon.online2.082%
mastodon.eus1.922%
masto.ai1.836%
mastorol.es1.468%
kolektiva.social1.395%
techhub.social1.352%
mastodon.cloud1.164%
mastodon.gal1.151%
lile.cl1.027%
mastodon.art0.966%
c.im0.931%

Para las comunidades más numerosas la distribución de instancias es parecida, sin instancias que consigan una posición de dominio que haga peligrar la descentralización, y aunque hay comunidades temáticas o lingüísticas donde si que hay una instancia mayoritaria esto no es obstáculo para que participen y sean igual de relevantes cuentas de otras instancias.

Lo que si es bastante mayoritario es el software, prácticamente todas las cuentas se alojan en aplicaciones de Mastodon, las únicas instancias que no son Mastodon son pixelfed.social y meetiko.org, además del bridge de Bsky. Del bridge de Bsky hay unas 200 cuentas, de pixelfed.social unas 100 y de meetiko.org unas 50 aproximadamente, y ninguna cuenta de Castopod. De cara a una segunda entrega de este estudio habría que introducir en el rastreo cuentas semilla de Pixelfed o de Castopod para tratar de forzar a rastrear ese espacio del fediverso. No obstante que prácticamente todas las cuentas sean de Mastodon puede venir viciado de haber comenzado el rastreo a partir de cuentas de Mastodon, por lo que en una posible segunda entrega (será posible sobre todo si hay quien le parece interesante y lo pide), habrá que intentar en el rastreo incluir cuentas iniciales de otras aplicaciones.

El algoritmo ha detectado dos grandes comunidades, la primera y más numerosa, de color azul, con 15.622 nodos, y la segunda de color celeste, con 12.520 nodos.

En la primera comunidad encontramos un 12,2% de cuentas de mastodon.world, un 10% de cuentas de mastodon.social, un 9,7% de cuentas de paquita.masto.host y un 5,8% están en mas.to

En la segunda comunidad las instancias con más de un 5% de usuarios son mastodon.social con un 17.08% y masto.es con un 15.71%

Las cuentas con mayor centralidad se encuentran repartidas entre estas dos comunidades, de las 100 cuentas con mayor centralidad, 40 pertenecen a la primera comunidad, 58 a la segunda, y dos cuentas pertenecen a las siguientes dos comunidades más numerosos.

Repasando los perfiles de cada comunidad es complicado detectar que diferencian a ambas comunidades, pero por sus posición en el mapa y con sus relaciones con otras comunidades parece que la primera son más generalistas, que pueden hablar de temas sociales, políticos, arte, etc. mientras que la segunda comunidad, de color celeste, tiene más relación con la tecnología, gaming, software libre, derechos digitales, etc.

En la tercera comunidad más numerosa, de color naraja, encontramos 6.166 cuentas de una comunidad gamer que alojan en tkz.one el 16.8% de las cuentas, en mast.lat un 14.77%, mastodon.social 14.01%, mstdn.social 6.28% y lile.cl 6.21%. Los nodos de esta comunidad se relacionan mucho con nodos de otras comunidades, por eso en el gráfico aparecen muy distribuidos lo nodos de color naraja.

La cuarta comunidad, de color mostaza, con 3.289 cuentas, está compuesta por usuarios de habla catalana, se puede ver que la mayoría de estos nodos en el gráfico se sitúan entre las 4 y las 5 en punto, según la posición de un reloj. El 45.6% de las cuentas están en mastodont.cat, el 26,9% en mastodon.social y el 6% en kfem.cat.

En la quinta comunidad, de color verde, con 895 cuentas, a las 10 en punto, encontramos la comunidad Euskera en el fediverso. El 76,4% están en la instancia mastodon.eus y el 9,7% en mastodon.social

El resto de comunidades que ha detectado el algoritmo tienen menos de 500 nodos, encontramos comunidades de streamers de color verde claro, situados en las 2-3 en punto, muy alejados del centro.

De color rojo están los nodos que yo llamaría “viejas glorias de intenet”, de foros y movimientos del los 90, muy distribuidos entre las 1 y las 2 en punto.

Como octava comunidad y de color salmón encontramos a las 12 en punto, y alejadas del centro, muchos nodos, la mayoría chicas fans de Taylor Swiff.

El resto de comunidades es difícil encontrarlas en la imagen, pero de color violeta se encuentran cuentas de Furry Fandoms, de color malva hay curiosamente una comunidad alrededor del Sevilla FC, de color marrón hay una comunidad con cuentas en la mayoría del Mastodon para uso académico de SUAyED Psicología (Universidad de México) y las de color rosa son sobre todo cuentas de kolectiva.social, un colectivo anarquista anticolonialista.

La mayoría de nodos que se sitúan en el perímetro del círculo son cuentas que tienen la información de seguidores oculta, por lo que el algoritmo desconoce a quienes siguen pero si quienes los siguen.

Conclusión

La visualización de la red se muestra como los nodos están bastante interconectados, y que existe tanto un centro del grafo, es decir, hay una conversación colectiva, como comunidades y conversaciones periféricas que alojan a comunidades con intereses más específicos.

La red muestra un gran potencial para seguir expandiéndose, tanto en el crecimiento de usuarios como en la incorporación de nuevas comunidades temáticas.

Metodología

Para el análisis uso la librería networkx en python y para el rastreo PHP.

El script PHP genera un fichero csv a partir de un listado de semillas, de todas las cuentas que siguen o son seguidas por las cuentas semillas y las relaciones de seguimiento entre ellas.

El script de python genera el grafo a partir del csv.

Para rastrear las relaciones de seguimiento de los distintos usuarios he rastreado la red estableciendo un límite por servidor de 100 peticiones en una ventana de 5 minutos, para no ocasionar molestias.

El proceso de rastreo comenzó el 15 diciembre de 2024 y este proceso que voy a relatar duró un mes.

Para recopilar cuentas la técnica que utilizo es seleccionar un conjunto de cuentas semilla y analizar todas las cuentas que siguen o son seguidas por estas cuentas. En principio seleccioné 10 cuentas, mientras iba rastreando todos esos usuarios ejecutaba el script de análisis, y con los resultados, añadía las cuentas con mayor centralidad como cuentas semilla, hasta hacer rastreo con 30 cuentas semilla generando un grafo con 39.095 nodos.

Una vez hice este análisis, seleccioné las 100 cuentas con mayor centralidad del grafo, eliminando 2 o 3 cuentas de habla no hispana, y volví a realizar el rastreo con estas 100 cuentas semillas generando un nuevo grafo.

Este grafo contenía 55.027 cuentas, y su análisis me detectó dos comunidades principales, la más numerosa con 34.897 cuentas y una segunda, con 15.596. La segunda comunidad estaba integrada por perfiles de habla inglesa, así que generé un nuevo listado de cuentas excluyendo a esta segunda comunidad, y a partir de esta selección, generé el grafo definitivo con 39.431.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *