jueves, 8 de diciembre de 2016

Software: Link Prediction Tool 1.0

Link Prediction Tool 1.0
Una de las principales novedades de Internet han sido las redes sociales, por lo que es necesario conocer su evolución a lo largo del tiempo. Ese es el objetivo principal de la herramienta desarrollada.

La extensión de predicción de enlaces se basa en Gephi utiliza todas sus ventajas. Gephi es el software de visualización y exploración líder de código abierto para todo tipo de grafos y redes.
En resumen, se desarrolló una extensión de Link Prediction dentro de una herramienta de gestión de grafos que representa redes sociales.


Flujo de actividad




Esta es una imagen de los pasos que el usuario debe seguir para llegar a los resultados de la técnica de predicción de enlaces. En primer lugar, es necesario obtener el archivo gráfico de la red social para analizar. Para ello, existen diferentes herramientas o API para cumplir con el objetivo. Además, puede diseñar manualmente la red que se va a analizar o sólo parte de ella con el gestor de grafos.
Entonces el tipo de grafo cargado debe ser reconocido, por lo que Gephi hace ese trabajo para nosotros.


Tipo de grafos

Para llevar a cabo la técnica de Link Predicción es necesario clasificar el tipo de grafo de acuerdo a diferentes factores.

  • Sellos de tiempo en los enlaces
    • Grafo dinámico
    • Grafo estático
  • Tipo de enlace
    • Grafo dirigido
    • Grafo no dirigido
    • Grafo mixto
  • Para informacion adicional
    • Nodos con atributos adicionales
    • Nodos sin atributos adicionales
Según el tipo de grafo cargado hay variaciones para el algoritmo de Link Prediction.


Elección de métricas

El catálogo de métricas desarrolladas se agregó dentro del panel de estadísticas. Hay más de 15 métricas diferentes para seleccionar, y todos calculan la similitud entre dos usuarios de manera diferente.




Además, es posible cancelar la tarea en tiempo de ejecución y también acceder fácilmente a resultados antiguos. Dependiendo de la métrica elegida, los parámetros correspondientes se deben configurar en la aplicación. Por ejemplo, se incluye una captura de la pantalla de configuración




En los grafos dinámicos, el usuario debe definir el tiempo inicial, llamado T0, para tomar ese momento como base, y luego comparar los enlaces que se generaron dinámicamente con respecto a las predicciones. Por otro lado, en los grafos estáticos, es necesario simular el comportamiento anterior. La técnica oculta enlaces aleatorios del grafo, hace predicciones y luego los compara con enlaces ocultos.

Rango de nodos → Define los usuarios o nodos a considerar dentro de la técnica

Número de predicciones → Número de relaciones futuras que cada usuario debe predecir

Generación y evaluación de predicciones


Los tres pasos fundamentales para llevar a cabo la técnica de predicción de enlaces para cada usuario son:
  1. Los enlaces se predicen de acuerdo con los parámetros configurados.
  2. Aquellos que tienen la mayor similitud como predicciones.
  3. Se verifica que las predicciones realizadas corresponden a los enlaces ocultos.

Visualización de resultados





  • Precisión: # Predicciones correctas / # Predicciones
  • Recordar: # Corregir predicciones / # Enlaces ocultos
  • Roc Curve: compara predicciones correctas con respecto a predicciones incorrectas, ya que los valores de similitud varían
  • Área bajo la curva (AUC)
  • Capacidad para exportar o imprimir resultados.


Funciones adicionales


Clustering

  • Calcular la similitud para cada borde del grafo inicial
  • Ordenar clasificación de similitud decreciente
  • Elimina el porcentaje de enlaces irrelevantes


Métricas en un grafo

  • No calcular predicciones
  • Añadir columna para la métrica seleccionada en la tabla de enlaces
  • Asigna similitud entre cada par de usuarios existentes
  • Posibilidad de exportar estadísticas dentro de la tabla de datos

Combinación de métricas

  • Se intenta mejorar el rendimiento de los predictores individuales
  • Combine esas métricas con el mismo tipo de salida
  • Mantiene la flexibilidad en los parámetros
  • Similitud = Promedio de similitudes individuales

Contribuciones

La herramienta permite la predicción de enlaces a través de una interfaz agradable y simple con un amplio catálogo de métricas. Además, la combinación y el pre-procesamiento (agrupación) logran mejorar la calidad de las predicciones.

Descargar el software

1 comentario: