miércoles, 26 de abril de 2017

ARS se debe adaptar al Big Data

Adaptación del análisis de redes sociales a la era de los grandes datos

Michael Todd | Methodspace

Song Yang


"Las redes sociales", reza un pasaje del nuevo libro, Social Network Analysis: Methods and Examples, "han sido un rasgo definitorio de la sociedad desde los albores de la humanidad: la gente siempre ha interactuado entre sí o ha hecho amigos de enemigos. "Pero el uso generalizado del término" red social "es una criatura de Internet, incluso si el análisis académico de las redes sociales -pensamos en Simmel y Durkheim- es anterior a su llegada a la lengua vernácula. La primera edición del "pequeño libro verde" de SAGE sobre análisis de redes sociales, por ejemplo, surgió en 1982.

Independientemente de sus raíces, el análisis de estas redes sociales -como estas conexiones humanas afectan las percepciones, creencias y comportamientos de individuos, grupos y organizaciones- ha encontrado una amplia aplicabilidad a través de una gama de esfuerzos, tanto en las ciencias sociales como en las no académicas Como la seguridad nacional, las finanzas y la gestión.

Song Yang, el autor principal de ese nuevo libro sobre análisis de redes sociales, aquí responde a algunas preguntas sobre el análisis de redes sociales, sus aplicaciones y cómo enseñar su uso. Yang es profesor de sociología en el Department of Sociology and Criminal Justice de la Universidad de Arkansas. Sus intereses de investigación han incluido durante mucho tiempo un enfoque en el análisis de redes sociales, y en 2007 él y David Knoke co-autor de una segunda edición de ese "pequeño libro verde" - el nombre coloquial para los trabajos cortos en las aplicaciones cuantitativas en las Ciencias Sociales serie - en análisis de redes sociales. Yang, también titular de la profesión de Qianren en la Escuela de Sociología y Ciencias Políticas de la Universidad de Shanghai, respondió a nuestras preguntas durante el período sabático en China.

¿Cuáles son los puntos fuertes del análisis de redes sociales? ¿Cuáles son sus debilidades?

Fortaleza: La gente toma decisiones, encuentra las mejores ofertas, conduce negocios diarios e incluso mantiene la salud mental usando sus contactos de redes sociales. Los modelos tradicionales de las ciencias sociales no explican el contexto de la red social para explicar los comportamientos de las personas, perdiendo un importante marco explicativo. El análisis de redes sociales (ARS) ofrece argumentos convincentes para arrojar luz sobre las opciones y acciones de las personas. El desarrollo del ARS es impulsado por crecimientos explosivos en la metodología, lo cual se debe principalmente a 1) colaboraciones interdisciplinarias, 2) computadoras de gran alcance y baratas, y 3) desarrollos de redes sociales soportados por computadora.

Debilidad: El ARS se utiliza indistintamente de referencias metafóricas al modelado matemático formal. Para el público en general, puede ser confuso, ya que muchos asumen que las redes sociales son los mismos que los contactos de Facebook, mientras que otros lo relacionan con personas con las que cenan. El uso mixto del ARS por los académicos, al tiempo que fortalece el desarrollo académico del ARS, no ayuda a presentar una versión aclarada del ARS al público en general.

Otra cuestión que enfrentan los académicos del ARS es la causalidad de la ambigüedad - ¿uno tiene amigos que fuman primero, luego forman redes con sus amigos fumadores (el comportamiento provoca la formación de redes)? ¿O se tiene una red social de amigos que son fumadores, entonces él / ella se convierte en un fumador (la red causa comportamiento)? En la medida en que la ambigüedad de la causalidad es un problema para la investigación en ciencias sociales en general, es un tema particularmente desafiante al que se enfrentan los especialistas en redes sociales. Yo llamaría esto no sólo desafío, sino también una oportunidad para desarrollar soluciones, mejorando así el marco de ARS.

Las redes sociales, e incluso el estudio académico de ellas, existieron mucho antes del surgimiento de lo que el público podría considerar como redes sociales, es decir, Facebook o Twitter. Pero, ¿cómo afectaron esas entidades al análisis de las redes sociales? ¿Cómo afectan los grandes datos el ARS?

Llamamos a esas redes como Facebook y Twitter 'red social soportada por computadora' (RSSC) o 'red de medios sociales' (RMS). El desarrollo del RSSC / RMS ayudó al ARS, ya que el público en general comenzó a prestar mucha atención al ARS. Sin embargo, tan pronto como miran el SCN, se dan cuenta de que no es lo que esperaban que el ARS fuera. Ciertamente, la situación cambia, ya que muchos académicos del ARS intentan analizar los datos de RSSC o RMS, donde encuentran desafíos de recolección de datos, minería de datos, almacenamiento de datos y análisis de datos. Aquí se necesita un esfuerzo interdisciplinario que involucra a científicos sociales y científicos duros (informática / EE) para facilitar las capacidades de minería de datos y análisis de datos.

Lo mismo puede decirse de los grandes datos, un concepto que comenzó en su mayoría en informática. Su crecimiento se superpone con el ARS, ya que RSSC y RMS genera comúnmente miles de millones de mensajes que conectan a miles de millones de usuarios. Los grandes datos son a la vez un reto y una oportunidad para colaboraciones interdisciplinarias para ahondar en; Pienso que ofrece una trayectoria brillante para que el ARS continúe creciendo y para estar en el centro del paradigma de la ciencia social.


Su nuevo libro con Franziska Keller y Lu Zheng incluye la palabra 'ejemplos' en el título. ¿Podría dar un ejemplo que demuestre la utilidad y el poder del análisis de redes sociales?

Estoy fascinado con el concepto de liderazgo. Por supuesto, ser un líder da un poder autoritario para ordenar a sus subordinados a hacer su trabajo. La lógica subyacente es la amenaza - si el subordinado se niega, puede ser despedido. Pero ¿con qué frecuencia los líderes invocan tal lógica para ejercer el liderazgo? De hecho, cuando los líderes invocan amenazas para asegurarse de que sus mandamientos están siendo obedecidos, el liderazgo se acerca a su fin.

Aquí, el análisis de redes sociales ofrece una explicación alternativa convincente al ejercicio del liderazgo. Por ejemplo, otra forma de influir en las conductas de las personas es a través de las relaciones de consulta, en contraposición a las amenazas autorizadas. Un líder necesita conectarse con los subordinados, no con las relaciones autoritativas (verticales), sino con los lazos de asesoramiento entre pares. Mucha gente respondería muy positivamente cuando percibiera que el líder les está ofreciendo el mejor consejo en sus situaciones, y reaccionarán bastante negativamente cuando piensan que el líder los está comandando con barras autoritativas.

Hay varios libros sobre análisis de redes sociales, incluyendo su propio "pequeño libro verde" sobre el tema desde 2007. ¿Qué ofrece el análisis de redes sociales: métodos y ejemplos que extiende o mejora la beca existente?

El "pequeño libro verde" de nuestro libro del ARS ofrece una breve descripción sucinta sobre el ARS. Llega a los puntos muy rápidamente, pero muchos temas se mencionan sin mucha elaboración. Para los académicos del ARS, nuestro pequeño libro verde de ARS es suficiente para el diseño, la implementación y el análisis de las redes sociales. Sin embargo, para muchos entrantes, es posible que desee ver algo que cubre ARS mucho más completo en cada uno de los temas mencionados. Nuestro libro, Social Network Analysis: Methods and Examples, debería alcanzar un rango más amplio de público en general que el pequeño libro verde.

Además, una característica única de nuestro Social Network Analysis: Methods and Examples de ARS es que ofrece cuatro capítulos sustantivos que ilustran cómo los académicos de diversos campos (administración, justicia penal, salud pública y ciencia política) pueden aplicar con éxito el ARS para extender sus respectivos Análisis. Hasta donde yo sé, este es el primer libro que discute las extensas aplicaciones del ARS en diversas áreas académicas.

En cuanto a la metodología del ARS, ¿hay algo con lo que los estudiantes a menudo luchan? ¿Cómo aborda eso?

Dos cosas que los estudiantes luchan mucho: 1) análisis de datos, y 2) conectar los puntos.

  1. El análisis de datos ha sido un tema difícil para los estudiantes de ciencias sociales en general, y por supuesto el SCN no es una excepción. Mientras que los métodos descriptivos del SCN (densidad, centralidad, etc.) todavía plantean algunos retos a los estudiantes, uno nuevo como el modelado exponencial del gráfico aleatorio (ERGM) requiere la formación avanzada en la estadística y la informática, presentando grandes desafíos a estudiantes y profesores por igual. Parece que la disociación entre el avance de la metodología en la investigación del SCN y la enseñanza en el aula persiste - o incluso se expande - presentando grandes desafíos a las metodologías de enseñanza.
  2. En el segundo punto, muchos de mis estudiantes están aturdidos cuando paso del uso metafórico de la red social al diseño concreto, recopilación y análisis de datos de redes sociales. Luego la clase salta a la aplicación de ARS en diversas áreas de investigación. Aunque en el diseño curricular, éstos son ingredientes integrales del tema del ARS, en la enseñanza en el aula, los estudiantes pueden tener dificultades para ver las conexiones entre esos elementos. Es muy importante que los profesores presenten el "panorama general" a los estudiantes todo el tiempo.


Su propia educación incluye una maestría en ingeniería informática. ¿Cuánta capacidad técnica necesito para participar en análisis de redes sociales? ¿Qué herramientas necesito?

Ciencias de la computación tiene un capítulo sobre "teoría de grafos", que se ocupa de la optimización de la red (en sus campos, las computadoras son nodos, las redes son los vínculos que conectan las computadoras). Sin embargo, la idea básica es algo similar entre los dos campos. En términos de preparación técnica para participar en los estudios del ARS, requiere más aclaración conceptual que la preparación técnica. Sin duda necesita material técnico, pero saber qué hacer en cada paso del proceso ARS es clave para verlo a través. Actualmente, el software que facilita el ARS son UCINET y SIENA, etc., lo que hace cada vez más importante la clarificación conceptual.

Muchas disciplinas y profesionales utilizan análisis de redes sociales, tanto en ciencias sociales como en el gobierno y la industria. ¿Difiere el ARS de la manera en que un sociólogo la usa en comparación con cómo una figura de seguridad nacional (u otro no académico) podría usarla?

No sé mucho acerca de ARS en el gobierno o el uso de la industria. Una diferencia clave entre el académico y el gobierno en el ARS es que mientras los académicos alientan el foro público de intercambios libres de ideas y discusiones abiertas de varios métodos, el gobierno a menudo lleva a cabo operaciones encubiertas usando el ARS. Supongo que es porque tienen diferentes misiones - académicos enfatizan la función educativa, el gobierno quiere su utilidad.

¿Qué predecir para el futuro del ARS?

Datos grandes (Big Data).

Sé que se ha convertido en una palabra de moda que todo el mundo está hablando. Sin embargo, los datos grandes tienen coincidencia significativa con SNA, especialmente en los dominios de RSSC o RMS. Las personas pasan cada vez más tiempo en sus computadoras o teléfonos inteligentes para diversas funciones, las redes sociales son una parte significativa de este uso de la tecnología por parte de la población en general. Es un agujero demasiado grande para ser pasado por alto por los científicos sociales. Pero nuevamente, la minería de datos, el almacenamiento y el análisis presentan un gran desafío y oportunidades para los científicos sociales que trabajarán con científicos de ingeniería de computadoras / electricidad para explorar esta enorme área.

domingo, 23 de abril de 2017

Redes de ingredientes revelan secretos de los sabores

Conectividad
Las redes del sabor revelan el principio universal detrás de recetas acertadas

Cadenas ocultas de sabores entre los ingredientes explican lo que hace que algunos platos sabor mejor que otros, dicen los científicos de alimentos.

MIT Technology Review



En este grafo que representa los 100 ingredientes principales en la red global del sabor, los nodos son ingredientes, los bordes representan sabores compartidos, y los colores del nodo representan los racimos de ingredientes ligados.

Dado el número de ingredientes que los seres humanos comen, el número total de maneras de combinarlos es del orden de 10 a la potencia 15. Y sin embargo, el número real de recetas que comemos es de alrededor de un millón, una pequeña fracción del total. Eso sugiere fuertemente un principio organizador que, en términos de receta, clasifica el trigo de la paja.

Por lo tanto, un desafío continuo para los científicos de alimentos es descubrir las leyes que rigen las combinaciones de sabores y utilizarlas para crear nuevas recetas que aún no han sido experimentadas por las papilas gustativas humanas.

Hoy en día, Tiago Simas en Telefónica Research en Barcelona, ​​España, y unos cuantos amigos dicen haber descubierto un principio importante de combinación de sabores al estudiar alimentos de diferentes culturas. Esta nueva visión podría ayudar a crear nuevas recetas.

El trasfondo del descubrimiento de este grupo es la hipótesis de apareamiento de alimentos desarrollada por los chefs Francois Benzi y Heston Blumenthal. A primera vista, los alimentos como el chocolate y el queso azul pueden parecer tan diferentes como es posible para los alimentos. Y sin embargo, estos alimentos comparten 73 diferentes moléculas de sabor.

Es por eso que en algunos restaurantes de alta gama, a veces encontrará queso azul y chocolate en los mismos platos. El pensamiento es que cuando los ingredientes contienen las mismas moléculas de sabor, pueden ser emparejados con éxito. La idea es que los sabores compartidos ayudan a mezclar los ingredientes más eficazmente. El emparejamiento de los alimentos sugiere inmediatamente una nueva forma de crear nuevas recetas, por lo que rápidamente ganó influencia entre una cierta raza de gastrónomos.

Luego, en 2011, una curiosa investigación reveló que el emparejamiento de alimentos era sólo parte de la explicación detrás de las recetas exitosas. En este trabajo, un equipo de la Universidad de Harvard en Cambridge, Massachusetts, analizó la red de enlaces entre ingredientes en recetas de todo el mundo. En esta red, los ingredientes son nodos en una red, vinculados cuando comparten las moléculas de sabor.

Este enfoque convirtió la hipótesis de apareamiento de alimentos en su cabeza. Cuando las recetas de América del Norte y Europa Occidental son analizadas de esta manera, las redes revelan que el emparejamiento de alimentos es un factor importante. Pero cuando el equipo analizó recetas de Asia oriental (Corea y Japón, por ejemplo), encontraron exactamente lo contrario. Estas cocinas parecen combinar los mismos alimentos que no comparten ingredientes de sabor. Es evidente que la hipótesis de apareamiento de alimentos es sólo parte de un panorama más amplio y en la necesidad de una actualización seria.

Entre Simas y sus colegas. Estos chicos han mirado un poco más difícil en la web de sabores detrás de las recetas y descubrió un principio más profundo en el trabajo. La idea básica es que cuando dos ingredientes no comparten sabores, el equipo busca un tercer ingrediente con sabores en común con cada uno de los primeros pares. De esta manera, fueron capaces de identificar las cadenas de sabor y explorar cómo recetas en diferentes partes del mundo los utilizan.

Por ejemplo, el albaricoque y el whisky no comparten sabores entre sí, pero tienen sabores en común con el tomate. Esto crea una cadena de sabor que une los tres ingredientes, haciéndolos adecuados para ser utilizados en la misma receta.

El equipo llama a este puente de comida. La definen como "la capacidad de conectar un par de ingredientes, que pueden o no tener una conexión directa, a través de un camino de ingredientes no repetitivos".

Esto tiene un impacto importante en las recetas. Mientras que el emparejamiento de los alimentos intensifica el sabor mezclando ingredientes en una receta con compuestos químicos similares, el alimento que puentea suaviza cualquier contraste entre los ingredientes, diga Simas y coautores.

Entonces, ¿qué papel juega la comida en las recetas de diferentes culturas? Para averiguar, Simas y co examinaron las redes de sabor de cocinas de diversas partes del mundo y luego analizaron los respectivos papeles de emparejamiento de alimentos y comida puente en cada cocina.

En América Latina, por ejemplo, las recetas explotan el emparejamiento de alimentos y el establecimiento de puentes alimentarios, mientras que los alimentos de Asia oriental parecen evitar ambos principios. Las cocinas del Sudeste Asiático como el tailandés y el vietnamita parecen depender sólo de la comida que puentea, mientras que los alimentos de América del Norte y Europa occidental usan sólo el emparejamiento de alimentos.

Es un trabajo interesante que extiende los principios detrás de la forma en que creamos recetas. De hecho, revela que el emparejamiento de los alimentos es realmente un caso especial de alimentación puente en la que el número de nodos en la cadena de sabor es 0.

Una mejor comprensión de estos principios debería ayudar a los chefs a crear nuevas recetas en estilos específicos. Pero no es de ninguna manera el ser-todo y el final-todo de la cocina. Recetas de éxito tienen una amplia gama de diferentes parámetros, además de sabor. No es la textura de la comida, su temperatura, su boca se sienten, y su color, por nombrar sólo unos pocos.

Los puentes alimentarios ciertamente pueden ayudar con nuevas recetas. Pero una herramienta verdaderamente universal para la creación de recetas tendrá que ser mucho más amplia para incorporar estos otros factores en su modelo. Eso requerirá un trabajo significativo.

Pero paso a paso, los científicos de los alimentos están aprendiendo cómo los humanos podan la lista de todas las combinaciones posibles de alimentos para producir las combinaciones que realmente terminan comiendo.


Ref: arxiv.org/abs/1704.03330 : Food-Bridging: A New Network Construction To Unveil The Principles Of Cooking


sábado, 22 de abril de 2017

Análisis semántico expone falsedades en informaciones rusas sobre incidentes internacionales

Grandes Datos Expone Grandes Falsedades

El análisis de Semantic Visions revela diferencias intrigantes entre los comentarios rusos y occidentales sobre el derribo de un avión en 2014.

De John Pollock | MIT Technology Review 


Cuando Vladimir Putin tomó el poder "unos segundos antes de 2000", la atención del mundo estaba en otra parte. Introduciéndose a sí mismo con un breve comunicado que rezaba: "La libertad de expresión, la libertad de conciencia, la libertad de los medios de comunicación, la libertad de los derechos de propiedad, estos principios básicos de la sociedad civilizada, estarán bajo la protección segura del Estado". Desde entonces, el Kremlin ha estrechado firmemente su ligadura alrededor de los medios rusos. En 2000, Putin firmó la Doctrina de Seguridad de la Información de Rusia. Actualizado en diciembre pasado, ahora es un tercio de la longitud de su predecesor.

"Los dos tercios que faltan son todas las tareas que Rusia emprendió para evitar la influencia externa", dice Keir Giles, un investigador del Centro de Investigación de Estudios sobre Conflictos en el Reino Unido. "Han tenido un par de décadas para poner esto en marcha, y ha habido Una verdadera aceleración en los últimos cuatro años ". Un análisis original realizado para MIT Technology Review por Semantic Visions, una startup checa que genera" inteligencias complejas de código abierto "evaluaciones de riesgo, confirma la iniciativa del Kremlin.

Utilizando la "base de datos semántica más grande del mundo", Semantic Visions exploró el derribo del MH17 en 2014 junto con otras historias importantes en la guerra de Rusia contra Ucrania (ver "Russian Disinformation Technology"). Ellos compararon 328,614,220 artículos de lengua inglesa y 58,207,194 artículos en ruso, con una longitud promedio de 3.000 caracteres, entre enero de 2014 y abril de 2016. Estos son recogidos de más de 25 millones de fuentes que los analistas de Semantic Visions han descubierto y clasificado, de los cuales analizan Alrededor de medio millón diario. Los resultados iluminan los intereses nacionales y extranjeros de la propaganda del Kremlin, y arrojan una luz poco halagüeña sobre aspectos de la cobertura mediática occidental.



Frantisek Vrabel, CEO de Semantic Visions, explica: "Elegimos los Juegos Olímpicos de Sochi políticamente más neutrales como un" control "para mostrar la proporción normal de artículos de idioma ruso (rojo) a inglés (azul) para un evento internacional. El interés ruso en Crimea es sostenido, contrastando con el interés de los medios occidentales. La invasión en el este de Ucrania sigue un patrón similar.




Sin embargo, los datos para el derribo de MH17 son inusuales. "La historia rusa inicial fue que MH17 fue derribado por un caza a reacción de Ucrania, por lo que pensaría que lo usarían para apoyar su versión", dice Vrabel. Pero sabían que habían hecho algo mal. Es casi como si estuvieran intentando minimizarlo ".



Semantic Visions realizó un análisis más detallado hora por hora, trazando la cobertura en las 90 horas siguientes a la tragedia. La diferencia se vuelve aún más marcada en comparación con el vuelo 9268 de Metrojet, que explotó el 31 de octubre de 2015, sobre la Península del Sinaí, con la pérdida de 219 rusos, cuatro ucranianos y un bielorruso. (Aunque la explosión todavía está bajo investigación, tanto Rusia como Egipto sospechan una bomba, reclamada por ISIS).




Aquí los datos en ruso durante las 90 horas siguientes siguen de cerca los resultados globales en inglés, a pesar de que el interés doméstico representa una proporción mayor que en el "control" de Sochi.

Un mes después del derribo del MH17, Rusia llevó a cabo una exitosa operación de información dirigida a los medios occidentales. Afirmando que estaban manejando un convoy humanitario, atrajeron la atención global con cientos de camiones que pretendían ofrecer "asistencia humanitaria". (El Instituto de Análisis de Propaganda llamó a ese "sentirse bien" el lenguaje "generalidades brillantes".) Que los rusos no permitieran Reporteros para ver dentro de la mayoría de los camiones, y que estaban acompañados por helicópteros de ataque, era menos importante que la proximidad de las palabras "ruso", "ayuda" y "humanitaria" en los titulares. Esta charada "no estaba destinada al público ruso, sino a una audiencia global en su guerra informativa", dice Vrabel.



Los datos grandes también tienen otros usos. En enero de 2016, una investigación británica nombró a varios autores del envenenamiento por polonio 210 de Alexander Litvinenko. Los investigadores dijeron que Putin probablemente había aprobado este acto de lo que los servicios de seguridad rusos llaman "wet business" (mokorye delo). Visiones semánticas también rastrearon esta historia, analizando quién la cubrió o la compartió. Vrabel dice que la base de datos resultante de las fuentes les permite identificar "quién está infectado con la propaganda rusa".

viernes, 21 de abril de 2017

Nuevo algoritmo para atacar redes (criminales) basado en abejas


Los científicos desarrollan un nuevo algoritmo inspirado en colonias de abejas para ayudar a desmantelar redes sociales criminales
Phys.org



 Los científicos desarrollan un nuevo algoritmo inspirado en colonias de abejas para ayudar a desmantelar redes sociales criminales

Investigadores de la Universidad de Granada (UGR) han diseñado un algoritmo, inspirado en el comportamiento inteligente y social de las colonias de abejas, que permite a las fuerzas del orden atacar y desmantelar cualquier tipo de red social que suponga una amenaza, ya sean redes sociales físicas o virtuales vinculadas al crimen organizado y al terrorismo yihadista.

Las posibles aplicaciones de este nuevo algoritmo bio-inspirado, que ayuda a tomar decisiones óptimas para desmantelar cualquier tipo de red social, son muchas y variadas: desde desmantelar una red criminal hasta facilitar el diseño de estrategias de vacunación capaces de contener la difusión de una pandemia.
La herramienta diseñada por los investigadores de la UGR detecta e identifica automáticamente a los actores o nodos más peligrosos dentro de una determinada red social y la densidad de las relaciones interconectadas entre ellos, lo que puede ayudar a las autoridades a tomar sus decisiones y actuar de la manera más eficiente posible.
Según lo explicado por uno de los autores de este artículo, Manuel Lozano Márquez, del Departamento de Informática e Inteligencia Artificial de la UGR, "las abejas forman sociedades bastante bien organizadas, en las que cada miembro tiene un papel específico. : Las abejas exploradoras que buscan fuentes de alimento, las abejas obreras que recolectan alimentos y las abejas supervisoras que esperan en la colonia ".
El intercambio de datos y los procesos de comunicación se establecen entre esas tres funciones, lo que hace que el rendimiento general de la colonia sea muy rentable. Los científicos de la UGR han simulado este comportamiento utilizando abejas in silico con el fin de encontrar estrategias efectivas y eficientes para desmantelar redes. Los resultados de los experimentos indican que la técnica propuesta mejora significativamente, desde un punto de vista estadístico, la estrategia clásica utilizada para atacar y desmantelar las redes sociales.

Redes sociales

Muchos sistemas complejos de interacción relacionados con la naturaleza y relacionados con la humanidad están estructurados en una red compleja, es decir, están formados por una serie de actores interrelacionados. Las redes sociales son un ejemplo muy reciente de esto. Algunas redes son perniciosas debido a su potencial para causar daño a las personas, las infraestructuras críticas y los intereses económicos.
El método clásico (y también el más natural e intuitivo) para desmantelar una red es identificar a sus principales actores y actuar sobre ellos. Sin embargo, esta estrategia no garantiza que la red resultante esté totalmente desprovista de poder organizativo y reconstructivo, y puede seguir causando daño.

"Para encontrar la forma más efectiva de desmantelar una red es necesario desarrollar y poner en marcha un proceso de optimización que analiza una multitud de situaciones y selecciona la mejor opción en el menor tiempo posible Es similar a lo que un programa de ajedrez Lo hace al identificar, predecir y comprobar los posibles pasos o caminos que pueden ocurrir en un juego de ajedrez a partir de un momento dado y el movimiento ", dice Humberto Trujillo Mendoza del Departamento de Metodología de las Ciencias del Comportamiento de la UGR y uno de los autores de la papel.

Como explican los autores, "la sutileza con que grupos o colonias de seres vivos relativamente simples (hormigas, termitas, abejas, etc.) son capaces de resolver problemas vitales para sobrevivir es una prueba de la eficacia de la evolución". A través de ciertas interrelaciones entre los miembros de una colonia, surge un comportamiento colectivo de esa colonia, que les permite reaccionar de manera eficiente a situaciones ambientales problemáticas. Esa tarea, aplicada por la UGR al campo de la inteligencia artificial, sería imposible de realizar por los miembros individuales de la colonia.

En la actualidad, este grupo de investigación está trabajando en el desarrollo de otros algoritmos similares a los descritos. Esta vez lo están haciendo para determinar los nodos de la red social a los que deben conectarse ciertos "infiltrados" para aumentar la cantidad y calidad de la información recopilada para mejorar el conocimiento de las relaciones entre los otros actores, optimizando así al desmantelamiento de la red.


La literatura sobre los ataques de red

La mayor parte de la investigación sobre los ataques de red se basa en la idea de nodos críticos, lo que permite caracterizar la vulnerabilidad y robustez de una determinada red con respecto a la remoción de nodos, causada por vallas adversarias, fallas aleatorias o desastres naturales. Esta clase de problemas, CNP, ha sido ampliamente estudiada en la última década (Walteros y Pardalos, 2012), y diferentes casos han sido analizados según los intereses particulares.
Arulselvan et al. (2009) y Pullan (2015) se centraron en la minimización del número total de pares de vértices conectados. Shen et al. (2012) con el objetivo de maximizar el número de componentes conectados y minimizar el tamaño del más grande. Ortiz-Arroyo (2010) trabajó en la maximización de la entropía de información gráfica. Veremyev et al. (2015) analizaron la minimización de una medida de conectividad basada en la distancia, como la eficiencia gráfica, el índice de Harary, la longitud de la trayectoria característica y la cercanía residual. Gunasekara et al. (2015) también abordaron casos CNP multiobjetivos que enfatizaron la maximización de la centralidad del vector propio medio y la distancia entre nodos críticos.
Sin embargo, la mayor parte de la atención en la literatura CNP se ha centrado en el caso particular definido por Arulselvan et al. (2009), donde el ataque óptimo fragmenta al máximo la red y simultáneamente minimiza la varianza entre el número de vértices en los componentes conectados resultantes. Es decir, la red residual contiene un conjunto relativamente grande de componentes conectados, cada uno con un número similar de vértices (Ventresca y Aleman, 2015a). Esta instancia CNP se referenciará como CNP-A. Arulsel van et al. (2009) presentó un modelo de programación lineal entera (ILP) y un enfoque heurístico basado en un algoritmo codicioso acoplado con una fase de búsqueda local para el CNP-A. Posteriormente, la naturaleza NP-completa de este problema (Arulselvan et al., 2009) promovió la aplicación de metaheurísticas para obtener soluciones casi óptimas dentro de tiempos computacionales razonables: Ventresca (2012) propuso un modelo de aprendizaje incremental basado en población y un apareamiento simulado, Pullan (2015) diseñó un algoritmo codicioso de varios arranques, y Aringhieri et al. (2015) presentó un enfoque de búsqueda de vecindario variable.
Los ataques basados ​​en la centralidad (Crucitti et al., 2004, Iyer et al., 2013) son otra alternativa para abordar CNPs, que apuntan a los vértices a ser removidos de acuerdo a una medida de centralidad dada y una de las siguientes estrategias:

  • En ataques simultáneos dirigidos, la medida de centralidad se calcula para todos los vértices de la red, y los k con los valores más altos se eliminan a la vez.
  • En los ataques segmentados secuenciales, sólo el vértice con la medida de centralidad más alta se elimina a la vez y el proceso se repite k veces. Dado que cada remoción probablemente modifica los valores de centralidad de los vértices restantes, la métrica se calcula una vez para el gráfico inicial y de nuevo después de cada eliminación para los vértices restantes.

Iyer et al. (2013) investigaron el efecto de los ataques basados ​​en la centralidad con diferentes esquemas de remoción y medidas de centralidad, como el grado, BC, la cercanía y el autovector en una amplia gama de redes.
Encontraron que la eliminación secuencial del vértice con BC más alto era el método más efectivo para degradar la estructura de la red. Esta conclusión también fue apoyada por Ventresca y Aleman (2015b), quienes analizaron los efectos de acuerdo a seis métricas de centralidad.


Referencias


  • Aringhieri, R., Grosso, A., Hosteins, P., Scatamacchia, R., 2015. VNS solutions for the critical node problem. Electronic Notes in Discrete Mathematics 47, 37–44.
  • Arulselvan, A., Commander, C. W., Elefteriadou, L., Pardalos, P. M., 2009. Detecting critical nodes in sparse graphs. Computers & Operations Research 36 (7), 2193–2200.
  • Crucitti, P., Latora, V., Marchiori, M., Rapisarda, A., 2004. Error and attack tolerance of complex networks. Physica A: Statistical Mechanics and its Applications 340 (1), 388–394
  • Iyer, S., Timothy, K., Bala, S., Zhen, W., 04 2013. Attack robustness and centrality of complex networks. PLoS ONE 8 (4), e59613.
  • Ortiz-Arroyo, D., 2010. Computational Social Network Analysis: Trends, Tools and Research Advances. Springer London, London, Ch. Discovering sets of key players in social networks, pp. 27–47.
  • Pullan, W., 2015. Heuristic identification of critical nodes in sparse real-world graphs. Journal of Heuristics 21 (5), 577–598.
  • Shen, S., Smith, J. C., Goli, R., 2012. Exact interdiction models and algorithms for disconnecting networks via node deletions. Discrete Optimization 9 (3), 172–188.
  • Ventresca, M., Aleman, D., 2014. A derandomized approximation algorithm for the critical node detection problem. Computers & Operations Research 43, 261–270.
  • Veremyev, A., Prokopyev, O. A., Pasiliao, E. L., 2015. Critical nodes for distance-based connectivity and related problems in graphs. Networks 66 (3), 170–195.
  • Walteros, J. L., Pardalos, P. M., 2012. Applications of Mathematics and Informatics in Military Science. Springer New York, New York, NY, Ch. Selected topics in critical element detection, pp. 9–26.



Más información: Manuel Lozano et al. Optimizing network attacks by artificial bee colony, Information Sciences (2017). DOI: 10.1016/j.ins.2016.10.014


martes, 18 de abril de 2017

Un contacto que no se debe cortar de Facebook: Un cliente satisfecho

Esta es una persona a la que nunca debe cortar la amistad en Facebook ...
La fea verdad sobre unfriending antes de comenzar un nuevo año: También puede ser muy divertido
Quentin Fottrel | Market Watch



Estimado Dinerologista,

Soy un recién establecido, único-profesional de las relaciones públicas que acaba de ganar su primer cliente, y este es un contrato bastante grande. La persona que me contrató es un amigo de Facebook. ¿Debo "contar el contacto" con ella en Facebook ahora que estamos en una relación profesional? ¿Establecer una relación de LinkedIn tiene más sentido ahora?

Cortar la amistad en Facebook es un negocio cobarde. Para aquellos en el extremo receptor, es como las cinco etapas de la pena: Choque, disgusto, cólera y un breve período de ciberacoso antes de la aceptación. La fea verdad acerca del cortar el contacto es que - siempre y cuando usted no es el que está sin amigos y le ha dado cuidado antes de golpear el botón "Eliminar de mis amigos" - también es muy divertido. Es muy poderoso para librarse de alguien de su vida para siempre o liberarse de ver sus fotos de vacaciones, o escucharlos en su rabieta fanática durante la temporada política.

El hacha de "Eliminar de mis amigos" de Facebook cae en algunas cabezas más que en otras, según dos estudios publicados en 2014 por investigadores de la Universidad de Colorado. Amigos de la escuela secundaria, "otro" - estoy asumiendo que podría ser un conocido con pasado romántico - amigo de un amigo, amigo del trabajo. En un giro irónico, ambos estudios utilizaron más de 1.000 personas encontradas en Twitter. Las personas son vencidas más a menudo por publicar comentarios polarizantes sobre la religión o la política o por puestos poco interesantes.

Cortar la amistad en Facebook es un negocio cobarde. Para aquellos en el extremo receptor, es como las cinco etapas de la pena: shock, disgusto, cólera y un breve período de ciberacoso antes de la aceptación.
El Moneyologist
Tengo algunos loquitos de las mascotas cuando se trata de Facebook. Y, si somos honestos (y siempre debemos ser honestos) probablemente molestamos a otros de vez en cuando. Pero mi persona menos favorita es aquella cuyas notificaciones hacen que su sangre se enfríe. Con esta persona, sólo sabes que va a ser algo increíblemente inapropiado, pasivo-agresivo o simple. Trato de alejarme de decir cosas negativas en Facebook y esperar que otros hagan lo mismo. (Los estudios sugieren que las personas solitarias comparten de más en Facebook, un recordatorio de que tal vez deberíamos acercarnos a ellos en vez de esconder sus mensajes).

Hay otros tipos molestos de Facebook: El fabuloso lifer que se inspira en Martha Stewart, el vaguebooker ("estoy devastado"), el uber-tagger (hey, tal vez no quiero una foto de mi diente astillado por toda la Internet), la Debbie Downer que no se da cuenta de que él o ella es el denominador común durante todas esas historias de suerte. Y no olvidemos el implacable liker: Un estudio de 2012 de la California State University evaluó a 800 miembros activos de Facebook y encontró que los que más a menudo ponían "Me Gusta" los mensajes de otras personas muestran síntomas de "manía" y "compulsividad".

Lo último que quieres hacer es ofender a un nuevo cliente eliminándolos de tu lista de amigos de Facebook, pero Facebook te permite usar diferentes sombreros para diferentes amigos. Usted puede restringir la gente de ver cualquier cosa menos sus publicaciones públicas y puede crear grupos para otros - amigos cercanos, conocidos, contactos profesionales. Hay muchas opciones para evitar herir los sentimientos de alguien. Desamparar a alguien en Facebook es realmente un último recurso, y mejor reservado para aquellos con quienes comparten lazos sociales débiles. Con este cliente, tus lazos se fortalecieron.

Así que no lo hagas. De hecho, esta es la única persona que no debe cortar la amistad en Facebook. (La otra persona es tu madre.) La gente da contratos a los que les gusta y confía y esta es una oportunidad para que ustedes puedan unir sus lazos. LinkedIn puede ser muy seco con la gente publicar artículos sobre cosas como las cinco estrategias de marketing más eficaces, pero los Facebookers puede obtener en su patio de juegos. Evite ambos. Este es un lugar donde usted puede potencialmente brillar y, por lo menos, saber que esta persona es un amigo de Facebook podría hacer que usted piense cuidadosamente antes de publicar.

viernes, 14 de abril de 2017

La importancia de los grafos de bases de datos en Big Data

Por qué los grafos de bases de datos son tan eficaces en el análisis de Big Data 
Cleverism

Vivimos en una era de datos. La información está en todas partes y se puede acceder de diferentes maneras. La información también se recoge en grandes cantidades. No se puede hacer mucho en el mundo moderno sin que se anote y se almacene en una base de datos.

El gran análisis de datos y las grafos de bases de datos son palabras de moda que más probablemente haya encontrado. Es probable que le hayan dicho que comience a usar grafos de bases de datos en su gran analítica de datos para aumentar su eficiencia organizativa.



Por qué los grafos de bases de datos son tan eficaces en Big Data Analytics
Wikimedia Commons I Hoshi Ludwig (CC BY-SA 4.0)

¿Pero por qué? Veamos los conceptos y las razones por las que los grafos de bases de datos son tan eficaces en grandes datos.

¿Qué son los grandes datos?

A menos que usted haya estado viviendo bajo una roca, usted debe haber oído el término "Big Data" arrojado alrededor. De hecho, es probable que haya escuchado que se menciona en tantos contextos diferentes, descritos de diferentes maneras en que podría ser difícil saber y entender lo que realmente significa el término y cuál es su significado.

Por lo tanto, voy a tratar de explicar el término de forma concisa y le dejo en las razones definitivas que importa.

La definición de grandes datos

Si busca la definición de grandes datos en Google, recibirá más de 10 millones de resultados. La definición del diccionario establece grandes datos como:

"Conjuntos de datos extremadamente grandes que pueden ser analizados computacionalmente para revelar patrones, tendencias y asociaciones, especialmente relacionadas con el comportamiento humano y las interacciones".

Muchas palabras de lujo, ¿verdad? La definición podría no abrir la idea y el propósito detrás del concepto. Podrías afirmar lo anterior de manera un poco más simplista y describir los grandes datos como una gran colección de datos, recopilados de fuentes tradicionales y digitales. Los datos pueden ser recogidos dentro de una organización específica y sus diferentes canales o fuera de la organización. Además, los datos grandes no sólo se recogen sino que se usan para descubrir cosas nuevas y para analizar patrones y procesos existentes.

El punto clave para entender con grandes datos es que los conjuntos de datos recogidos son enormes - no se trata de unos pocos números de teléfono aquí, sino grandes cantidades de diferentes tipos de datos. Además, los datos suelen estar en formato digital, aunque no se deben excluir los conjuntos de datos tradicionales. Los registros financieros, por ejemplo, también forman parte de grandes datos. Además, los grandes datos siempre mezclan datos multi-estructurados y no estructurados. Qué significa eso? Los datos grandes pueden utilizar:

  • Datos no estructurados, que son información que no puede ser fácilmente organizada o interpretada por bases de datos y modelos tradicionales.
  • Datos multi-estructurados, que son diferentes tipos y formatos de datos, derivados de las interacciones entre personas y máquinas.
    Entonces, ¿qué es lo que se ve en la realidad? Un ejemplo de grandes datos sería cómo Wal-Mart recogió datos de sus clientes y el clima. Al combinar estos diferentes conjuntos de datos y puntos de información, la empresa notó que a medida que las tormentas se dirigen hacia la ubicación, los clientes compran más linternas (comprensibles!) Y Pop-Tarts (interesante y algo sorprendente).

Para una rápida recapitulación de lo anterior y una visión del mundo de los grandes datos, debe ver el corto clip a continuación:



¿Por qué los datos importantes importan?

Pero, ¿qué significa lo anterior para una organización? ¿Por qué importa si recopilas y usas datos grandes? Bueno, el ejemplo de Wal-Mart muestra las dos razones principales para utilizar datos grandes:

Revela la información oculta - Usted no necesita saber los patrones del tiempo y el consumo del cliente de ciertas mercancías van de común acuerdo o tiene un acoplamiento. Los datos grandes ayudan a revelar esta información y por lo tanto, usted no necesita saber lo que usted está buscando para encontrar una conexión. Wal-Mart no sabía que está buscando para encontrar un alimento específico aumentar sus ventas antes de una tormenta, pero fue capaz de encontrar esta conexión interesante debido a la gran analítica de datos.
Extrae valor - La información que obtiene ayuda a comprender mejor las conexiones entre acciones y comportamientos. Esto a su vez, le ayudará a aumentar la extracción de valor, ya sea ayudándole a hacer o ahorrar más dinero, o mejorar la eficiencia. En el ejemplo de Wal-Mart, la compañía podría usar la información para promover Pop-Tarts cuando las tormentas se dirigen adentro o hacen las linternas más accesibles fácilmente.

¿Qué son los grafos de bases de datos?

Pero ¿qué pasa con el otro concepto que estamos conectando con el análisis de datos grandes? Con el fin de comprender los beneficios de utilizar grafos de bases de datos en relación con grandes datos, es necesario comprender el significado y la importancia de ellos.

La definición de un grafo de base de datos 

Las definiciones de un grafo de base de datos también vienen en complejidades diferentes. La definición informática del concepto dice que un grafo de base de datos es:

"Una base de datos que utiliza estructuras de grafos para consultas semánticas con nodos, aristas y propiedades para representar y almacenamiento de datos".

Si usted no es un experto en informática o se utiliza para la jerga de la tecnología, lo anterior probablemente fue muy por encima de su cabeza. No se preocupe, hay una manera más práctica de ver el concepto. Un grafo es una ilustración de la información y una base de datos es, naturalmente, un conjunto de información agrupada. Los grafos de bases de datos tienen dos elementos de definición:
  • Un nodo, que representa una entidad. Esto puede ser una persona, un lugar, una cosa y así sucesivamente.
  • Una relación, que es la conexión entre dos nodos separados.
Esencialmente, los grafos de bases de datos son conjuntos de datos que se centran en las conexiones entre diferentes partes de la información y representan estas conexiones de una manera simple y gráfica.

Se puede pensar en ello a través de un ejemplo, como Twitter, que es en sí mismo un enorme grafo de base de datos. Los usuarios serían los nodos y las conexiones o relaciones que los diferentes nodos tienen pueden ser variables y que se representan con 'sigue'. La conexión entre dos usuarios (nodos) podría ser la del nodo 1 después del nodo 2, con el nodo 2 no siguiendo el nodo 1. Tanto el nodo 1 como el 2 también podrían estar siguiendo uno al otro y así sucesivamente. Todos los diferentes usuarios (nodos) y las relaciones que tienen con otros nodos pueden representarse en un enorme grafo de base de datos.



¿Por qué son importantes los grafos de bases de datos?

Pero, ¿por qué un grafo de base de datos facilita el análisis y la comprensión de la información? ¿Cuál es el propósito de representar a los usuarios de Twitter y sus relaciones con un grafo de base de datos? Una organización puede beneficiarse del uso de grafos de bases de datos de tres maneras diferentes, con la base de datos ayudando a:
  • Aumentan el rendimiento - Cada organización tendrá datos y los conjuntos de datos siempre seguirán creciendo. El crecimiento de estos conjuntos de datos también conducirá al crecimiento en las conexiones que tienen los conjuntos de datos. Los grafos de bases de datos están específicamente diseñadas para entender las relaciones entre diferentes partes de datos, lo que significa que el crecimiento de las relaciones no dificultará el rendimiento.
  • Proporcionan flexibilidad: el uso de grafos de bases de datos también es flexible, ya que la base de datos puede cambiar a la misma velocidad que la de su organización. La estructura del modelo se adapta a todo tipo de necesidades y requerimientos.
  • Mejoran la agilidad - Los grafos de base de datos también admite agilidad, que es crucial en un entorno de desarrollo basado en pruebas. A medida que cambian los requisitos de su empresa, la base de datos puede cambiar con ella.

El mundo interconectado de hoy significa que diferentes piezas de información están conectadas entre sí en una serie de formas únicas. El uso de los grafos de bases de datos significa que no sólo entienden la importancia de la información y los datos, sino las relaciones entre ellos.

La comprensión adquirida de las relaciones puede impulsar a su organización en términos de eficiencia y creación de valor - tal como vimos con grandes datos. La información por excelencia conduce a un mejor servicio y un mayor valor, tanto para usted como para el cliente.

¿Por que los grafos de bases de datos funcionan en el análisis de Big Data?

Entonces, ¿qué obtienes cuando implementas grafos de bases de datos en análisis de datos grandes? Una herramienta eficaz y poderosa para crear conexiones y utilizar sus datos. Pero, ¿por qué?

Como se mencionó en la primera sección, los datos grandes generalmente se basan en el lenguaje de consulta estructurada (SQL) para comunicarse con una base de datos. Es el lenguaje de la gestión de bases de datos relacionales, que son bases de datos que se construyen alrededor de tablas y colecciones de filas de atributos.

La comunicación entre las diferentes tablas y filas puede ser lenta y difícil cuando se ponen en cuestión conjuntos de datos enormes e irregulares. Esencialmente, a medida que los datos continúan creciendo y evolucionando, el modelo tradicional de SQL puede llegar a ser insuficiente para comprender las relaciones entre estos diferentes conjuntos de datos.

¿Cómo se resuelven estos problemas? Bueno, los grafos de bases de datos son una parte de la solución. Pertenecen a un movimiento denominado No Only SQL o NoSQL. En lugar de estructurar los datos en el modelo tradicional de tablas y filas, NoSQL permite que el diseño de la base de datos se construya en torno a los requisitos a la mano. Esto puede significar que los datos están estructurados y definidos por:

  • Almacenes de valores clave
  • Documentos
  • Grafos de bases de datos 

El modelo de grafo de base de datos se centra en las relaciones de los diferentes nodos, o puntos de datos. Por lo tanto, en lugar de mirar el valor del punto de datos (que es lo que la base de datos SQL haría), el grafo de base de datos está organizando y analizando los puntos de datos desordenados de acuerdo a las relaciones. El grafo de base de datos agrega otra capa de estructuración y análisis de los datos, aumentando la eficacia de su gran análisis de datos. Simplemente abre más puertas para su organización.

Pero, ¿cuál es la importancia de la relación de nodos en los grandes datos? ¿Por qué es tan eficaz en la adición de la forma de analizar los datos. En pocas palabras, la respuesta es que puede aclarar los datos interconectados con mayor claridad. En lugar de simplemente entender cuál es el valor de los datos específicos, se entiende el valor de la relación entre los datos. Si piensa en el ejemplo de los hallazgos de Wal-Mart, el grafo de base de datos ayudaría a notar la relación entre la tormenta, las decisiones de compra y los clientes que compraron linternas y Pop-Tarts.

Una organización no sólo se basa en los datos cuando se trata de la toma de decisiones. Si desea aumentar las ventas en su librería, no sólo necesita datos sobre los libros que se están vendiendo con el fin de aumentar las ventas. Es necesario comprender cómo los clientes se conectan a los libros, por ejemplo, qué libros tienden a ser comprados por la misma persona y qué tienen en común los compradores de un libro específico. Si descubre estas relaciones, puede aumentar las ventas mucho más fácil. Tal vez encuentres una conexión donde la gente que lee J.K. Rowling también tiende a comprar libros de Terry Pratchett y puede utilizar la información en la comercialización o el posicionamiento de los libros. Por lo tanto, mejorar la forma de interpretar y utilizar los datos. No sólo se centran en el valor específico, pero el valor de la relación. Para cualquier organización, las relaciones entre los puntos de datos son importantes y seguirán creciendo en importancia.

Otro ejemplo de lo anterior podría ser entender por qué el transporte de libros desde el almacén lleva mucho tiempo. Con la ayuda de un grafo de base de datos, puede encontrar la relación entre el almacén, minorista, empresa de entrega y el cliente y encontrar qué conexiones tomar más tiempo o si podría obtener el producto más rápido mediante diferentes relaciones, es decir, los procesos de entrega. Puede solucionar los problemas de su empresa de diferentes maneras, ya que son capaces de ver los datos de una manera diferente al modelo tradicional y encontrar conexiones que no puede realizar con el modelo de SQL. Usted termina creando más valor para la organización y el cliente. Resuelve un problema que puede impedir que un cliente haga compras con usted de nuevo y cree un servicio más eficiente que podría aumentar el valor que puede obtener de los servicios que proporciona.

Además, el modelo de base de datos NoSQL puede ser mucho más eficiente en términos de encontrar estas conexiones de datos. Una base de datos SQL comenzaría su búsqueda comprobando puntos de datos individuales y comparándolos con otro uno por uno. Considere que tiene el punto de datos A y desea encontrar quién está conectado a él. Si utiliza sistemas de base de datos tradicionales, el A se verificará individualmente con B, C, D, E, etc. Por otro lado, con el grafo de base de datos, las conexiones entre A y los diferentes puntos de datos se crearían mucho más rápidamente. Las relaciones se capturan por sí solas y las propiedades de los puntos de datos se comprueban directamente. Esto reduce el tiempo de procesamiento y asegura que pueda acceder a la información más rápidamente. Todo esto asegura una mayor eficiencia. Ryan Boyd, director de relaciones con desarrolladores de Norteamérica para Neo4J, dio un ejemplo de la técnica y el modelo de procesamiento en una entrevista TechRepublic. Boyd dijo,

"Con un grafo de base de datos, encontrará un punto de partida lógico y se ramificará desde allí e identificará las relaciones. Por ejemplo, puede escribir una pregunta que le pregunte, 'Encuentra a todos los amigos de los amigos de John'. En lugar de tener que JOIN muchos índices diferentes, el grafo de base de datos utiliza aritmética de puntero que está en memoria o en caché y realiza la operación. "

Un ejemplo del uso efectivo de los grafos de base de datos en el análisis de grandes datos a la luz de lo anterior es eBay y cómo proporciona un servicio rápido y eficiente a sus clientes. La plataforma de compras utiliza grafos de base de datos para conectar a los compradores con los vendedores locales, creando conexiones localizadas de entrega puerta a puerta. La compañía ha observado cómo las consultas impulsadas por un grafo de base de datos toman 1 / 50th de un segundo para resolver, mientras que las consultas de base de datos tradicionales tomó alrededor de 15 minutos. El ejemplo destaca el poder de crear eficiencia en términos de ahorro de tiempo y recursos de la organización y proporcionar un mejor valor para los clientes.

Uso de grafos de bases de datos

Los grafos de base de datos ofrecen muchas oportunidades para las organizaciones. Los beneficios discutidos anteriormente ya han sido señalados por una serie de industrias, incluyendo:

  • Servicios financieros - Ejemplos de usos incluyen monitorear y prevenir el fraude interno y externo y sus riesgos.
  • Venta al por menor - se puede utilizar para entender las decisiones de compra y para proporcionar recomendaciones a los clientes sobre la base de cómo los diferentes productos se vinculan entre sí.
  • Logística - un ejemplo en la industria sería el uso del grafo de base de datos para la planificación de rutas.
  • Redes y TI - identificación y comprensión del análisis de la causa raíz.

Al comenzar a implementar los grafos de base de datos en su organización, debe tener en cuenta algunas cosas. En primer lugar, hay dos propiedades clave que utilizan las tecnologías de grafos de base de datos:

  • Almacenamiento de grafos: algunas opciones de almacenamiento están diseñadas específicamente para almacenar y administrar grafos, mientras que otras utilizan bases de datos relacionales u orientadas a objetos. Las últimas opciones tienden a ser más lentas.
  • Motor de procesamiento de grafos: el procesamiento nativo o grafo es la forma más eficiente de procesar datos dentro de un grafo. Los motores de procesamiento no nativos tienden a utilizar otros medios de procesamiento, como "crear", "leer" o "borrar".

Encontrar la tecnología adecuada para usar dependerá de sus necesidades y requerimientos específicos. Hay bastantes diferentes tecnologías de grafo de base de datos disponibles, siendo el grafo de base de datos más utilizada Neo4J. El sistema de código abierto es un grafo de base de datos nativa, tanto en términos de almacenamiento como de procesamiento. La base de datos comenzó en desarrollo en 2003, convirtiéndose en sistema disponible públicamente en 2007.

El grafo de base de datos es utilizada por varias organizaciones y empresas de todo el mundo, que representan un gran número de industrias. El sistema se utiliza en la investigación científica, gestión de proyectos y matchmaking. Sus usuarios incluyen organizaciones establecidas como Wal-Mart y Lufthansa, así como start-ups como FiftyThree y CrunchBase.

miércoles, 12 de abril de 2017

Siete razones por las que los lazos de amistad se pueden romper

Un psicólogo identifica 7 signos que señalan que es hora de dejar ir una amistad
Ellen Hendriksen | Business Insider




A pesar de lo que las Spice Girls nos quieren hacer creer, no es cierto que la amistad nunca termina.

La investigación realmente confirma lo que todos hemos experimentado: la mayoría de las amistades de la escuela media ni siquiera duran un año. Y mientras algunas amistades de adultos duran toda la vida, algunas nos hacen sentir como si hubiéramos sido sentenciados de por vida. Entonces, ¿cómo saber cuándo hacer una pausa para la libertad?

A veces es obvio: un amigo llamado roba su dinero o su pareja, o en el caso de Taylor Swift, sus bailarines de respaldo. Ahora tenemos mala sangre, de hecho.

Pero a veces no es obvio: ¿lo dura con un amigo luchando con la adicción? ¿Puede usted permanecer amigos con alguien cuyos valores experimentan un cambio radical? ¿Dejas atrás a un amigo aburrido o te recuerdas que la verdadera amistad no se trata de entretenimiento? Y, por supuesto, ¿qué hacer cuando una amistad comienza fuerte y sólo fizzles? No pasó nada, pero ya no hay nada allí. ¿Está bien dejar ir?

Fundamentalmente, usted no necesita una lista de verificación de razones legítimas y no legítimas para terminar una amistad. Vaya con su tripa y su corazón. Dicho esto, aquí hay siete preguntas que debes hacerte para que estas situaciones difusas sean un poco más claras:

1. ¿Se siente genuino, o como una transacción?

Algunas personas son amigos con usted debido a lo que puede hacer por ellos. Las banderas rojas incluyen a amigos que intentan repetidamente venderle algo, piden pedir prestado una y otra vez, o guardan tabulaciones en favores. ("Me debes casa porque cuidé de tu perro.") Estos amigos rutinariamente cruzan la línea entre la amistad y el negocio.

La transacción también podría ser más sutil - eres amigo de ellos porque te admiran con los corazones de dibujos animados en los ojos y, a cambio de obtener un tiro a su autoestima. Eres amigos porque te detienen sólo lo suficiente para que puedas culpar a ellos, en lugar de a ti mismo, por no cumplir tus sueños.

En suma, si deja cada interacción con un impulso de lavarse las manos, mire más de cerca y vea si podría usarlas o ser utilizado usted mismo. Al final, quieres amigos, no un séquito.

2. ¿Se están manteniendo mutuamente alejados de estar sanos?

En 2007, un estudio ahora famoso en el New England Journal of Medicine rastreó la propagación de la obesidad a través de una "red social profundamente interconectada" de más de 12.000 personas, subrayando que los vínculos sociales vinculan a la conducta de salud.

Resulta que los hábitos saludables (o insalubres) pueden circular dentro de un grupo de amigos más pequeños, también. Por ejemplo, hábitos psicológicos no saludables como una tendencia a ponerse unos a otros oa quejarse constantemente pueden propagarse de un amigo a otro. O la imagen corporal malsana o los hábitos alimenticios desordenados pueden ser una cultura en su círculo.

Más en serio, si usted está luchando contra un problema de abuso de sustancias normalizado por un grupo de amigos ("Si todos bebemos hasta que nos enmascaramos, ¿no lo hace normal?"), Es difícil pero crucial para dejar caer a los amigos. De hecho, aparecer en la misma barra con la misma gente llevará inevitablemente a la misma conducta.

Lo ideal es que los amigos trabajen juntos para comer mejor, se unan para hacer ejercicio o resistir los horrores de dejar de fumar juntos. Pero si tu amigo te tira, te presiona para que beba o fume después de que hayas aclarado que estás tratando de cambiar, o de otra forma ridiculiza tus intentos de cuidar de ti mismo, puede ser el momento de distanciarte.

3. ¿Estás siendo manipulado?

Manipulación, fundamentalmente, es la gestión de las emociones de los demás, y no de una buena manera. Es malhumorado conseguir que alguien se sienta mal, es especialmente agradable mantequilla alguien.

Es muy difícil ponerse el dedo sobre si está o no ocurriendo, porque ser objetivo de la manipulación es como ser la rana proverbial en el agua que hierve lentamente - es sólo después de que usted está fuera que te das cuenta de todo el alcance de lo que estaba sucediendo.

Pero hay pistas: su amistad puede parecer innecesariamente complicada. Usted está en una pérdida de palabras cuando otros le preguntan acerca de la amistad. "Es complicado", es lo mejor que puedes reunir.

Otra pista: sin darse cuenta de ello, has cambiado para peor como resultado de esta amistad (menos feliz, menos seguro, menos seguro), pero de alguna manera eres el que siempre está haciendo las disculpas. O puede sentir que algo siempre está apagado. Incluso le pregunta a su amigo "¿qué pasa?" Pero la respuesta (o el tratamiento silencioso resultante) sólo te hace más confuso.

Cualquiera de estas pistas puede ser signos de manipulación emocional. De hecho, un estudio de 2016 sorprendentemente encontró que la manipulación colgaba junto con niveles más bajos de características importantes de la amistad como ser capaz de expresar pensamientos y sentimientos personales, proporcionar comodidad cuando era necesario, simplemente ser divertido estar con, y estar siempre allí el uno para el otro (que, Por cierto, en la investigación-hablar se llama "alianza confiable").

4. ¿Son amigos simplemente porque son similares a usted?

A veces forzamos una amistad cuando tenemos un fondo similar y vidas similares. Similaridad de alguna manera nos hace pensar que deberíamos ser amigos. Pero no importa si usted fue a la misma escuela primaria o se parece a escupir imágenes de uno a.

¿Qué es realmente importante? Bueno, un estudio de 2012 evaluó a más de 1.400 personas; Algunos de ellos tenían amistades con personas de distinta raza, orientación sexual o género, y algunos no lo hicieron. Aquellos con amistades entre categorías menos valoraron tener vidas, valores y experiencias similares como sus amigos. ¿En qué se enfocaron? Los verdaderos bloques de la amistad: la confianza, la honestidad, el respeto, y estar allí el uno para el otro.

5. ¿Haces todo el trabajo en la relación?

¿Alguno de estos le suena familiar? Usted justifica un comportamiento egoísta y desconsiderado: "Estoy seguro de que él quería limpiar el lío que dejó cuando pidió prestado mi coche, probablemente estaba ocupado". Usted inicia todas las ideas, hace todos los planes, y es responsable de cambiarlas si no son convenientes para su amigo: "Oh, ¿decidiste reunirte con una cita de Tinder esta noche? Um, seguro, podemos reprogramar." Y por último, haces todo el trabajo emocional: hablar de ellos, apuntalándolos: "Por supuesto que eres increíble, claro, hablemos de todas las maneras en las que oscuras.

Si estás haciendo todo el trabajo en la relación, eres un empleado, no un amigo. Es hora de considerar ir a la huelga.

6. ¿Puedes contar el uno con el otro?

Esto puede sonar cliché, pero es importante. Los amigos no deben ser como los auriculares de tu iPod - nunca cuando lo necesitas, pero enredarse en las cosas cuando no lo estás.

La investigación sobre la amistad está llena de palabras como "recíproco", "mutuo" y "compartido", y si ninguno de ellos viene a la mente cuando se piensa en una amistad en particular, podría ser el momento de retroceder.

De hecho, todas esas canciones de la noche de graduación sobre "estaré de tu lado para siempre" y "seré tu amigo, te ayudaré a seguir adelante", mientras que cursi, son más que balanceándose con los brazos alrededor de los hombros . Las buenas amistades representan un equilibrio de apoyo mutuo. Incluso las disimilitudes entre buenos amigos logran equilibrarse mutuamente.

Por supuesto, con el tiempo el equilibrio se desplazará hacia adelante y hacia atrás - inevitablemente tendrá una gran crisis de vida al mismo tiempo que su amigo recibe una promoción, pero buenos amigos están ahí para compartir sus éxitos y sus luchas. No tienes que unir los brazos y cantar, pero debes estar seguro de que en tu amistad, invierno, primavera, verano o otoño, todo lo que tienes que hacer es llamar.

7. ¿Puedes ser tú mismo?

Terminemos con el grande. No eres el mismo dondequiera que vayas: te comportas de manera diferente en una entrevista de trabajo o visitando a una abuela que cuando sales con tus amigos, pero si te sientes atraído para cambiar o ocultar quién eres, o te sientes avergonzado después de salir con tu Amigo, puede ser hora de probar otras amistades.

Para concluir, décadas de investigación y milenios de sentido común nos dicen que conectarnos con verdaderos amigos es una de las mejores cosas que podemos hacer por nuestra salud y felicidad.

Romper con amigos menos que verdaderos es una decisión difícil. De hecho, debe haber habido un momento en que usted era buenos amigos el uno al otro, o usted no estaría luchando con la pregunta para comenzar.

Ahora, los amigos vendrán y se irán de su vida. Algunos dependen del contexto, como un amigo de trabajo o un amigo de la escuela. Todo está bien. No todos los amigos necesitan ser un amigo y un confidente de las Chicas de Oro. Pero los verdaderos amigos no deben lastimar, manipular, o usar, o presionar a ser alguien que no eres. Un verdadero amigo te inspira a ser mejor, más feliz, más saludable y más "tú mismo".

domingo, 9 de abril de 2017

Interpretando la evolución de precios a través de una red de correlaciones

Características de la estructura de correlación de los índices de precios
Xiangyun Gao, Haizhong An y Weiqiong Zhong


PLoS One. 2013; 8(4): e61091.
Published online 2013 Apr 8. doi: 10.1371/journal.pone.0061091

Resumen
¿Cuáles son las características de la estructura de correlación de los índices de precios? Para responder a esta pregunta, se seleccionaron como datos de muestra 5 tipos de índices de precios, incluyendo 195 índices de precios específicos de 2003 a 2011. Para construir una red ponderada de índices de precios cada índice de precios está representado por un vértice, y una correlación positiva entre dos índices de precios está representada por una arista. Estudiamos las características de la estructura de red ponderada aplicando la teoría económica al análisis de parámetros de red complejos. Se encontró que la frecuencia de los índices de precios sigue una distribución normal contando los grados ponderados de los nodos e identificamos los índices de precios que tienen un impacto importante en la estructura de la red. Encontramos grupos pequeños en la red ponderada por los métodos de k-core y k-plex. Descubrimos huecos de estructura en la red calculando la jerarquía de los nodos. Finalmente, encontramos que la red ponderada de índices de precios tiene un efecto de pequeño mundo calculando el camino más corto. Estos resultados proporcionan una base científica para las políticas de control macroeconómico.

Introducción

Los índices de precios son indicadores importantes para medir la inflación y el desarrollo económico. El gobierno influye en los precios de los productos básicos por una variedad de políticas reguladoras para mantener la estabilidad del mercado. Los índices de precios incluyen el índice de precios al consumidor (IPC) de los residentes, el índice de precios al productor (IPP), el índice de precios al por menor (RPI), el índice de precios de la producción agrícola y del material de producción agrícola y las materias primas, Índice de precios de compra (RFPPI) [1] - [9]. Estos 5 tipos de índices de precios se dividen en muchos índices de precios específicos. Por ejemplo, en China, el IPC se clasifica en ocho categorías: alimentos, tabaco y licor, ropa, equipo y servicios domésticos, productos de salud y personales, transporte y comunicaciones, entretenimiento y productos educativos y servicios y vivienda. Estos 5 tipos de índices de precios se obtienen calculando índices de precios específicos con pesos. Por lo tanto, en comparación con el IPC, PPI, RPI, API y RFPPI, los índices de precios específicos reflejan más directamente los cambios en los precios de los productos básicos. Por esta razón, estudiamos índices de precios específicos en lugar de estos 5 tipos de índices de precios.

Hay relaciones entre los índices de precios que se han encontrado en la investigación anterior. Modelos y métodos de econometría se aplican para probar que hay relaciones causales [4], relaciones de cointegración [5], relaciones interactivas [10] y relaciones de transmisión [11] - [13] entre los 5 índices de precios. Estas relaciones se basan en la correlación entre los índices de precios [14]. Sin embargo, hay muchos índices de precios específicos para cada tipo, entre los que las relaciones desconcertantes forman una red complicada [15] - [17]. En esta red de índices de precios, ¿cuáles índices de precios tienen un mayor impacto? ¿Cómo se afectan entre sí? Cuando uno de ellos cambia, ¿cuáles son los índices de precios que transmitirán el impacto de la fluctuación? ¿Hasta dónde puede llegar el proceso de transmisión y cuál es el camino de transmisión? Debido a que los modelos econométricos tradicionales no pueden incluir tantos índices de precios, si lo hacemos, el modelo será demasiado difícil de usar [14]. Para responder a las 4 preguntas anteriores, primero debemos averiguar las características de la estructura de relación entre los índices de precios. La teoría de la red compleja puede resolver eficazmente los problemas relativos a las características de la estructura de la relación. El concepto central de teoría de red compleja es ver la relación entre las variables en el sistema real como una red compleja, describir la relación entre las variables en el sistema complejo real en forma de red y obtener una mejor comprensión de Su naturaleza analizando la estructura del sistema [18] - [20]. Esta teoría proporciona un enfoque adecuado para analizar cuantitativamente el comportamiento de las redes complejas en el sistema económico, como el fenómeno del mundo pequeño [16], [21]. La diversidad de las relaciones de los individuos está fuertemente correlacionada con el desarrollo económico de las comunidades [22]. Los investigadores han analizado las relaciones de los individuos entre los índices bursátiles basados ​​en la red de correlación. Descubrieron las características de la volatilidad y las existencias dominantes en los índices bursátiles [23], [24], [25]. En el sistema económico, cientos de índices de precios interactúan y se afectan entre sí, y la estructura de correlación forma una red compleja. Así, podemos analizar la estructura de correlación por la teoría de la red compleja.

Materiales y métodos

Materiales

En el presente estudio se recopilaron datos sobre índices de precios específicos de 2003 a 2011 del país en desarrollo China (Anuario Estadístico de China, 2003-2011). Se utilizaron los datos de los cinco tipos de índices de precios siguientes: IPC, RPI, API, PPI y RFPPI. Cada índice de precios se divide en índices de precios específicos, con un total de 195 índices. Los principales elementos de los diversos tipos de índices de precios se muestran en el cuadro 1, por ejemplo, el índice de precios de los alimentos incluye un índice de precios de los alimentos, un índice de precios del petróleo, un índice de precios de carne y aves, Índices de precios.

Tabla 1

Principales elementos de los índices de precios.
Tipo de índice de preciosElementos principales
Índice de Precios al Consumidor (CPI)Alimentos, Tabaco, Licor y Artículos, Vestuario, Instalaciones Domésticas, Artículos y Servicios, Cuidado de la Salud y Artículos Personales, Transporte y Comunicación, Recreación, Educación y Cultura Artículos, Residencia, et al.
Índice de precios al por menor (RPI)Bebidas, Tabaco y Licor, Ropa, Calzado y Sombreros, Textiles, Electrodomésticos, Equipo de Música y Video, Instrumentos Musicales y de Oficina, Artículos de Uso Diario, Artículos de Deportes y Recreación, Plata y Joyería, Medicina Tradicional China y Occidental y Artículos de Salud, Libros, Periódicos, Revistas y Publicaciones Electrónicas, Combustibles, Materiales de Construcción y Ferretería, et al.
Índice de precios al productor de bienes manufacturados (PPI)Industria metalúrgica, industria del petróleo, electrodomésticos, equipo de música y video, industria de fabricación de máquinas, industria de materiales de construcción, industria maderera, industria alimentaria, industria textil, industria de la confección, industria del cuero, industria del papel, Artículos Educativos y Artesanales, et al.
Índice de Precios de Productos Agrícolas y Índice de Precios de Material Productivo Agrícola (API)Fertilizantes Químicos, Fertilizantes Químicos, Plaguicidas y sus Aparatos, Petróleo para Maquinaria Agrícola, Otros Productos de la Ganadería, Productos de la Pesca, Productos Farmacéuticos Medios de Producción Agrícola, Servicio de Producción Agrícola, et al.
Índice de precios de compra de materias primas, combustible y energía (RFPPI)Combustible y energía, Metales ferrosos, Metales no ferrosos, Materias primas químicas, Electrodomésticos, Equipo de música y video, Materiales de construcción, Productos agrícolas, Materiales textiles, et al.

Redes ponderadas de índices de precios

Para estudiar las características de la estructura de correlación de índices de precios específicos, primero debemos establecer la red ponderada por el índice de precios (PIWN) por la teoría de redes complejas. Una red es una colección de nodos y enlaces, N = (V, E). Representamos cada índice de precios como un vértice, y representamos la relación entre dos índices de precios como un borde en la red; Por lo tanto, volvimos el estudio de la estructura de correlación de los índices de precios en un estudio de una compleja red de correlaciones de precios.

El conjunto de vértices V en la red compleja de correlaciones de índices de precios se expresa como

equation image      (1)

Donde vi representa el i-ésimo índice de precios.

El conjunto de nodos E en la red compleja de correlaciones de índices de precios se expresa como

equation image       (2)

Donde e(i, j) representa la relación entre el i-ésimo índice de precios y el j-ésimo índice de precios.

En el curso de este estudio, se intentó definir y cuantificar la relevancia de la red. Cuantificamos el enla ce e(i, j)  y usamos el coeficiente de correlación rij para representar el grado de correlación entre el i-ésimo índice de precios y el j-ésimo índice de precios. El coeficiente de correlación, también conocido como el coeficiente de correlación de Pearson, es un indicador que mide el grado de correlación entre las tendencias cambiantes de las variables, con un rango de [-1,1]. Cuanto mayor sea el valor absoluto del coeficiente de correlación, mayor será el grado de correlación entre las variables.

equation image          (3)

Donde im es el valor de la serie temporal del i-ésimo índice de precios, un archivo externo que An external file that holds a picture, illustration, etc.
Object name is pone.0061091.e004.jpg es el valor promedio de la serie temporal del i-ésimo índice de precios,  jes el valor de la serie temporal del índice de precios j-th, An external file that holds a picture, illustration, etc.
Object name is pone.0061091.e005.jpg es el valor medio de la serie temporal del índice de precios j-ésimo, y s es el número de elementos de la serie de índices de precios.

Así, la matriz de coeficientes de correlación del índice de precios R se forma como

equation image           (4)

Si todos los coeficientes de correlación se reflejan en la red con pesos, entonces la red está completamente conectada y no está disponible para el análisis de topología. Además, para establecer con mayor exactitud la relación y la estructura entre los índices de precios, debemos eliminar las correlaciones débiles y las no correlaciones estableciendo un umbral. El PIWN es una red basada en umbrales, y como todas las redes basadas en umbral, es muy sensible al valor del umbral. Los bordes cuyo peso sea menor que el valor umbral pueden omitirse [23], [24]. A medida que el umbral aumenta, la red se vuelve más informativa sobre la estructura de correlación parcial del sistema, pero la selección de correlación parcial podría verse afectada por la incertidumbre estadística. No se supone que el valor de umbral sea demasiado bajo. En las redes económicas, el umbral suele establecerse por encima de 0,7 [23], [25].

Las propiedades topológicas y métricas del PIWN dependen fuertemente del valor del coeficiente de correlación r. Para seleccionar un valor adecuado para r, iterativamente elegir diferentes valores de este coeficiente de correlación y calcular la suma de los pesos de todos los bordes en el PIWN resultante. Representamos esta cantidad como E (r).

Para r = 0,7, tenemos E (0,7) = 3734. Presentamos la fracción An external file that holds a picture, illustration, etc.
Object name is pone.0061091.e007.jpg como una función de r. Además, realizamos un análisis similar para el tamaño del componente conectado más grande de la red, dependiendo del valor de r. Se indica el número total de vértices en la mayor componente conectada de la PIWN para un r dado con V (r). En la figura 1, mostramos la cantidad An external file that holds a picture, illustration, etc.
Object name is pone.0061091.e008.jpg, donde r = 0,82 es el punto de ruptura. Por lo tanto, elegimos 0,82 como nuestro valor umbral para el tamaño de un gran componente conectado y no trivial topológica y métrica propiedades de la red resultante índice de precios [24]. Si el coeficiente de correlación entre dos índices de precios no es inferior a 0,82, entonces hay una ventaja entre ellos. El valor del coeficiente de correlación entre dos índices de precios se establece como el peso del borde. Así, construimos un modelo de estructura de red compleja y ponderada de fuertes correlaciones de índices de precios, como se muestra en la Figura 2.

Dos medidas de conectividad PIWN en función del parámetro r.
El valor r = 0,82 es la medida utilizada en este trabajo.

Red compleja de correlaciones fuertes de índices de precios.
Los 4 nodos azules son nodos aislados que no tienen una fuerte correlación con otros nodos.





Resultados

Las 4 preguntas sobre el PIWN mencionadas anteriormente son manejadas por el método de análisis paramétrico de red compleja, incluyendo el grado ponderado, k-core, k-plex, la jerarquía de los agujeros estructurales y el camino más corto.

Índices de precios clave

¿Qué índices de precios tienen un mayor impacto? Para responder a esta pregunta, debemos encontrar los índices clave de precios en el PIWN. Los índices clave de precios son los indicadores que tienen un impacto muy alto en el PIWN; Cuanto mayor sea el grado ponderado de un nodo, más amplio será su impacto. En los sistemas económicos, cuanto más amplio es el impacto de un índice, más importante es en la red. Por lo tanto, podemos encontrar índices clave de precios en el PIWN calculando el grado ponderado de los nodos. El grado ponderado de un nodo es la suma de todos los valores ponderados de sus bordes. Esta suma no sólo incluye el número de índices de precios relacionados con el nodo sino que también considera el grado de sus correlaciones. El grado ponderado WDi de un índice de precios (vértice) i se define como

equation image                       (5)

Donde r es el valor del coeficiente de correlación entre los vértices i y los vértices j. En la figura 2, cuanto mayor sea el valor, mayor será el nodo en la red.

Nuestro experimento incluye 191 nodos y 1.795 enlaces en el PIWN. Se calculó el grado ponderado de los 191 nodos, se reflejó a nivel macro, y se encontró que, en toda la estructura de la red de correlación de índices de precios, el grado de influencia del PPI es el más amplio. Así, a nivel macro, PPI es el índice de precios clave. El IPP se refiere al índice de precios al productor en China. En estudios sobre la relación de transmisión de precios en la cadena industrial, muchos estudiosos creen que el PPI puede usarse para representar el nivel de precios en la cadena de transmisión de la industria. En segundo lugar, el grado de influencia del IPC es del 24%, y este índice puede utilizarse en lugar del precio descendente en la cadena de transmisión de la industria. Los resultados muestran que el IBP tiene un mayor impacto en la tasa de inflación que el IPC. Los resultados de otros estudios también apoyan esta conclusión. Utilizando el análisis empírico, el mecanismo de transmisión del precio de producción al precio al consumidor es más importante que el mecanismo de transmisión del precio al consumidor al precio de producción [11]. En general, las fluctuaciones del nivel general de precios aparecen en primer lugar en la zona de producción y, a partir de ahí, se extienden por las cadenas industriales hasta las industrias posteriores y, finalmente, a los bienes de consumo [12]. Por lo tanto, para controlar la tasa de inflación en China, el primero de la cadena industrial se puede considerar en primer lugar. Los resultados también muestran que el grado de influencia de la API es hasta un 15%. China es un país agrícola; Por lo tanto, no debe subestimarse el impacto del nivel de precios de la producción agrícola y su impacto en otras industrias. Especialmente en los países en desarrollo, el aumento de los costos básicos de vida de las personas a menudo tiene una serie de consecuencias, como la reciente "inflación porcina" en China. Tres tipos de índices de precios, el IPP, el IPC y el API, cubren el 80% del grado de influencia. Las estadísticas de la correlación entre los índices de precios macro se muestran en la Tabla 2, y la proporción de cada índice se muestra en la Figura 3.

Proporciones de índices de precios macro con relaciones de correlación.





Tabla 2

Grado ponderado de los índice de precios macro.
Tipo de índide de preciosGrado ponderado
PPI1286.29
CPI787.21
API496.98
RPI463.55
RFPPI182.89
En la Tabla S1, proporcionamos todos los valores del grado ponderado del índice de precios. Hay sólo un pequeño número de índices de precios clave en el PIWN. Sólo 3 índices clave de precios tienen grados de ponderación superiores a 40. En el cuadro 3 se muestra el valor del grado ponderado del índice de precios (top 10). Este cuadro muestra que, en el sistema de índices de precios, sólo unos pocos índices de precios Tienen impactos mayores de 40. Los cambios en estos índices clave de precios darán lugar a fluctuaciones en los otros índices de precios y conducirán a algún fenómeno económico de todo el sistema. Por ejemplo, China es el país más poblado del mundo. El costo de vida del pueblo ocupa un lugar central en su desarrollo económico; Como resultado, las fluctuaciones en la vida cotidiana y la venta al por menor, los índices de precios al consumidor son a menudo la causa de la inflación [26].

Tabla 3

El valor del grado ponderado del índice de precios (top 10).
RangoTipo de índice de preciosGrado ponderado
1RPI(Rural Household)42.19
2PPI(Articles for Daily Use)41.70
3RPI40.59
4PPI(Manufacture of General Purpose Machinery)39.92
5RPI(Urban Household)39.64
6CPI(Rural Household)39.14
7PPI(Manufacture of Special Purpose Machinery)39.00
8PPI(Manufacture of Artwork and Other Manufacturing)38.63
9RPI(Building Materials and Hardware)38.58
10PPI(Consumer Goods)37.62
Encontramos que hay hasta 41 grados ponderados cuyo valor es inferior a 4,8. En la figura 2, los nodos en la parte escasa de la estructura de la red son pequeños, lo que significa que tienen menos impacto en comparación con otros índices de precios y permanecen en estados relativamente independientes. Al analizar los índices de precios con grados ponderados entre 4,8 y 44,8, encontramos que siguen una distribución normal, como se muestra en la Figura 4. Los papeles principales del sistema de índices de precios están ocupados por los índices medios, índices de precios con grados ponderados entre 8,8 y 32,8. Estos resultados pueden usarse como una referencia para decidir las direcciones claves para la regulación de la inflación en China. Sin embargo, en el PIWN general, hay algunos grupos de grupos relativamente independientes y un medio de transmisión entre los índices de precios que deben estudiarse más.


Figura 4
Distribución del índice de precios



Agrupamientos de grupos de precios

¿Cómo se afectan los índices de precios entre ellos? Para responder a esta pregunta, debemos estudiar los grupos de grupo en el PIWN. Los clusters de grupos son sub-redes en las que los índices de precios tienen fuertes correlaciones. En un sistema económico real, muchos índices de precios de los productos básicos interactúan entre sí. Los cambios en un índice de precios tienden a impulsar cambios en otro índice de precios; Existe una relación mutuamente fuerte entre estos índices de precios. Como se observa en la Figura 2, toda la red incluye algunos pequeños grupos de grupos de red, que están en un estado relativamente independiente. Descubrimos que los grupos de índices de precios pueden ayudarnos a comprender las características de la estructura de correlación de los índices de precios y proporcionar mejores referencias para el control de las políticas. El k-plex y el método k-core se basan en el descubrimiento de grados de vértice en subgrupos; Son útiles para identificar pequeños grupos de clusters en la estructura de red del índice de precios. Utilizando el método de descubrimiento de subgrupos, se aprovechan los clústeres de grupos en el índice de precios, lo que puede ayudar al intentar comprender qué otros índices cambian cuando cambia un índice de precios específico.

El método k-plex requiere que cada vértice de los g vértices que están incluidos en un subgrupo mantiene al menos g-k enlaces con otros vértices en el mismo subgrupo, donde k es un coeficiente de ajuste; Cuanto menor sea el valor de k, mayor será el valor de g. Además, cuanto más exigentes sean las condiciones, más estrecha será la relación entre los vértices. El método k-core se refiere a un subgrafo con las siguientes condiciones: los puntos en el subgrafo son al menos adyacentes a k otros puntos en el subgrafo. El método k-plex requiere que, además del punto k, los puntos estén conectados con al menos un punto fuera de los k puntos, mientras que el método k-core requiere que cada punto esté conectado a al menos k puntos.

Primero, use el método k-core para encontrar k-core en el PIWN. Los resultados experimentales muestran que hay 18 grupos de grupos (Figura 5 muestra diferentes colores que representan diferentes k-núcleos). Hay siete grupos con escalas de vértices de no menos de 10 (la escala de vértices representa el número de índices de precios en un grupo de grupos), como se muestra en la Figura 6. Los clusters de grupos más grandes contienen 42 índices de precios. Como se muestra en la Figura 5, hay 3 agrupaciones de grupos grandes en el PIWN, incluyendo el 43% de los índices de precios y el 54% de las correlaciones. Estos grupos de 3 grupos están en posiciones significativas; Cualquier índice de precios en los cambios del grupo de clusters despertará cambios en los otros y dará lugar a cambios en el conjunto. Así, el gobierno podría controlar la fluctuación en los índices de precios mediante una regulación dispersa para mantener la estabilidad de todo el sistema.

Figura 5
El k-núcleo en la estructura de redes de correlación del índice de precios.
La clase de agrupamiento de grupo es mostrado en la Tabla S2.


Figura 6
Un archivo externo que contiene una imagen, ilustración, etc.

La escala de vértices k-núcleo en la estructura de la red de correlación de índices de precios.

Posteriormente, el método k-plex se utiliza para buscar clusters de grupo en el PIWN bajo las condiciones más exigentes ajustando el valor de k y la escala de vértices. En el experimento, ponemos la escala de vértices a g = 17 y el coeficiente de ajuste a k = 2, y solo se encuentran 2 grupos de grupos. Los grupos de 2 grupos son colecciones de índices de precios que tienen las correlaciones más estrechas en toda la estructura de la red, como se muestra en la Figura 7. Los vértices rojos y los vértices azules representan dos grupos de racimos y los vértices negros son los índices comunes de precios para estos dos grupos de grupos . Como se observa en la Figura 7, los índices comunes de precios son todos los índices de precios macroeconómicos que se componen del IPC, el IPR y el API. De los elementos constitutivos de los 2 grupos de grupos, podemos encontrar que, en el PIWN, hay 2 grupos de grupos con estrechas correlaciones; Un grupo comprende los índices de precios de los alimentos y el otro grupo comprende los índices de precios de los bienes de consumo del PPI. Estos dos grupos de clusters tienen fuertes relaciones positivas con los índices de precios macro, lo que significa que es eficaz para China para regular y estabilizar los mercados de precios a través de los alimentos y los índices de precios aguas arriba en la red.

Figura 7
Agrupamientos de grupos de precios.

g = 17, k = 2.

Medio de transmisión

Cuando cambia uno de los índices de precios, ¿cuáles son los índices de precios que transmitirán el impacto de la fluctuación? Para responder a esta pregunta, debemos analizar el intermediario de cada índice de precios en el PIWN. En los sistemas económicos, la fluctuación de cualquier precio de las materias primas puede causar cambios en los precios de otras materias primas, y esta fluctuación es transitiva. Este efecto de transmisión se basa en las correlaciones entre los precios de los productos básicos. Al igual que controlar la propagación de un virus, no sólo debemos controlar la fuente del virus sino también detener la transmisión eliminando el medio de masa. En un sistema económico, el índice de precios en la estructura de la red actúa no sólo como fuente y receptor del proceso de transmisión sino también como medio. Diferentes índices de precios tienen diferentes niveles de efectos medios. Podríamos controlar la transmisión de fluctuaciones entre índices de precios mediante el control de los medios, para evitar la influencia de todo el sistema.

Para buscar el índice de precios que desempeña el papel de intermediario, debemos analizar la jerarquía de los agujeros estructurales para cada índice de precios en el PIWN. La presencia de agujeros estructurales hace que el índice de precios que ocupa la posición intermedia sea un enlace importante. Los agujeros estructurales controlan en gran medida la transferencia de fluctuaciones en el índice de precios. Al medir el nivel de los agujeros estructurales y calcular la jerarquía de los agujeros estructurales para cada índice de precios en la estructura de la red, una jerarquía más alta significa que el índice de precios es más importante en el proceso de transferencia. La formulación de índices de precios i en el cálculo de la jerarquía de estructuras de red es

equation image          (6)

Donde N es el número de vértices en la red individual de vértices (índice de precios) i,  C/N es el valor medio de la restricción en cada nodo y la restricción de nodos Cij es el grado en que los nodos de la red tienen la capacidad de uso de huecos estructurales. La ecuación relevante puede expresarse como

equation image         (7)
Donde  piq es la parte de las relaciones de los vértices j en comparación con todas las relaciones de los vértices i.

Mediante el cálculo de la jerarquía de los agujeros estructurales de cada índice de precios (véase el cuadro S3), la jerarquía de los agujeros estructurales de los índices de precios con un grado de influencia no inferior a 10 (grado ponderado> = 10) Los principales índices de precios son índices de tipo PPI, lo que significa que, en el PIWN, el PPI tiene fuertes efectos de transmisión; Sin embargo, los índices de precios de los alimentos y los medios impresos en el índice de precios al productor tienen efectos de transmisión más fuertes, con un grado de influencia de más de 25. Por lo tanto, para moderar la fluctuación de los índices de precios de los productos básicos es importante regular y controlar estos precios Con fuertes efectos de transmisión. Los resultados del experimento muestran que los índices de precios con una jerarquía de agujeros estructurales de más de 0,02 tienen un grado de influencia inferior a 8. Estos resultados muestran que, aunque algunos índices de precios en la estructura de la red tienen un pequeño grado de influencia, Desempeñan un papel importante en la transmisión de las fluctuaciones de los precios. Al mismo tiempo, encontramos que las fluctuaciones de precios entre grupos de clusters se llevan a cabo por sus índices de precios mutuos. Como se muestra en la Figura 6, los nodos negros son medios conductores de 2 grupos de grupos.

Tabla 4

Jerarquía de los hoyos estructurales de los indices de precios con un grado de influencia no menor a 10 (top 10 de los indices de precios).
RangoTipo de índice de preciosGrado ponderadoJerarquía
1CPI(Touring and Outing)13.050.01843
2PPI(Processing of Food from Agricultural Products)28.770.01412
3PPI(Food)32.700.01405
4PPI(Printing, Reproduction of Recording Media)27.840.01378
5RPI(Furniture)27.790.01312
6PPI(Food Industry)30.130.01269
7CPI(Intercity Traffic Fare)11.430.01253
8CPI(Transportation)11.380.01253
9API36.180.01242
10PPI(Raw Materials Industry)26.430.01236

Distancia de transmisión y trayectoria

Cuando uno de los índices de precios cambia, hasta dónde puede llegar el proceso de transmisión, y cuál es el camino de transmisión? Para responder a esta pregunta, debemos conocer la distancia de transmisión más corta entre los índices de precios. La distancia de transmisión más corta en el PIWN se puede determinar calculando el trayecto más corto. Esta distancia se puede definir como el número mínimo de bordes a través del cual pasan los dos índices de precios en la estructura de la red. Cuando un índice de precios cambia, podemos medir la distancia de impacto más larga calculando el trayecto más corto entre este índice de precios y otros. Además, podríamos conocer la distancia de impacto de todo el sistema de índices de precios al encontrar la trayectoria media más corta del PIWN. Por lo tanto, cuando un índice de precios cambia, podríamos saber qué índice de precios se verá afectado a continuación.

Como se muestra en la Figura 8, las distancias de transmisión de los índices de precios siguen una distribución normal. Una distancia de 1 significa que los dos índices de precios en el PIWN están conectados directamente. Los cambios en cualquiera de los índices de precios afectarán al otro. Se considera que la distancia de impacto es 1. Una distancia de 2 significa que los dos índices de precios están conectados por otro índice de precios (conectado indirectamente). Así, la distancia de impacto se expande a 2. Después de continuar de esta manera, la Figura 8 muestra que las distancias de transmisión de los índices de precios se concentran entre 2 y 4. Así, generalmente las distancias de transmisión de la mayoría de los índices de precios son 2-4 , Lo que significa que, cuando un índice de precios cambia, sólo 2-4 distancias son necesarias para afectar a la mayoría. La distancia de transmisión de fluctuación más larga es de 9 en el PIWN, lo que significa que, cuando cambia un determinado índice de precios, el sistema de índice de precios se verá afectado a una distancia de 9. La longitud de trayecto más corta promedio es 2,55. El índice de cohesión de la estructura de red basado en "distancia" es 0.953. Por lo tanto, la transmisión entre los índices de precios en la estructura de la red es relativamente rápida, tiene un efecto de pequeño mundo, y, en promedio, puede ser completado por un índice de precios. Los resultados también muestran que, en la inflación real, un vértice a menudo tiene un impacto en todos los precios de las materias primas antes de tomar medidas de control efectivas.

Figura 8
Distancia más corta y frecuencia entre los índices de precios.

Después de una distribución normal con un nivel de confianza de 0,78.

Analizamos los caminos en el PIWN y encontramos la trayectoria de transmisión basada en los pesos de los bordes. Tomando el IPR como ejemplo (el valor de su grado ponderado es el más grande), cuando el IPR cambia, el nodo más correlacionado es CPI, y el nodo más correlacionado con IPC es IPC (Hogar Urbano). Siguiendo este proceso, podríamos encontrar otros nodos. De acuerdo con el camino más corto que hemos obtenido anteriormente, la distancia de transmisión más larga es 9; Como resultado, cuando encontramos el 10mo nodo, el RPI (Casa Rural) ya había afectado a todo el sistema. La trayectoria de transmisión del RPI (Casa Rural) se muestra en la Figura 9, con las correlaciones entre los índices de precios (pesos de los bordes) por encima de 0.96. Por supuesto, sólo habíamos considerado el camino con las correlaciones más fuertes. En realidad, los nodos de la trayectoria de transmisión pasarán la fluctuación a otros nodos. Podríamos utilizar el mismo método para encontrar todos los caminos de transmisión y luego conocer más completamente el proceso de transmisión de los índices de precios.

Figura 9

Senderos de transmisión de RPI (Rural Household) con las correlaciones más fuertes.

Discusiones y conclusiones

Este artículo analiza las características de la estructura de correlación de los índices de precios por los métodos que implican redes complejas. Teóricamente, consideramos las relaciones entre muchos factores y realizamos la investigación con una visión estructurada, mientras que la econometría tradicional sólo puede analizar las relaciones entre algunos factores. En la práctica, este enfoque podría ayudarnos a conocer más sobre las interacciones de los índices de precios analizando las características de la estructura de correlación. Este análisis no sólo nos muestra los principios de las interacciones de los índices de precios en el sistema económico sino que también nos proporciona pruebas efectivas de las políticas de control macroeconómico para el gobierno. Encontrar los índices clave de precios podría hacernos conscientes de qué objeto de control es el objetivo clave; El análisis de los grupos de grupos podría mostrarnos las influencias entre los índices de precios, y luego, podríamos sugerir al gobierno cómo estabilizar el precio de mercado regulando escasamente. Analizar el medio de transmisión nos muestra el nivel medio de cada índice de precios, y el gobierno podría evitar la expansión de las fluctuaciones mediante el control de los medios. Medir la distancia de transmisión y descubrir el camino nos indica la escala de impacto y su trayectoria de transmisión cuando hay fluctuaciones en los índices de precios; Estas rutas de transmisión proporcionan referencias cuando se hacen políticas de advertencia.

Un tema que debe investigarse más es cómo estudiar las relaciones que involucran muchas variables si el número de factores que afectan en un sistema económico continúa aumentando; Hay cientos o incluso miles de factores que interactúan entre sí. Como se muestra en la revisión bibliográfica, la mayoría de los estudios sobre la relación entre variables usan teorías y métodos de econometría como regresiones lineales, pruebas de causalidad y pruebas de cointegración. Sin embargo, el propósito de estos modelos econométricos no es incluir todas las variables; En cambio, el propósito es incluir sólo los factores más significativos. Si se introducen demasiadas variables, entonces el modelo será demasiado complejo y la investigación perderá sentido. El número de objetos incluidos en los métodos econométricos tradicionales es dos; Incluso si hay múltiples variables, el análisis se realiza con sólo dos variables. Además, muchos de los objetos incluidos son macroscópicos. Por lo tanto, es fácil ignorar las variables de nivel micro. Estas variables tienen correlaciones e influencia, e interactúan entre sí para formar un complicado sistema de relaciones. Los cambios macroscópicos son causados ​​por cambios en la complejidad de estas variables. Las investigaciones existentes rara vez abordan estas cuestiones. La teoría de red compleja proporciona una buena base para abordar el problema de la complejidad. Las relaciones entre las variables se resumen en los vértices y los bordes de la red, aplicando la investigación sobre la relación entre las numerosas variables en la red. El complejo método de análisis de red proporciona una gama de parámetros y puede combinarse con teorías económicas y métodos analíticos para estudiar problemas complejos en el sistema de índices de precios y el sistema financiero e incluso en el sistema económico.

Al construir el modelo de estructura de la red de correlación de índices de precios, el método no sólo puede utilizarse para estudiar la estructura de correlación de los índices de precios, sino también para otros campos, como el análisis de la correlación entre diversos elementos de los mercados de productos básicos, De los vínculos de precios de las acciones en los mercados financieros, de la investigación sobre las relaciones insumo-producto en las cadenas industriales y de la investigación sobre las relaciones de correlación entre los diversos índices económicos nacionales. Estas cuestiones involucran más variables y relaciones más complejas. Otras investigaciones deberían tener como objetivo definir relaciones complejas entre más variables y combinar métodos de análisis cualitativos y cuantitativos.


Referencias

1. Lebow DE, Rudd JB (2006) Inflation measurement. Finance and economics discussion series divisions of research & statistics and monetary affairs. Federal Reserve Board, Washington, D.C. 1–17
2. Alchian AA, Klein B (1973) On a correct measure of inflation. Journal of Money, Credit and Banking 5: 173–191
3. Mankiw NG, Reis R (2003) What measure of infaltion should a central bank target?. Journal of the European Economic Association 1: 1058–1086
4. Silver JL, Wallace D (1980) The lag relationship between wholesale and consumer prices. Journal of Econometrics 12: 375–387
5. Mahdavi S, Zhou S (1997) Gold and commodity prices as leading indicators of inflation: tests of long-run relationship and predictive performance. Journal of Economics and Business 49: 475–489
6. Kyrtsou C, Labys W (2006) Evidence for chaotic dependence between US inflation and commodity prices. Journal of Macroeconomics 28: 256–266
7. Blomberg SB, Harris ES (1995) The commodity-consumer price connection: fact or fable?. Economic Policy Review 1: 21–38
8. Doroodian K, Boyd R (2003) The linkage between oil price shocks and economic growth with inflation in the presence of technological advances: a CGE model. Energy Policy 31: 989–1006
9. Johnson GD, Song G (1998) Inflation and the Real Price of Grain in China. Chinese Economies Research Center, Working Paper, University of Adelaide.
10. Kadeřábek P (2007) A simple model of interaction between CPI and PPI: Application to monthly data of EU countries. Politická ekonomie 55: 226–244
11. Cushing MJ (1990) Freedback between Whosale and Consumer Price Inflation: A reexamination of the evidence. Southern Economic Journal 56: 1059–1072
12. Clark TE (1995) Do producer prices lead consumer prices?. Economic Review QIII 25–39
13. Weinhagen J (2005) Price transmission within the PPI for intermediate goods. Monthly Labor Review 5: 41–49
14. Gujarati DN, Porter DC (2010) Essentials of Econometrics, 4th edition. McGraw Hill Higher Education.
15. Peazzo RPJ, Reich SL, Schvarzer J, Virasoro MA (1995) Inflation and relaxation to equilibrium in a complex economic-system. Chaos Solitions & Fractals 6: 455–470
16. Schweitzer F, Fagiolo G, Sornette D, Vega-Redondo F, Vespignani A, et al. (2009) Economic Networks: The New Challenges. Science 325: 422–425 [PubMed]
17. Elgazzar AS (2003) Applications of small-world networks to some socio-economic systems. Physica A: Statistical Mechanics and its Applications 324: 402–407
18. Watts DJ, Strogatz SH (1998) Collective dynamics of ‘small-world’ networks. Nature 393: 440–442 [PubMed]
19. Newman MEJ, Watts DJ (1999) Renormalization group analysis of the small-world network model. Physics Letters A 263: 341–346
20. Barabási AL, Albert R (1999) Emergence of Scaling in Random Networks. Science 286: 509–512 [PubMed]
21. Latora V, Marchiori M (2003) Economic small-world behavior in weighted networks. The European Physical Journal B 32: 249–263
22. Eagle N, Macy M, Claxton R (2010) Network Diversity and Economic Development. Science 328: 1029–1031 [PubMed]
23. Liu XF, Tse CK (2012) A complex network perspective of world stock markets : synchronization and volatility. International Journal of Bifurcation and Chaos 22: 1250142
24. Kenett DY, Tumminello M, Madi A, Gur-Gershgoren G, Mantegna RN, et al. (2010) Dominating clasp of the financial sector revealed by partial correlation analysis of the stock market. PLoS ONE 5: e15032. [PMC free article] [PubMed]
25. Tse CK, Liu J, Lau FC (2010) A network perspective of the stock market. Journal of Empirical Finance 17: 659–667
26. He LP, Liu QW (2011) Causes of Inflation in China: Inflation Expectations. China & World Economy 19: 18–32