domingo, 22 de noviembre de 2015

Las redes personales de los principales sociólogos

Las redes personales de los principales sociólogos contemporáneos

¿Están conectados entre sí los grandes sociólogos contemporáneos?
Los principales sociólogos contemporáneos se hicieron populares por sus teorías y por sus innovaciones. Pero hoy no nos interesa qué dijeron, qué escribieron o quiénes son los mejores sociólogos, sino las redes sociales que tuvieron durante su carrera profesional. Seleccionamos a 17 de los sociólogos contemporáneos más famosos y reconocidos, y buscamos en sus biografías cuáles fueron sus redes personales:  1) personas con las que escribió algún artículo o libro, 2) colegas o profesores que tuvo, 3) universidades donde estudió, 4) universidades donde trabajó, 5) revistas donde fue editor o perteneció al comité editorial, 6) universidades donde es honoris causa, y 7) comités u organismos donde es asesor. ¿Qué descubrimos mediante el análisis de las redes personales de los principales sociólogos contemporáneos?

Análisis de redes de los principales sociólogos contemporáneos

Esta investigación se pregunta si los grandes sociólogos contemporáneos están conectados entre sí mediante las redes personales y organizacionales que tejieron durante su vida. Este interés nace por estudiar las formas de organización social de la elite de la Sociología. A partir de la consulta de quiénes son los autores de Sociología más citados y entrevistas con profesores, seleccionamos 17 sociólogos contemporáneos: Mark GranovetterPierre BourdieuSaskia SassenUlrich BeckJurgen HabermasManuel CastellsLuc Boltanski,Walter PowellRalf DahrendorfZygmunt BaumanRobert MertonErving Goffman,James ColemanTalcott ParsonsWright Mills y Robert Putnam. Aunque algunos también han desarrollado carrera en otras disciplinas como Filosofía o Psicología, todos ellos han estudiado e impartido lecciones de Sociología. Posiblemente puede faltar alguno en su opinión, tampoco están todos mis favoritos, pero en términos generales están la mayoría de los autores de Sociología más leídos y citados. Buscamos información sobre sus redes personales y organizacionales: personas con las que escribió conjuntamente alguna obra, colegas o profesores que tuvo, universidades donde recibió clase, universidades donde impartió cátedra, revistas donde fue miembro del comité editorial, universidades donde es honoris causa y comités u organismos donde fue asesor. Primero construimos las redes egocéntricas de cada sociólogo, es decir, las conexiones directas de cada sociólogo, y posteriormente juntamos las 17 redes egocéntricas y construimos la red sociocéntrica que permite estudiar la conexión (o dispersión) de los grandes sociólogos e identificar cuáles son los actores conectores. Algunos ejemplos:

Red egocéntrica de Pierre Bourdieu

La red personal de Pierre Bourdieu tiene un tamaño de 14 actores. Escribió libros o artículos con cinco personas, uno de ellos con el que fue su estudiante, Luc Boltanski. Bourdieu fue alumno de Louis Althusser y colega de Raymond Aron. Estudió en École Normale Supérieure (ENS) y trabajo en diversas universidades: College de France, Faculté des Lettres d’Alger, Université de Paris, Université de Lille y École des Hautes Études en Sciences Sociales (EHESS). Además, Pierre Bourdieu fue fundador y miembro del comité editorial de la revista Actes de la Recherche en Sciences Sociales.

Red egocéntrica de Manuel Castells

La red personal de Manuel Castells tiene un tamaño de 99 actores entre personas conocidas, organizaciones de pertenencia y adscripciones institucionales. Realizó obras en coautoría con 16 personas, estudió en 4 universidades, entre las que se encuentran la EHESS, donde había sido profesor y director Pierre Bourdieu, y University of Wisconsin-Madison donde estudió Wright Mills. Manuel Castells ha impartido clases en 30 universidades diferentes, entre ellas la Université de Paris donde también trabajó Pierre Bourdieu, University of Cambridge donde trabajó Anthony Giddens, The New School University of New York donde fue profesor Jurgen Habermas, y Oxford University donde impartió lecciones Ralf Dahrendorf y fue honoris causa Robert Merton. El sociólogo español Manuel Castells es miembro del comité editorial de 22 revistas, entre ellas Urban Anthropology, donde también es editora Saskia Sassen. Además, Castells es doctor honoris causa de 18 universidades, y pertenece a 11 organismos asesores. La red personal de Manuel Castells es amplia, heterogénea y le permite conectarse con varios sociólogos de los contemporáneos reconocidos. Puede que no se vieran cara a cara con algunos, pero sí tuvieron similares espacios de formación y de difusión de ideas.

Red egocéntrica de Mark Granovetter

El sociólogo Mark Granovetter, que se hizo famoso por la teoría de la fortaleza de los vínculos débiles y la inserción en redes sociales, tiene una red personal que lo conecta con otros grandes sociólogos contemporáneos. Su red personal tiene un tamaño de 59 actores entre personas y organizaciones. Perteneció al comité editorial de la American Sociological Review, donde estuvieron previamente Wright Mills, Erving Goffman y Walter Powell. Aunque no coincidieron el mismo tiempo, sí fue un espacio de socialización de conocimiento en común. Mark Granovetter estudió en Harvard University donde fueron profesores los sociólogos Robert Merton, Talcott Parsons y Robert Putnam, y donde estudió también Saskia Sassen. Granovetter es profesor de Stanford University donde también lo es Walter Powell, y donde lo fue James Coleman.
Estos ejemplos ya apuntan que hay conexiones entre los principales sociólogos contemporáneos. Si juntamos las redes egocéntricas de cada uno de los 17 sociólogos muestreados, obtenemos la red sociocéntrica donde podemos averiguar si los grandes sociólogos contemporáneos están conectados entre sí.

Red sociocéntrica de los grandes sociólogos contemporáneos

Si quitamos de esta red todos aquellos actores que no son conectores, podemos apreciar con más detalle cuáles son los espacios de conexión entre la elite de la Sociología.
El análisis de redes revela que: 1) los sociólogos contemporáneos más importantes están todos conectados entre sí mediante sus redes personales, pero 2) de manera indirecta a través de algún actor conector, y 3) en la mayoría de las conexiones estos conectores son universidades: Harvard University (grado 6, es decir, 6 sociólogos asistieron como estudiantes o profesores), London School of Economics (grado 6) y University of Chicago (grado 5). También son espacios de interacción de la elite de la Sociología: British Journal of Sociology (grado 3), American Sociological Review (grado 4), American Sociological Association (grado 4) y la Academia Americana de las Artes y las Ciencias (grado 5).
Esta investigación nacía del interés en estudiar a la elite de la Sociología y sus redes personales, y el análisis nos sugiere algunas ideas:
  • La élite académica de la Sociología está unida en una comunidad profesional. ¿Lo estamos el resto de sociólogos? Creo que no.
  • Que las teorías se influyen y complementan no solo por leer libros, sino por las redes personales que tejieron. Se reconoce que la obra de Habermas está influenciada por las teorías de Parsons. Ambos pertenecieron a la Universidad de Heildelberg en Alemania. También Granovetter realizó su teoría de embeddedness (inserción en redes) replicando a Parsons. Granovetter estudió su doctorado en Harvard University, donde fue profesor Parsons. Piensa con quién te relacionas y reflexiona cómo piensas y ves el mundo.
  • Los comités editoriales de las revistas científicas son lugares a los que pertenecen los grandes sociólogos contemporáneos y donde se condiciona el tipo de investigación que se considera aceptable y de calidad. ¿Analizamos quiénes son los miembros del comité editorial de una revista cuando enviamos un artículo? Quizás deberíamos.
Próximamente estará disponible este artículo completo. Espero que te haya gustado o servido para que surjan nuevas ideas. Si te gustó, por favor, compártelo por Facebook,  Twitter, Google+ o LinkedIn

lunes, 16 de noviembre de 2015

Twitter y el debate presidencial argentino

Twitter: en el debate, ganó el bullying cruzado entre los seguidores de Macri y Scioli
#ARGENTINADEBATE.

Los que más nombraron al candidato K lo hicieron para criticarlo y decirle que ganó Macri. Y al revés: los que más nombraron al líder del PRO, para bancar a Scioli. El insólito fenómeno.


Pablo Javier Blanco
Editor Clarin.com

Como si una hinchada de fútbol se hubiera dedicado sólo a cantar contra el equipo rival los 90 minutos de partido, sin vivar a sus jugadores, festejar los ole, y gritar los goles. Así se vivió el debate presidencial entre Mauricio Macri y Daniel Scioli en Twitter. En la red social donde más de 4 millones de Argentinos expresan su vida, los usuarios que más nombraron a Scioli lo hicieron para criticarlo y defender a Macri y viceversa. Los que llenaron de menciones a Macri, lo hicieron para cuestionarlo y bancar a Scioli.

En resumen: en Twitter, ganó por paliza el bullying cruzado.



Así lo revela un estudio de la consultora digital Es Viral, especializada en la investigación en redes sociales, que auditó todos los mensajes de Twitter que contenían el hashtag #ArgentinaDebate más alguno de los dos candidatos: @mauriciomacri o @danielscioli.

En un universo de 450 tuits por minuto y un total de 8,5 millones de cuentas alcanzadas por hora, el informe da cuenta que los que más mencionaron a Scioli dijeron que ganó Macri y que los que más mencionaron a Macri sostuvieron lo contrario: que triunfó Scioli.

"Las redes sociales, cuando hablan de política, se destacan por el tono negativo. Es algo bastante llamativo porque de hecho un estudio de IBM de millones de menciones en Latinoamérica mostraron que el tono general es positivo", explicó en diálogo con Clarín, Martín Romeo, director Estratégico de Es Viral, en referencia a la pasión que se le imprime a Twitter en nuestro país, a diferencia del resto del continente .

En ese sentido, manifestó que "el clima de las redes sociales es tóxico al hablar de política" ya que, en general, lo que se evidencia es que "hay más interés en destacar errores y deficiencias del rival que en señalar aciertos del candidato propio".

Hubo 450 tuits por minuto y un total de 8,5 millones de cuentas alcanzadas por hora

Eso puede verse graficado en la nube de palabras que se construye a partir de los tuits mencionando a ambos candidato presidenciales.

Los términos más recurrentes de los tuiteros que nombraron a Macri fueron:

#ScioliPresidente
#QueGaneScioli
#GanóScioli
#Scioli



Al contrario, para los que más arrobaron a Scioli fueron más bien de tono macristas:

#MacriPresidente
#Macri
#Cambiemos



Para Romeo, hay una teoría que explica esta suerte de bullying cruzado: la que habla de que existe una "predisposición de los individuos a expresar públicamente (tuiter es un espacio público asimétrico) las opiniones según la evaluación del clima de opinión".

"Cuando las personas creen que su opinión es coincidente con la de una mayoría está más dispuesta a expresarla públicamente. Por el contrario, cuando las personas creen que su opinión es minoritaria pueden tender al silencio como consecuencia de observar una distancia con el clima de opinión general. Según la autora Noelle Neumann, 'la lengua se suelta cuando uno se siente en armonía con el espíritu de época'", explicó, en torno al concepto de "la espiral del silencio".

Por esa razón, el bullying cruzado "apunta a generar climas de opinión mayoritaria para que puedas sentirte predispuesto a explicitar tu opinión si evalúas que coincide y al mismo tiempo a desalentar la expresión de opiniones que difieren del clima que intenta instalarse".

-¿Tiene que ver la campaña sucia que se dio en la previa con este tono tóxico en las redes sociales?

-No porque el tono negativo para referirse a la política en redes sociales es previo a la campaña. Hay cierto morbo en señalar los errores antes que los aciertos.

martes, 10 de noviembre de 2015

ARS 101: Centralidad de autovector

Centralidad de autovector

Información general

La centralidad de vector propio o autovector es uno de varios indicadores de nodo que caracterizan la prominencia "global" (en lugar de "local") de un vértice o nodo en un grafo. Otros incluyen la centralidad poder de Katz, Bonacich, y Page Rank.

La esencia de la centralidad del vector propio es calcular la centralidad de un nodo como una función de las centralidades de sus vecinos.

¿Qué es un vector propio?

Considere el siguiente gráfico y su matriz de adyacencia 5x5, A.


Y luego considere, x, un vector 5x1 de valores, uno para cada vértice o nodo en el grafo. En este caso, hemos utilizado la centralidad grado de cada vértice.

Ahora echemos un vistazo a lo que sucede cuando se multiplica el vector x de la matriz A. El resultado, por supuesto, es otro vector 5x1.


Si nos fijamos bien en el primer elemento del vector resultante vemos que los 1s en la matriz A "recogen" los valores de cada vértice al que está conectado el primer vértice (en este caso, el segundo, tercero y cuarto) y el valor resultante es la suma de los valores de cada uno de estos vértices tenido.

En otras palabras, lo que la multiplicación por la matriz de adyacencia hace, es reasignar a cada vértice la suma de los valores de sus vértices vecinos.


Esto, en efecto, "difunde" la centralidad de grado. Esto se está moviendo en la dirección de una métrica razonable para centralidad se puede ver mejor si reordenamos el grafo un poco:


Supongamos que multiplicamos el vector resultante de A de nuevo, ¿cómo podemos interpretar lo que eso significa? En efecto, estaríamos permitiendo que este valor de centralidad de una vez se "extendiera" a través de los enlaces del grafo. Y nos dimos cuenta de que la propagación es en ambas direcciones (los vértices tanto dan como reciben de sus vecinos). Podríamos especular que este proceso podría finalmente llegar a un equilibrio cuando la cantidad que entra en un vértice dado estaría en equilibrio con la cantidad de salir a sus vecinos. Ya que estamos simplemente añadiendo cosas, los números seguirían cada vez más grande, pero podría llegar a un punto en que la participación en el total en cada nodo se mantendría estable.

En ese momento nos podríamos imaginar que toda la "centralidad" del grafo habían equilibrada y el valor de cada nodo capturado por completo el carácter central de todos sus vecinos, todo el camino hasta los enlaces del grafo.

Ahora imagine un vector más genérico de valores para nuestros vértices - sólo (v, w, x, y, z) donde las letras representan valores desconocidos. Vamos a escribir lo que multiplicando este vector por la matriz A se vería


Una nota aparte

Cuando multiplicamos un vector o matriz con sólo un número - lo llamamos un "escalar" - ¿cómo funciona? Lo que por ejemplo, podría ser el doble del vector (1,3)? La respuesta es simple: usted multiplica cada elemento por el escalar. Así, el resultado sería (2,6). Lo mismo es cierto para una matriz:

 (1)

Y, en general, se escribe esta "multiplicación escalar" con una variable no negrita delante del vector o matriz. Por lo tanto, la bM significaría la matriz M multiplicado por el escalar b.

Volviendo al grafo y la centralidad

Así, podemos escribir esta última ecuación como Mx = y. Pero nuestro punto era que podría haber algún conjunto de valores en nuestros vértices, (es decir, algunos {\ bf x}), para el que la multiplicación por A no iba a cambiar los tamaños relativos de los valores de los componentes del vector - el número haría hacen más grandes, pero todos por el mismo factor. Podemos expresar esto así:


Un vector con esta propiedad - que puede ser multiplicado por la matriz de adyacencia de un grafo y retorna a sí multiplicado por un escalar - es una característica de esta matriz de adyacencia particular. En otras palabras, hay algo en el patrón particular de conexiones en este gráfico que conduce a un conjunto específico de valores de vértices que tendrán la propiedad de equilibrio descrito anteriormente.

Este vector se denomina un vector propio de la matriz A.

Los elementos de este vector son las centralidades de vector propio de los vértices del grafo.

Referencias y Exploración

Borgatti, Stephen. Centrality for MGMT 780 at UK School of Business.
Wikidot

jueves, 5 de noviembre de 2015

Redes de alianzas y enemigos en Siria

Explora la complicada red de aliados y enemigos en la guerra civil en Siria

Escrito por Keith Collins y Loubna Mrie - Quartz



La entrada de las tropas terrestres de Estados Unidos y el inicio de los ataques aéreos rusos en Siria añaden nuevos nudos a la complicada red de enemigos y aliados en la guerra civil del país, que comenzó en 2011. Para darle una mejor idea de la red, que señaló a la relaciones en Siria, tal y como están hoy.


Busca sobrevivientes después de bombardear por fuerzas leales al presidente sirio Bashar al-Assad en Damasco. (Reuters / Bassam Khabieh)

miércoles, 4 de noviembre de 2015

Redes de ingredientes y pirámides de sabor

Red de sabor y los principios del maridaje
Yong-Yeol Ahn, Sebastian E. Ahnert, James P. Bagrow y lászlo barabási

Nature
doi: 10.1038 / srep00196

Resumen

La diversidad cultural de la práctica culinaria, como lo ilustra la variedad de cocinas regionales, plantea la cuestión de si existen patrones generales que determinan las combinaciones de ingredientes utilizados en la actualidad los alimentos o los principios que trascienden los gustos y recetas individuales. Introducimos una red sabor que captura los compuestos de sabor que comparten ingredientes culinarios. Cocina occidental muestran una tendencia a utilizar pares de ingredientes que comparten muchos compuestos de sabor, el apoyo a la llamada hipótesis de maridaje. Por el contrario, las cocinas de Asia Oriental tienden a evitar ingredientes de intercambio de compuestos. Dada la creciente disponibilidad de información sobre la preparación de alimentos, nuestra investigación basada en datos abre nuevas vías hacia una comprensión sistemática de la práctica culinaria.





(A) Los ingredientes contenidos en dos recetas (columna izquierda), junto con los compuestos de sabor que son conocidos por estar presentes en los ingredientes (columna derecha). Cada compuesto de sabor está vinculada a los ingredientes que lo contienen, formando una red bipartita. Algunos compuestos (que se muestran en negrita) son compartidos por múltiples ingredientes. (B) Si proyectamos la red bipartita-ingrediente compuesto en el espacio de sustancia, obtenemos la red sabor, cuyos nodos son ingredientes, vinculado si comparten al menos un compuesto de sabor. El espesor de enlaces representa el número de compuestos de sabor comparten dos ingredientes y el tamaño de cada círculo corresponde a la prevalencia de los ingredientes de las recetas. (C) La distribución de tamaño de la receta, capturando el número de ingredientes por receta, a través de las cinco cocinas explorados en nuestro estudio. (D) La frecuencia de rango parcela de ingredientes en los cinco cocinas muestran una distribución aproximadamente invariante a través de cocinas.


Cada nodo indica un ingrediente, el color de nodo indica la categoría de alimentos, y el tamaño nodo refleja la prevalencia ingrediente en las recetas. Dos ingredientes están conectados si comparten un número significativo de compuestos de sabor, el espesor de enlace que representa el número de compuestos compartidos entre los dos ingredientes. Enlaces adyacentes se agrupan para reducir el desorden. Tenga en cuenta que el mapa sólo muestra los vínculos estadísticamente significativas, como se identifica por el algoritmo de Refs.28,29 para p-valor de 0,04. Un dibujo de la red completa es demasiado denso para ser informativos. Utilizamos, sin embargo, la red completa en nuestras mediciones posteriores.




Ilustración esquemática de dos pares de ingredientes, la primera compartir muchos más (A) y la segunda mucho menos (B) compuestos de los esperados si los compuestos de sabor fueron distribuidos al azar. (C, D) Para probar la validez de la hipótesis de maridaje, construimos 10.000 recetas al azar y calculamos ΔNs. Encontramos que los pares de ingredientes en las cocinas norteamericanas tienden a compartir más compuestos mientras cocinas de Asia Oriental tienden a compartir menos compuestos de lo esperado en un conjunto de datos de recetas al azar. (E, F) La distribución P (Ns) para 10.000 conjuntos de datos de recetas aleatorios en comparación con los valores reales de la cocina de Asia Oriental y América del Norte. Ambas cocinas presentan valores de p significativos, según las estimaciones utilizando una prueba z. (G, H) enumeramos cada par ingrediente posible en cada cocina y mostrar la fracción de pares en las recetas como una función del número de compuestos compartidos. Para reducir el ruido, sólo utilizamos los puntos de datos calculados a partir de más de 5 pares. Los valores de p se calcularon utilizando una prueba t. Cocina norteamericana está sesgada hacia los pares con los compuestos más comunes, mientras que Asia Oriental muestra la tendencia contraria (véase el SI para los detalles y resultados de otras cocinas). Tenga en cuenta que se utilizó la red completa, la columna vertebral no se muestra en la Fig. 2 para obtener estos resultados. (I, J) La contribución y la frecuencia de uso de cada ingrediente en América del Norte y la cocina de Asia Oriental. El tamaño de los círculos representa la prevalencia relativa. La cocina de América del Norte y Asia oriental muestra las tendencias opuestas. (K, L) Si eliminamos los ingredientes altamente contribuyendo de forma secuencial (de la contribución más grande de la cocina de América del Norte y de la contribución más pequeña en la cocina asiática del este), el efecto de los compuestos compartida se desvanece rápidamente cuando sacamos cinco (Asia Oriental) a quince ( de América del Norte) ingredientes.



(A, B) Pirámides de sabor las cocinas de América del Norte y de Asia Oriental. Cada pirámide de sabor muestra los seis ingredientes más auténticos (es decir, aquellos que son mayor ), pares de ingredientes (más grande) y ingredientes trillizos ( más grande). El tamaño de los nodos refleja la abundancia del ingrediente en las recetas de la cocina particular. Cada color representa la categoría del ingrediente (véase la Fig. 2 para el color) y el espesor de enlace indica el número de compuestos compartidos. (C) Los seis ingredientes y pares de ingredientes más auténticos utilizados en cocina regional específica. Color de nodo representa la cocina y el peso enlace refleja la prevalencia relativa de la pareja ingrediente.

martes, 3 de noviembre de 2015

Herramienta para percolación tridimensional de agrupamientos

Accesibilidad a clúster de percolación 3D
Un clúster de percolación tridimensional con sitios coloreado de acuerdo a su accesibilidad a la difusión de los caminantes al azar

David A. Adams
Leonard M. Sander
Departamento de Física
Universidad de Michigan
Ann Arbor, Michigan
Robert M. Ziff
Departamento de Ingeniería Química
Universidad de Michigan
Ann Arbor, Michigan
Accesibilidad 3D percolación Cluster



Los fractales son auto-similares, ellos tienen el mismo aspecto en muchas escalas, y se producen con frecuencia en la naturaleza por lo que son objeto de interés teórico, experimental y estética sostenida.
Una propiedad importante de un fractal es la facilidad con las que diminutas partículas de polvo pueden llegar a diferentes partes del objeto. Esta propiedad se llama la medida armónica y es importante para aplicaciones tales como la forma en que crece un catalizador áspero y lo resistente catalizadores son ásperas al ser contaminados por moléculas no reactivos. La medida de armónicos es con frecuencia difícil de obtener debido a que las partes más íntimas de un objetos fractales típicamente tienen probabilidades más pequeño que uno en un billón de billones de ser golpeado por las partículas de polvo.
Hemos desarrollado una herramienta para medir esos extremadamente pequeñas probabilidades de objetos fractales tridimensionales simulados llamados cúmulos de percolación. Las imágenes muestran un pequeño grupo de percolación con los sitios en el clúster de color de acuerdo a sus portabilidades de ser golpeado por las partículas de polvo.

APS Physics

domingo, 1 de noviembre de 2015

Redes de acciones en el NASDAQ


Red de NASDAQ  - Parte I

por Andrey Gabdulin - Concepton


Sí, esto es lo que estoy haciendo a la 1 am cuando los cambios del mercado recuerdan que hay una belleza escondida dentro señales seudo caóticas que rigen nuestra vida. Luego vuelvo a la obra, que está tratando de sistematizar mercado de valores en una sola red y por medio de las propiedades estáticas y dinámicas de la red para entenderlo mejor. ¿Qué podemos encontrar allí? Un montón de cosas interesantes. Conexiones ocultas, clusters, conexiones internas y transversales del sector. ¿Qué podemos deducir de esto? Consideraciones de inversión, propiedades de robustez de los mercados, patologías y más ...
Voy a publicar los resultados en unos trozos pequeños - el camino hecho, estoy trabajando en esto :)
Entonces, ¿cómo vamos a empezar? Ciertamente, a partir de los datos en bruto. Necesitamos unos registros de comercio de instrumentos financieros para un cierto período de tiempo. Tengo 2 conjuntos de datos, basados ​​en rangos -

  • 1 semana de 3.5k NASDAQ acciones de la empresa y fondo cotizado (ETF) índices con 5 minutos granularidad
  • 10 años de datos de granularidad diaria para las acciones de NASDAQ

El siguiente paso es elegir el conjunto (o subconjunto, con base en el alcance requerido), reunir los datos y, probablemente, a la limpieza / organizar formatos. Una vez que los datos están listos, tenemos que ejecutar la correlación cruzada. Esto nos dador una matriz de NxN con coeficientes de correlación (R cuadrado) entre cada población. A partir de este punto y en que llamaremos a cada acción de Compañía de la ETF como un "nodo" y la conexión entre dos empresas como un "enlace". Esto es porque, como he dicho, vamos a construir una red y esos son los términos de componentes básicos.
Aplicación de umbral Rsq se va a reducir significativamente la cantidad de existencias que se correlacionan. ¿Cuánto? Bueno, de manera exponencial. Esto es importante, ya que se reduce la carga en nuestro sistema y hace que el análisis más rápido. Además nos da la atención necesaria de investigación:


Cantidad de enlaces (conexiones de valores - eje Y) en función del umbral aplicada sobre Rsq (eje X). Caída exponencial, por lo que aquí se presenta en escala logarítmica.

Prefiero trabajar con señales altamente correlacionados> 0,9 Rsq en 5 minutos de datos de granularidad y un poco más bajo para señales a escala anual. Se trata de datos suficientes para cavar en una sola persona durante la noche. Por ejemplo 0.9 Rsq limpieza está dando en mis datos de conjunto 364 nodos (empresas y fondos) y 5778 enlaces (conexiones entre ellos).
Para empezar a trabajar con facilidad, necesita un poco de la visualización de SW. Me gusta Gephi. Importamos la tabla de enlaces, cuando los valores RSQ se definen como "Pesos" dentro Entonces, ¿cómo se ve?

Correlación Cruzada red de 364 acciones y fondos de la compañía de NASDAQ en el 16 de abril 2014 con la correlación más alta que 0.9 basado en 5 minutos de muestreo granularidad. Los colores se basan en el sector del mercado, tamaño del nodo basado en el valor del capital.

Hermoso, ¿no?
RSQ> 0.95 da imagen mucho más centrada:

Correlación Cruzada red de 116 acciones y fondos de la compañía de NASDAQ en el 16 de abril de 2014 con la correlación más alta que 0.95 basado en 5 minutos de muestreo granularidad. Los colores se basan en el sector del mercado, tamaño del nodo basado en el valor del capital

Ahora podemos inspeccionar haciendo zoom, filtrando sobre la base de los sectores. Por ejemplo Health Care y Pharma:

Correlación Cruzada red de 26 NASDAQ acciones de la empresa en la atención sanitaria y el sector Pharma al 16 de abril 2014 con la correlación más alta que 0.95 basado en 5 minutos de muestreo granularidad. Tamaño del nodo se basa en el valor del capital. Ancho de la conexión basada en el valor Rsq

En esta etapa podemos preguntarnos varias preguntas. Por ejemplo, ¿cómo se ve (y por qué) dos poblaciones con alta correlación?
A veces esto tiene perfectamente sentido, por ejemplo, para FOXA (para las acciones Clase A) y FOX (para las acciones Clase B):

En otros casos, puede encontrarse con que la correlación intra-día no es representativo y ocasional (o causados ​​por raro evento común) y por lo tanto hay una necesidad de cambiar a escala anual.
Podemos construir una cartera de compañías farmacéuticas, debemos todos tomar? Si ahora en realidad no tiene sentido, entonces qué parte? Representante de cada grupo? Bueno, podemos ejecutar el algoritmo de clúster, el algoritmo Run Centralidad y probablemente elegir sobre la base de estas consideraciones.

Todas esas cosas y más en próximas partes ..