sábado, 1 de julio de 2017

Reconstruyendo las redes sociales de Venecia con machine learning

La "máquina del tiempo" reconstruye las redes sociales de la antigua Venecia
El proyecto de aprendizaje automático analizará 1.000 años de mapas y manuscritos de la edad de oro de la ciudad flotante.
Por Alison Abbott | Nature



La Máquina del Tiempo de Venecia transportará a los historiadores de la actual Plaza de San Marcos (derecha) al bullicio de la Venecia del siglo XVIII (a la izquierda). Crédito: Tauromaquia en la Plaza de San Marcos de Canaletto y Cimaroli / DeAgostini / Getty; Zetter / Istock / Getty

A pocos metros de la multitud de turistas que pasan por las concurridas plazas de Venecia, el silencio dentro de Santa María Gloriosa dei Frari es tan profundo que duele las orejas. Hace tiempo que los archivistas del Estado se apoderaron de este convento del siglo xiv, pero son tan estudiosos como los hermanos franciscanos que una vez vivieron aquí, ya que tienden los registros históricos que llenan unos 80 kilómetros de estanterías. Ahora, una tripulación de científicos cargados con equipo de alta tecnología está revolviendo las cosas en estas pilas sagradas.

La historia se cuelga pesada en el Frari, y el informático Frédéric Kaplan le gusta de esa manera. Tiene la ambición de capturar más de 1.000 años de discos en forma digital dinámica, abarcando la gloriosa era de la República de Venecia. El proyecto, que él llama la máquina del tiempo de Venecia, explorará documentos incluyendo los mapas, las monografías, los manuscritos y la partitura. Promete no sólo abrir remesas de historia ocultas a los estudiosos, sino también permitir a los investigadores buscar y referenciar la información, gracias a los avances en las tecnologías de aprendizaje automático.

Si tiene éxito, abrirá el camino para un proyecto aún más ambicioso de conectar máquinas de tiempo similares en los centros históricos de la cultura y el comercio de Europa, revelando con un detalle sin precedentes cómo las redes sociales, el comercio y el conocimiento se han desarrollado durante siglos en todo el continente. Sería Google y Facebook durante generaciones, dijo Kaplan, quien dirige el Laboratorio de Humanidades Digitales del Instituto Federal Suizo de Tecnología en Lausana (EPFL).

Aunque la década anterior ha visto muchos proyectos de digitales-humanidades que analizan, anotan e indexan manuscritos, éste se destaca por su ambiciosa escala y las nuevas tecnologías que espera usar: desde escáneres de última generación que incluso podrían leer Libros sin abrir, a algoritmos adaptables que convertirán documentos escritos a mano en texto digital y de búsqueda.



La bendición para la beca debe extenderse mucho más allá de los historiadores. Los economistas y epidemiólogos, por ejemplo, están ansiosos por acceder a los registros escritos dejados por decenas de miles de ciudadanos comunes, lo que podría revelar cómo se desarrollaron los mercados financieros o cómo se propagaron enfermedades como la plaga. "Estamos en un estado de entusiasmo electrificado por las posibilidades", dice Lorraine Daston, directora del Instituto Max Planck para la Historia de la Ciencia en Berlín. "Estoy prácticamente salivando."

La República Serena

Venecia es la ciudad perfecta para el experimento debido a su riqueza de documentación históricamente importante y bien ordenada. Fue fundada en el siglo V dC por los ciudadanos del imperio romano escapando de los invasores bárbaros del norte. Sus inhospitalarias lagunas proporcionaban una protección muy necesaria, y su ubicación en el extremo norte del mar Adriático también tenía ventajas estratégicas. Pronto se convirtió en el puesto comercial más importante entre Europa occidental y el este, lo que le aporta riqueza y poder.

A medida que el imperio de Venecia crecía, desarrolló sistemas administrativos que registraron una gran cantidad de información: quién vivía donde, los detalles de cada barco que entraba o salía del puerto, cada alteración hacía edificios o canales. La banca moderna se inventó en el Rialto, uno de los barrios más antiguos de Venecia, y los notarios allí registraron todos los intercambios comerciales y transacciones financieras.

Crucialmente, esos expedientes sobrevivieron a través de siglos turbulentos. Mientras que el resto de Europa estaba dominado por sus monarcas perpetuamente en guerra, a partir del siglo VIII Venecia comenzó a convertirse en una república estable que proporcionó la paz y el orden necesarios para que el comercio florezca. En muchos sentidos era una democracia modelo. La gente eligió a un líder - el doge - apoyado por los varios consejes, cuyos miembros también fueron elegidos generalmente. La gobernanza era secular, pero en su mayor parte coexistió tolerantemente con la religión.

El emperador francés Napoleón Bonaparte puso fin a la República Serena en 1797. En su camino a Viena durante su intento de conquistar el Imperio Austro-Húngaro, declaró la gobernabilidad secular y democrática de Venecia como una forma de autocracia y la ciudad como un enemigo De la revolución. Obligó a la República a disolverse. En 1815, el viejo Frari se convirtió en el Archivo Estatal de Venecia.

Durante las próximas décadas, todos los documentos administrativos estatales, incluidos los registros de defunción, fueron trasladados allí, junto con registros médicos, registros notariales, mapas y planos arquitectónicos, registros de patentes y una diversidad de otros documentos, algunos de otros lugares de Italia. Particularmente significativos son los informes de embajadores de Europa más amplia y el Imperio Otomano, proporcionando una fuente única de información detallada sobre la vida cotidiana. "Los embajadores venecianos eran los viajeros más atentos, entrenados para averiguar cosas como lo que se estaba descargando en los muelles, o lo que un príncipe u otro alto era como una persona", dice Daston. Sus informes estaban llenos de chismes e intrigas.

La mayor parte del archivo, escrito predominantemente en latín o en el dialecto veneciano, nunca ha sido leído por historiadores modernos. Ahora todo será introducido sistemáticamente en la máquina del tiempo de Venecia, junto con fuentes más no convencionales de datos, tales como pinturas y registros de los viajeros.

Nacimiento de una carrera

Kaplan ha pasado su carrera aplicando inteligencia artificial (IA) en las humanidades, principalmente en lingüística. Ha modelado la evolución del lenguaje, por ejemplo, utilizando AI para buscar siglos de reportajes periodísticos para patrones de palabras y frases. Pero siempre había deseado aplicar estas técnicas a la construcción de una máquina del tiempo en una ciudad europea con un par de siglos de archivos. Sus pensamientos se dirigieron primero a París, Ámsterdam o Ginebra, Suiza. Pero cuando los rectores de la EPFL y la Universidad Ca'Foscari de Venecia decidieron colaborar y solicitar ideas, inmediatamente se ofreció a desarrollar su idea del tiempo-máquina para Venecia. Recuerda vívidamente la primera vez que entró en los archivos, en 2012. El tiempo se detiene en el corral de más de 300 habitaciones, que no son ni aire acondicionado ni calefacción. En invierno son mordazmente frío, en verano sofocante caliente. Los documentos frágiles se apilan del suelo al techo, y ocasionalmente copos de papel amarillento bajan de sus bordes. "Me sentí completamente abrumado", dice. "Al ver cómo es un archivo de mil años, sabiendo que la mayoría no estaba disponible, sabía que necesitábamos hacerlo".

Cuando el proyecto se lanzó oficialmente en 2012, Kaplan sabía que exigía mucho más que su destreza computacional. Sería necesario que los historiadores anotaran los manuscritos, para proporcionar el contexto necesario para el manejo de los datos. Pueden anotar el papel de cada persona mencionada en un contrato para aclarar exactamente quién fue el destinatario, por ejemplo, o evaluar la fiabilidad de una determinada fuente de información. Los archivistas también serían necesarios, por su profundo conocimiento de la inmensa colección de documentos.



La máquina del tiempo de Venecia puede vincular a los ciudadanos y las empresas con los mapas históricos de Venecia, como esta opinión del siglo XVI de la ciudad. Crédito: EPFL / Archivio di Stato

Así que se comprometió como su co-directora Isabella di Lenardo, un historiador entrenado en Venecia que ahora está en EPFL. Los arquivistas estatales de Venecia, acostumbrados a las viejas formas de tutela, tardaron un poco más en aceptar la idea, pero al cabo de un año fueron socios de pleno derecho .

La colaboración interdisciplinaria comenzó de inmediato a recoger el tipo de oscuro conocimiento archivístico que tiende a no penetrar al mundo exterior. Por ejemplo, aunque los informes de los embajadores son una fuente particularmente rica de detalles, a menudo se escriben en código para mantener los mensajes en secreto, una fuente de frustración para los historiadores. Sin embargo, una conversación informal entre los miembros del equipo condujo al descubrimiento fortuito de un pequeño libro del siglo XVI llamado Libro de le cifre, que proporcionó el código de cifrado para los informes de algunos embajadores venecianos. Los historiadores ahora se preparan con entusiasmo para descifrar sus secretos.

Historial de escaneo

Incluso antes de que llegara la Máquina del Tiempo de Venecia, los Archivos del Estado habían iniciado un proyecto de digitalización financiado por el Ministerio de Patrimonio Cultural de Italia. En 2006, un enorme escáner de propósito específico comenzó a digitalizar la preciosa tienda de archivos de más de 3.000 mapas de ciudades italianas, incluyendo muchos encargados por Napoleón. Estos mapas 'catastrales' delimitan los límites de las propiedades y registran la propiedad d pequeñas parcelas de tierra; Algunos de los documentos son tan grandes como 4 metros por 7 metros.

La máquina del tiempo de Venecia ha cambiado este proceso en la sobremarcha, trayendo en otro estado-de-the-art, alta velocidad escáneres especialmente adaptados para el proyecto. Incluyen uno con un brazo robótico para girar las páginas de libros y un imponente escáner rotativo con un plato giratorio de 2 metros de ancho que permite a los técnicos de pie en lados opuestos para alimentar múltiples documentos de tamaño A3 al mismo tiempo. Estos escáneres ahora forman una tubería que produce varios miles de imágenes de alta definición por hora, alimentando terabytes de información a los servidores en Venecia para almacenamiento a largo plazo, ya Lausana, donde las computadoras de alto rendimiento transforman las imágenes en texto digital listas para anotación.

La lectura automática de manuscritos manuscritos antiguos es un reto importante. El software estándar de reconocimiento de caracteres permite que los libros impresos se lean letra por letra a pesar de las variaciones en las fuentes y, por lo tanto, se pueden buscar. Pero esto no funciona para manuscritos manuscritos, donde las formas de las letras individuales pueden variar enormemente entre los escribas, y pueden evolucionar con el tiempo. En una colaboración de la Unión Europea denominada Reconocimiento y Enriquecimiento de Documentos de Archivo (READ) se están desarrollando diversos enfoques para resolver el problema. Kaplan, un miembro de la colaboración, está aplicando actualmente su acercamiento preferido a la máquina del tiempo de Venecia, usando el aprendizaje de la máquina para reconocer las formas de palabras enteras.

Aprendizaje de la máquina se basa en algoritmos que modifican sus propias reglas y comportamiento a medida que recogen ejemplos de conjuntos de datos, afinando sus habilidades con cada nueva experiencia. Los algoritmos de la máquina del tiempo están diseñados para analizar la estructura del texto escrito y extraer formas gráficas que parecen similares, formando un vínculo entre ellas (ver 'Hacking history'). Esto permite que un usuario encuentre un nombre en un documento y luego pida al sistema que revele dónde aparece el mismo nombre en todos los otros manuscritos de la base de datos.



En la próxima década, estos escáneres podrían unirse a un instrumento que lee libros sin siquiera abrirlos. El concepto se basa ahora en las técnicas de barrido de tomografía computarizada (TC) utilizadas en medicina, donde las imágenes de rayos X tomadas en diferentes ángulos forman una imagen 3D del interior de un cuerpo, cortada por rodaja. Los científicos de EPFL están investigando la composición de tintas antiguas para identificar moléculas que podrían actuar como agentes de contraste de rayos X. "Puede necesitar más de cinco años antes de que el escáner tomográfico pueda ser puesto en operación", dice Kaplan. Pero ofrecería enormes ventajas: podría escanear libros mucho más rápido, examinar volúmenes delicados sin daños y acceder a los cientos de miles de frágiles testamentos sellados en los archivos de Venecia que se destruirían si se abrieran.

Redes sociales

A pesar de que estas tecnologías se están desarrollando y refinado, la máquina del tiempo de Venecia ya está demostrando cómo puede ayudar a remodelar la comprensión de los estudiosos del pasado. Las narrativas que llenan los libros de texto de la historia se construyen generalmente alrededor de gente famosa, porque se sabe mucho más sobre ellos. Sin embargo, la máquina del tiempo se hinchará con el tipo de registros mundanos que los administradores estatales en todas partes rutinariamente se reúnen para hacer un seguimiento de sus poblaciones. Esto permitirá a los historiadores reconstruir la vida de cientos de miles de personas comunes - artesanos y comerciantes, enviados y comerciantes - y construir narrativas históricas mucho más redondeadas.


Los Archivos del Estado de Venecia contienen documentos que abarcan 1.000 años, llenando 80 kilómetros de estanterías. Crédito: EPFL / Archivio di Stato

El enfoque eficiente de Napoleón a la administración estatal ha sido especialmente valioso para el proyecto. Un mapa catastral de Venecia que él encargó en 1808 ha proporcionado una columna vertebral de datos confiables, permitiendo a historiadores agregar contexto geográfico a un censo 1740 que enumera a los ciudadanos que poseyeron y alquilaron la característica en la ciudad. Al combinar esto con información 3D sobre edificios de pinturas como las de Canaletto, el equipo de relojería ha realizado una gira animada por Venecia, mostrando qué negocios estaban activos en cada edificio de la época. "Napoleón pudo haber puesto fin a la República de Venecia", dice Kaplan, "pero para nosotros fue el punto de partida para la recuperación de su historia".

Kaplan y di Lenardo también han hecho una serie de otras animaciones de Venecia sobre el espacio y el tiempo, que serán actualizadas y enriquecidas a medida que se alimenten más datos en la máquina. Se trata de un video dinámico del desarrollo del Rialto a partir de 950 dC, utilizando diversas fuentes de información en diferentes momentos. La simulación muestra cómo los edificios -y el icónico Puente de Rialto- surgieron entre las marismas, junto con la destrucción periódica de la zona por incendios y reconstrucciones posteriores.

Otras simulaciones etiquetan edificios en el Rialto con nombres de empresas familiares, o representan las redes sociales que se formaron entre los venecianos y otros en toda Europa. The Venice Time Machine asume que hay una conexión entre personas cuyos nombres aparecen en el mismo documento, y esto le permite mostrar a cada persona como un nodo en una red de conexiones. Cuando los mismos individuos surgen en otros documentos, la web comienza a crecer hasta convertirse en una red gigante - al igual que los científicos elaboran redes sociales a partir de datos de Facebook o Twitter. Esta red debería permitir a los historiadores descubrir detalles sobre la vida de un gran número de personas desconocidas en Venecia y más allá, y su lugar en la sociedad.

Unidades bancarias y plagas

Daston piensa que la máquina del tiempo podría ayudar a responder a una lista casi interminable de preguntas históricas. Por ejemplo, podría mostrar cómo se desarrolló el lenguaje para describir las extrañas especies animales traídas a los muelles de Venecia desde países recién descubiertos, o podría rastrear las trayectorias de académicos y científicos mientras vagaban por Europa.

Su pasión personal es la epistemología de la medición. "Todo el mundo estaba loco por medir el mundo en el siglo XVII, pero las unidades de medida apenas se mencionaban en los siglos XV y XVI", dice. "Ser capaz de hacer búsquedas de palabras clave a lo largo de los siglos podría ayudarnos a entender cómo se estableció la ciencia de la medición".

Ese entusiasmo se derrama de la historia a otros campos. El historiador económico Joan Rosés, de la Escuela de Economía y Ciencia Política de Londres, dice que siglos de información de los notarios de una ciudad tan importante para la historia económica de Venecia "podrían ayudar a cambiar nuestra comprensión de cómo funcionan los mercados financieros". Gran parte de la teoría económica se desarrolló sin datos sólidos, dice, y los economistas que buscan una base de evidencia más sólida se ven obstaculizados por la falta de conjuntos de datos adecuados sobre cosas como las transacciones y el flujo de dinero. Los registros modernos, incluidos los de los bancos, tienen un valor limitado: los datos ya han sido procesados ​​de acuerdo con la teoría económica a la que la institución suscribe. Los conjuntos de datos históricos son más limpios porque registran el comportamiento crudo e intuitivo - simplemente quién vendió qué, por cuánto. Pero los grandes archivos financieros de Europa, como el Archivo Notarial de Cataluña en Barcelona, ​​no están en línea. "Cuando voy al archivo de Barcelona para la investigación, puedo leer sólo tres documentos al día", dice Rosés, "por lo que la Máquina del Tiempo de Venecia será un cambiante". Y hay mucho que aprender de las personas que eran económicas Fallas "Se puede deducir un montón de cosas estúpidas si sólo estudian con éxito, la gente famosa - las únicas personas que conocemos mucho", dice.

El epidemiólogo Marcel Salathé, de EPFL, ya está colaborando con la máquina del tiempo de Venecia, mirando en los registros que revelan los nombres y lugares de las personas que murieron, a menudo con detalles sobre las circunstancias de su fallecimiento. "Es como un registro de salud electrónico primitivo", dice. La peste aniquiló a un tercio de la población de Venecia a mediados del siglo XVII, y Salathé espera descubrir más acerca de cómo se propaga la enfermedad. Los brotes todavía ocurren en todo el mundo, pero hay grandes lagunas en los datos sobre su transmisión. La investigación con animales por sí sola no puede llenarlos, y los conjuntos de datos humanos modernos son demasiado pequeños para ayudar, dice.

Kaplan espera que Venecia sea sólo un punto de partida. La máquina del tiempo de Venecia se ha aplicado, con socios de toda Europa, para convertirse en uno de los próximos millones de euros de los programas emblemáticos financiados por la Unión Europea. Si gana, creará máquinas de tiempo en otras ciudades con archivos similarmente importantes, y los unirá. A principios de este año, un consorcio de académicos holandeses lanzó la máquina del tiempo de Amsterdam, aunque todavía tiene que obtener financiación. Su coordinadora, Julia Noordegraaf de la Universidad de Amsterdam, que estudia la historia de las industrias creativas, dice que es "una gran oportunidad para estudiar el tráfico cultural entre Ámsterdam y Venecia durante su edad de oro en el siglo XVII". Una Máquina del Tiempo de París también está en discusión.

Las ambiciones desenfrenadas del proyecto del tiempo-máquina son una preocupación para algunos investigadores, no menos porque muchas de sus tecnologías de la base todavía se están desarrollando. "La visión de extender la representación digital en diferentes franjas horarias es absolutamente, evidentemente correcta, pero podría ser mejor desarrollar cosas más en muchos proyectos pequeños y diferentes", dice Jürgen Renn, pionero en digital-humanidades y director En el Instituto Max Planck para la Historia de la Ciencia.

Sin embargo, Daston sospecha que la máquina del tiempo anuncia una nueva era de estudio histórico. "Nosotros, los historiadores, fuimos bautizados con el polvo de los archivos", dice. "El futuro puede ser diferente".

No hay comentarios:

Publicar un comentario