Cultural Analytics: datos, imágenes y comunicación

Desde que publicara The Language of New Media (MIT Press) en 2001, Lev Manovich nos tiene acostumbrados a textos que marcan las conversaciones en una zona híbrida donde los estudios de comunicación se cruzan con la computación y el arte. Cuando leí The Language of New Media me sorprendió su enfoque: si bien hablaba de los «nuevos medios», la mirada de Manovich era diferente a la del resto de los analistas de la cultura digital que nos llegaban desde Estados Unidos. Manovich comenzaba hablando de El hombre de la cámara (1929), la revolucionaria obra del cineasta ruso Dziga Vertov (1895-1954), y terminaba el libro con un análisis detallado del lenguaje de los nuevos medios digitales interactivos. Era evidente que Manovich tenía otro background. Según la Wikipedia, antes de trasladarse a los Estados Unidos en 1981 este moscovita se había formado en pintura, arquitectura, computación y semiótica, un quadrivium que le permitiría desarrollar una ecléctica carrera científica marcada por la búsqueda y la experimentación permanente.

Si The Language of New Media me marcó durante la fase inicial de mis investigaciones sobre los nuevos medios interactivos, considero que Software Takes Command (Bloomsbury, 2013) es la obra de Manovich más cercana a las líneas de investigación que he desarrollado en los últimos años. Si bien a primera vista parece un libro dedicado a la software theory o la evolución de las interfaces digitales, también puede ser leído como un volumen de teoría de los medios. En breve: en Software Takes Command Manovich propone una teoría de los medios centrada en el software:

Because outside of certain cultural areas such as crafts and fine art, software has replaced a diverse array of physical, mechanical, and electronic technologies used before the twenty-first century to create, store, distribute and access cultural artifacts … Software has become our interface to the world, to others, to our memory and our imagination —a universal language through which the world speaks, and a universal engine on which the world runs. What electricity and the combustion engine were to the early twentieth century, software is to the early twenty-first century (p. 2).

A partir de esta idea, Manovich desarrolla el concepto de “media software” para definir a los programas que utilizamos cotidianamente, desde Photoshop hasta Word o Google. Además de jaquear nuestra idea tradicional de “medio”, los media software también se presentan como el gran modo de producción contemporáneo, un sistema que entre otras cosas crea nuevas formas estéticas y productos culturales infinitamente remixables. Si les interesa este enfoque, pueden leer mi reseña «Los medios al gobierno, el software al poder» en este mismo blog.

Cuando en enero de 2014 reseñé algunas obras sobre Big Data que estaban marcando un nuevo camino en la investigación en comunicación, desde los trabajos sobre humanidades digitales hasta el «distant reading» de Franco Moretti y su equipo en Stanford, no pude hacer a menos de incluir los experimentos de Manovich en el campo de la llamada «cultural analytics«. En esa entrada incluí una primera definición de «analítica cultural» según Manovich («Cultural Analytics is the use of computational and visualization methods for the analysis of massive cultural data sets and flows») y un par de referencias muy breves a su estudio de las portadas de la revista Time y al famoso análisis de «un millón de páginas de manga «.  Ya por entonces algunos comenzamos a soñar con un volumen dedicado exclusivamente a este tema.

Cultural Analytics

Publicado a finales de 2020, este libro de Lev Manovich resume e integra sus investigaciones en un campo híbrido donde se cruza la computación con la visualización de bases de datos culturales de todo tipo, desde películas hasta pinturas o portadas de revistas.  Manovich lo expresa así: «this book is situated in the intersection of data science, media studies, and digital culture studies» (p. 1). Como en sus obras anteriores, Manovich da un paso más allá del experimento y propone una serie de conceptos e ideas que alimentarán nuestros debates por un buen tiempo. En esta entrada no resumiré el libro ni exploraré todas las ventanas que se abren en cada página: solo me limitaré a mencionar un par de puntos críticos para las conversaciones metodológicas y teóricas en que me veo involucrado en mi día a día académico.  Y aclaro: la división entre «analítica cultural como método» y «analítica cultural como teoría» es mía y no responde ni al índice del libro ni al planteo del autor (Manovich divide el texto en tres secciones: «Studying culture at scale«,  «Representing culture as data» y «Exploring cultural data«).

Analítica cultural como método

Manovich parte de una idea que comparto plenamente: la escala que ha asumido la producción cultural en el siglo XXI hace que sea imposible analizarla con los métodos tradicionales. La construcción y análisis de un corpus textual (novelas, fotos, pinturas, páginas de cómics, etc.) a escala de un  investigador o de un equipo de investigación apenas alcanza a rozar la superficie de un universo textual en plena expansión. En este contexto, Manovich propone utilizar el lenguaje de la visualización de grandes masas textuales para identificar patrones emergentes y detectar propiedades imposibles de encontrar analizando un puñado de textos. Para esto es necesario desarrollar nuevas interfaces de usuario que permitan experimentar con las representaciones

Manovich explica que la «media analytics» incluye dos partes: por un lado, la recopilación y análisis de datos de interacción de los usuarios; por otro, la recopilación y análisis de las grandes masas de contenidos digitales. Si la primera parte ha acaparado el interés de buena parte de la comunidad de investigadores y del debate público, la segunda está mucho menos presente en la agenda de investigación (aunque es el pan cotidiano de empresas como Netflix o Spotify). A lo largo del libro los ejemplos, no solo provenientes del trabajo de Manovich y su equipo, son innumerables: desde análisis con bases de datos musicales que contienen casi medio millón de canciones producidas entre 1955-2010 hasta estudios de la evolución de las películas de Hollywood a lo largo de 75 años, pasando por las mutaciones de las pinturas de van Gogh a través de su vida. Según Manovich, muchos de estos conjuntos textuales están constituidos por «artefactos nativos digitales» (las fotos de Instagram), otros deben ser digitalizados (las pinturas de van Gogh)  y algunos son «experiencias culturales» (los movimientos registrados a través de la tecnología GPS).  En todos los casos, la analítica cultural permite trabajar con grandes bases de datos e ir más allá del estudio de las obras «más populares» o los «trending topic« para identificar cambios a gran escala en los géneros, estilos, ritmos o formas.

Un ejemplo nos servirá para terminar de aclarar cómo funciona la analítica cultural: los estudios sobre la pintura impresionista se han centrado en unas 150 obras realizadas en Francia en la segunda mitad del siglo XIX que aparecen una y otra vez en todos los libros. Estas obras constituyen el canon, un conjunto de pinturas elegidas por los expertos que consagraron a sus creadores y les permitieron tener un lugar en la historia de la pintura. Ahora bien, según Manovich el corpus de la pintura impresionista supera las !!13.000 obras!!  ¿Cómo se pueden analizar trece mil pinturas con los métodos tradicionales? La analítica cultural tiene mucho trabajo por delante.

Pero se puede ir más allá. Según los expertos, la pintura de Vincent van Gogh atravesó por diferentes estilos vinculados a sus lugares de residencia (Bélgica, Holanda, París, Arles, etc.) y, a medida que se desplazaba hacia el sur, su obra iba dejando atrás los tonos oscuros y se iba iluminando con colores cada vez más saturados. Manovich y su equipo decidieron poner a prueba esta interpretación; para ello, trabajaron con 776 obras digitalizadas de van Gogh y, a través de una interfaz gráfica, las posicionaron a partir de un eje temporal y otro cromático. Según Manovich, la hipótesis de que van Gogh modificó su estilo a medida que se mudaba es discutible ya que produjo obras «oscuras» en todos los lugares donde vivió:

Una cosa que me llamó la atención de Cultural Analytics es la importancia que da Manovich al «sampling«: si muchos otros investigadores que trabajan con el Big Data hacen hincapié en la totalidad de los universos analizados, Manovich es consciente de que, incluso trabajando con montañas de fotos o largometrajes, resulta imposible analizar todo. Por este motivo dedica un capítulo entero a la construcción de muestras; obviamente, estos «samples» no tienen nada que ver con la tradicional extracción de un puñado de obras sino que estamos hablando de miles de textos que permiten ir más allá del estudio de los contenidos «más populares» o consagrados por la crítica.

If we want to analyze contemporary global culture quantitatively and capture the diversity of human cultural behaviours,  imaginations, motivations, and artifacts, we need to use sampling methods that represent this diversity sufficiently well and draw sufficiently large samples. Stratified sampling or other methods thus are better than single random samples (p. 111).

Ahora bien, a pesar la importancia del proceso de extracción de muestras, la aspiración final la analítica cultural es «to obtain and analyze the complete data generated by any cultural process» (p. 118). Para eso es fundamental que las bases de datos culturales – como la magnífica Europeana – sigan expandiéndose con más y más contenidos digitales.

Como se puede apreciar, la visualización de datos es un componente fundamental de la analítica cultural. Para Manovich

visualization methods allow us to explore large collections of visual cultural artifacts or samples from a cultural process without measuring them. In other words, we do not have to use either numbers or categories. The ability to explore collections of cultural data and information, see patterns at different scales, confront our stereotypes, and make discoveries – but without having to necessarily quantify them – si the reason that visualization is as important for cultural analytics as statistics and data science. Far from being only one of the tools in quantitative cultural analysis, visualization is an alternative analytical paradigm (p. 184). 

Si la sociología cultural tradicional se basaba en los datos provenientes de encuestas obtenidas a través de técnicas de muestreo (Manovich menciona como ejemplo el trabajo de Pierre Bourdieu en La Distinción), donde las categorías eran determinadas de antemano por los investigadores, la analítica cultural estaría proponiendo una especie de sociología de la cultura sin categorías previas de análisis:

Rather than starting with already accepted cultural categories, it analyzes ‘raw’ cultural data to find patterns, connections, and cluster that often do not correspond to these categories. Cultural analytics thus also can be defined as the quantitative study of cultural patterns on different scales (p. 250).

El debate está servido.

Analítica cultural como teoría

A lo largo del libro Manovich insiste varias veces en que Cultural Analytics «is a book of media theory« y que las teorías de los medios «needs to turn to data science«. Según él, las burbujas académicas son incapaces de afrontar fenómenos transversales de la comunicación. Si bien el trabajo con grandes masas de datos tiene sus límites, puede ayudar a poner en duda muchas afirmaciones, sesgos y estereotipos.

Before we can «theorize» contemporary media, we need to see it, and this is not possible anymore without computer because of its new scale. Thus, rather than only being the subject of analysis, as in my book The Language of New Media, the computation becomes the practical tool for studying media and hits new book (p. 18).

Creo que esta cita al comienzo del libro sintetiza el estado de la analítica cultural en tanto «teoría»: está todo por hacerse. En este sentido, el libro anterior de Manovich – me refiero a Software Takes Command –  planteaba una serie de desafíos teóricos mucho más radicales y útiles para renovar la producción en el campo de la comunicación. En otras palabras, Cultural Analytics es más un libro metodológico que teórico. La contribución del volumen, a nivel metodológico, es indiscutible. O mejor: es muy discutible y dará lugar a conversaciones muy provechosas en la comunidad científica. Y ahí radica su valor. Respecto a la teoría, a medida que se acumulen las investigaciones en el campo de la analítica cultural es posible que comiencen a tambalear algunos andamios teóricos y sea necesario desarrollar nuevos conceptos, hipótesis y modelos. Pero para llegar a eso, como escribe Manovich, «we need to see it».

El futuro de la analítica cultural

En todo momento Manovich presenta  a la analítica cultural como un «work in progress» que recién está dando sus primeros pasos. Queda mucho por hacer, desde ampliar las bases de datos culturales hasta afinar las técnicas de «sampling» o seguir explorando las formas de visualización que son, en definitiva, las que permiten «jugar» con la representación de los datos e identificar patrones emergentes. La tercera parte del libro está totalmente dedicada a estos «juegos» («remapping«). En ese sentido, la analítica cultural comparte con las tecnologías de simulación está dimensión casi lúdica donde el investigador, a través de una interfaz de usuario, manipula los datos representados en una pantalla. 

A pesar de su entusiasmo inicial, Manovich es consciente de los límites y problemas que se presentan en el horizonte de la analítica cultural:

My original optimism about the seemingly endless possibilities of cultural analytics gradually gave away to a more realistic view when I realized the limitations of statistical and computational approaches -and more generally, the limitations of thinking of cultures as combinations of elements that we can track» (p. 15).

Por otra parte, Manovich no desprecia los estudios cualitativos: a cierto punto, cuando llega la hora de «jugar» con las visualizaciones, la «cultural analytics» se presenta como un método de trabajo cualitativo-interpretativo a todos los efectos. Por otra parte, Manovich reivindica la investigación cualitativa, por ejemplo la etnografía digital. Si el investigador quiere indagar fenómenos culturales contemporáneos,  «qualitative methods should be among our tools» (p. 84). Pero a la hora de investigar las transformaciones a largo plazo y en gran escala del ecosistema mediático, son evidentes las ventajas que ofrece la analítica cultural.

Para terminar, creo que el debate propuesto por Manovich – ¿es posible una ciencia sin categorías previas de análisis? – merece ser tenido en cuenta. Si bien Manovich no llega a sostener la hipótesis radical de los evangelistas del Big Data (por ejemplo Chris Anderson: «With enough data, the numbers speak for themselves»), resulta difícil pensar en un proceso de conocimiento que no parta de una serie de interrogantes, hipótesis o categorías previas. Por otro lado, en las ciencias sociales es muy común que los investigadores entren al «campo» con una batería de categorías que nadie pone en discusión y terminen encontrando lo que están buscando, metiendo a palos todo lo que encuentran dentro de sus esquemas. Si el dardo arrojado por Manovich en Cultural Analytics sirve para poner en discusión este tipo de práctica científica, bienvenido sea.

Bonus tracks

 

Deja un comentario