¿Podremos leer un PDF dentro de 100 años?

Una de las preguntas que me persigue desde hace un tiempo -y que volvió a plantearse en los debates del BookCamp Kosmópolis Barcelona 2010– es la siguiente: ¿Seremos capaces de leer un documento PDF o HMTL dentro de uno o dos siglos? La pregunta, realizada por una persona que se ocupa de «lo digital» desde hace casi 20 años, puede parecer fuera de lugar: es una pregunta típica de esos viejos bibliófilos que se resisten a ver cómo sus amados paquetes de celulosa impresa son reemplazados por otras especies digitales. Y sin embargo…

En julio 2010 el CCCBLab organizó un debate sobre El futuro de los archivos. Si bien no pude asistir personalmente, seguí los debates cómodamente desde mi casa por streaming y participé vía Twitter. La discusión de los panelistas terminó muy centrada en el presente de los archivos (o sea, se habló poco del futuro de los mismos). Dos coordenadas parecen marcar el trend en el mundo de la archivación contemporánea:  la digitalización y la apertura colaborativa (archivos 2.0).

Ambas mutaciones serían impensables sin la tecnología digital. El proceso de digitalización de los archivos permite traducirlos a un formato fácilmente manipulable, distribuible y consumible. No es lo mismo tener que viajar 5.000 km para consultar un papiro que tenerlo disponible en la web. Por otro lado, la tecnología digital permite insertar ese contenido en una red abierta y participativa donde los usuarios pueden dejar sus comentarios y eventualmente crear enlaces. Este era el sueño de Vannevar Bush y Ted Nelson: el gran hipertexto para la democratización del saber. Todo muy lindo, pero…

codigo-de-hamurabi

Viaje al pasado
Los invito a mi DeLorean. Hagamos juntos un salto de 8.000 años al pasado, cuando nació la escritura en la Mesopotamia Asiática. Como todos saben, los primeros textos escritos se grabaron sobre la superficie húmeda del barro. En estas tablillas se encierra buena parte de nuestro conocimiento de esas civilizaciones: archivos de Estado, contabilidades, transacciones comerciales y relatos populares sobrevivieron durante siglos en ese soporte. Los textos importantes de tipo religioso o legislativo -como el código de Hammurabi que se encuentra en el Louvre-, en cambio, se grababan sobre la piedra. Eran textos destinados a perdurar y apuntaban al futuro.

Algo similar sucedía en Egipto: la comunicación administrativa o familiar se registraba en papiros mientras que los textos importantes quedaban inmortalizados sobre la piedra. Sin embargo, la historia no sido tan prolija a la hora de asegurar la supervivencia de los textos: muchos textos destinados a perdurar, grabados sobre la dura piedra, fueron destruídos y no sabemos nada de ellos; por otra parte, muchos textos de uso cotidiano o administrativo sobrevivieron hasta nuestros días.

Moraleja:  lo que una sociedad elige como «texto importante» y trata de dejarlo a las futuras generaciones no siempre coincide con lo que realmente sobrevive al paso de la historia; lo mismo puede decirse de los textos de uso cotidiano, los cuales muchas veces terminan sobreviviendo cuando en realidad estaban destinados a una vida limitada.

Si les interesan estas historias textuales, los invito a leer Historia y poderes de lo escrito de Henri-Jean Martin. Ahora si, podemos volver al DeLorean y a nuestros futuros.

18403870

Retorno al futuro
Nadie discute a estas alturas la importancia de los procesos de digitalización. Tampoco me parece mal que los archivos se digitalicen y se abran a las lógicas participativas. La democratización del saber así lo exige. Mis dudas se orientan hacia otro lado y se encuadran en una lógica temporal más extensa: ¿Seremos capaces de leer los formatos digitales dentro uno o dos siglos? Si el papiro o las tablillas de arcilla duraron milenios.. ¿Podremos decir lo mismo de nuestros amados PDFs y páginas en HTML?

Cada vez que salgo con estas preguntas nunca falta un programador o especialista en ciberculturas que me dice: «Lo que garantiza la supervivencia es que el formato sea open-source, en código abierto». Este argumento es más frágil que un papiro dentro de una biblioteca que se incendia… Conceptos como «open-source» o «código abierto» tienen sentido hoy, a comienzos del siglo XXI, respecto a determinada tecnología. Si pensamos en términos de siglos o milenios, como hicimos en los párrafos anteriores, esta solución se desvanece rápidamente.

La NASA tiene problemas para leer los datos de la exploración espacial de los años 1960. Yo no puedo leer mis CDroms de los años 1990…

Alexander Stille ha publicado un interesante artículo titulado Are We Losing Our Memory? or The Museum of Obsolete Technology donde sostiene que..

«The beauty of digital technology is that it reduces everything to a series of zeroes and ones — a simple, seemingly universal mathematical language — but unless one has the software that gives meaning to those zeroes and ones, the data is meaningless. The problem of deciphering Egyptian hieroglyphs may look like child’s play compared with recovering all the information on the hundreds of major software programs that have been discarded during the astonishing transformations of the computer revolution».

Vuelvo a mis preguntas: si hoy tenemos problemas para leer datos digitales de hace dos o tres décadas, qué pasará dentro de algunos siglos o milenios?  ¿Podemos confiarnos en sistemas de archivación que necesitan de una precisa combinación de software y hardware para poder acceder a sus datos? ¿No convendrá mantener sistemas archivación paralelos (analógicos y digitales)? Lo repito para que no queden dudas: no estoy contra la digitalización de archivos pero cada vez que pienso en el futuro de esos datos me asaltan los fantasmas del pasado.

11 Comments

Add yours →

  1. Empecé a dejar un comentario pero se me alargó demasiado, así que lo he convertido en un post: http://www.dondado.es/2010/11/el-conocimiento-universal-dentro-de-100-anos/

  2. Carlos A. Scolari noviembre 12, 2010 — 2:13 am

    Gracias por los aportes!

  3. Muy interesante, personalmente creo que lo que es más importante que sobreviva milenios son los códigos necesarios para la decodificación de los 1 y 0 que hemos almacenado hasta el momento. Para ello, debería crearse una institución mundial que se encargue de recolectar y almacenar esta información en todas las formas posibles (papel, digital).

    Lo ideal sería que existiera una única codificación pero en un sistema de libre competencia me parece poco probable.

    Por cierto, creo que el problema no lo vamos a tener sólo con PDF’s o HTML’s, también con nuestra memoria audiovisual, BetaMax, VHS, DVD y más adelante el mismo BlueRay, serán formatos obsoletos que no podremos decodificar.

  4. Carlos A. Scolari noviembre 12, 2010 — 6:09 pm

    En mi casa quedaron algunos cassettes de audio y algunas películas en VHS… pero no tengo dónde mirarlas!! Gracias por los comentarios!

  5. Yo creo que el HTML y el PDF en particular, han logrado esa suerte de universalidad. Los formatos pueden confrontarse (VHS Vs. Beta) pero al final el formato que gana absorbe al otro (VHS Vs. DVD). De cualquier modo, creo que al final el convertidor de software terminará por asegurar la permanencia de los archivos.

  6. Creo que hay que distinguir entre dos aspectos que parecen ser tratados como uno sólo.

    Un tema son los soportes (cintas magnéticas, diskettes, discos rígidos, CDs, DVDs, discos de estado sólido, etc.). Cada uno fue demostrando sus ventajas y desventajas, y posiblemente de acá a 10 años ya no usemos ninguno de ellos. Esto, es tela para cortar por los técnicos.

    Por otro lado, una vez que el soporte esté solucionado, ¿cómo se interpreta la información? ¿Cómo se traducen 0 y 1s en algo con sentido? Esto, es menester de, no sólo técnicos, sino de linguistas y otros especialistas en comunicación

  7. Como tú bien señalas, mucho de lo que se conserva no es precisamente lo que se pensó conservar. Con el azar de los milenios no se puede hacer mucho. Lo más que se puede hacer es buscar conservar lo mejor posible ciertas cosas. Por otro lado, hay un problema con que se conserven demasiadas cosas. De ese pasado antiguo se conservan sólo unas pocas, y es bueno que sean heterogéneas, dan distintas pistas. Hay épocas y culturas de las que no se conserva nada, pero esa ligereza se adaptaba mejor a los ambientes donde vivían (por ejemplo poblaciones amazónicas).

    Yo creo que es distinta la pregunta ténica concreta: ¿Cómo es posible que leamos un pdf en 100 años? Que implica respuestas técnicas que tienen que ver con la apertura del código y con la conservación de los algoritmos.

    Y la pregunta genérica: ¿Podremos leer un pdf dentro de 100 años? Esa tiene que ver con el futurismo y la ciencia ficción y los múltiples mundos posibles. Si queremos que algo definitivamente se conserve tenemos que buscar muchas estrategias. Que implican cajas fuertes, códigos, aparatos, manuales y demás. Pero todo con tintas de comunicación con el «más allá».

    Hoy es fácil leer un pdf y casi imposible un VHS. Pero si un apocalipsis acaba con los computadores, puede pasar que en una caja fuerte aparezcan un cassette de VHS y un aparato. Y que en ellos sólo esté una pareja desnuda haciendo el amor. ¿Si sólo queda eso, sabrán mucho de nosotros? No sé si mucho, algo sabrán… Hay cosas que se escapan de nuestro control.

    (Haciendo un link absurdo, pero todo esta deriva me recordó de Asterios Polyp y su visión del apocalipsis, ojalá ese libro aguante un buen rato)

  8. Gracias por los aportes! Sinceramente, no creo que el codigo abierto sea una solucion, puede ayudar a mediano plazo, pero a largo no es una solucion. Algo sobrevivira, y los investigadores del futuro -como los de hoy- tendran un puñado de pistas para descifrar.

  9. Todo me lleva a pensar que la «sistematización de la ineficiencia» así llamaba la época donde la computadora comenzaba a ganar amplios espacios mientras muchos resistentes al cambio seguian escribiendo en papelitos aquellos datos que no confiaban que pudieran encontrarse o guardarse seguros en esas máquinas…podrían no haber estado tan equivocados…los escritos tendrían más posibilidades de perdurar en el tiempo…qué compromiso!!!

  10. Aunque efectivamente no podemos estar seguros, creo que mientras haya una continuidad de la civilización, seguirá existiendo la información necesaria para recuperar datos de cualquier soporte, es decir, igual que hace un tiempo han empezado a fabricarse de nuevo tocadiscos para recuperar los vinilos que se habían dado ya por muertos, si dentro de mil años es necesario recuperar información de un disquete, tendrá la información necesaria para construir una disquetera, si es necesario. Otra cosa es que haya un cataclismo y haya una ruptura de la civilización, una edad oscura que rompa esa transmisión del conocimiento. A mí me preocupa más que haya tantísima información dentro de cien años que sea imposible manejarla para extraer lo que realmente tenga valor, algo similar a lo que pasa cuando entras en una librería y entre miles de novedades encontrar un libro que merezca la pena es difícil y al final acabas equivocándote. Y así igual que nosotros podemos equivocarnos con el mundo antiguo porque lo que nos ha llegado no es lo relevante, quizá dentro de unos siglos piensen que la sociedad del siglo XXI se pasaban el día compartiendo gatitos en internet…

  11. Este es un tema que me desvela.

    Si la civilización como la conocemos continúa diez mil años+ y los archivos perduran, podríamos imaginar que podrán leer cualquier cosa. ¿Pero si la civilización retrocede? ¿Si desaparece el saber digital como ha desaparecido tanto conocimiento del pasado?

    Imagino a un arqueólogo de ese futuro distópico con una laptop con cubierta de titanio descubierta entre el polvo del tiempo o un smartphone, tratando de deducir para qué servirían dichos adminículos.

    Ya hay varios que piensan en un futuro al menos incierto en relación al conocimiento, un pionero en eso es Bill Gates y su «iconoteca, que desde el 2002 ocupa 3048 metros cuadrados en el corazón del Yacimiento Nacional de Almacenamiento Subterráneo de Iron Mountain, fue enterrada a 20C bajo cero, con 35 por ciento de humedad, a prueba de terremotos, huracanes, tornados y explosiones nucleares».

    Nuestros comentarios marcan un indicio de algo recurrente e inherente a la inmanencia, centrado en nuestro ser efímero. Estamos viciados de mirar la punta de nuestras narices y medir todo a escala (de tiempo) humana y parece que más que límites hay expansión a la vista.

    Sin ir más lejos, muchos de los links posteados acá hace años ya nos rezan «Error 404» o «Ooops! La página no existe», imaginate dentro de diez mil años…

Replica a Valentín Pérez Venzalá Cancelar la respuesta