miércoles, 6 de julio de 2016

Identificador permanente

La elegancia del identificador permanente

¿Cómo seguir teniendo acceso a un servicio en la nube aun cambiando de proveedor?

Bob Kahn.
Imagine que, como una gran mayoría de lectores, usted utiliza servicios en la nube para almacenar contenido digital. Pongamos que ha creado una carpeta en un proveedor de almacenamiento (por ejemplo, Dropbox), en la que ha depositado su vasta colección de fotografías, y desea compartirlas con algunos de sus amigos. Para ello, una vez organizada la colección (tema interesante, del que hablaremos otro día), escribe un mensaje a sus amigos incluyendo en el mismo las direcciones web de las imágenes que desea compartir. Su mensaje incluirá, entonces, una lista de direcciones de la forma
https://dl.dropboxusercontent.com/u/xxyyzztt/imagen001.jpg
Pero ahora imagine que pasa el tiempo y, por las razones que sea, decide cambiar de proveedor de almacenamiento, y “se lleva” todas sus imágenes a los servidores de su nuevo proveedor. En este caso, obviamente, las imágenes seguirán siendo las mismas, pero sus direcciones habrán cambiado radicalmente y ahora responderán a un patrón distinto. Si, por ejemplo, usted escoge Google Drive, la dirección de cada imagen será algo como https://drive.google.com/open?id=xxxyyyzzzttt . A partir de entonces, los enlaces que usted envió a sus amigos ya no son válidos, puesto que las fotos ya no están en el servidor de Dropbox. ¿Cómo conseguir que sus amigos sigan teniendo acceso a las mismas? Obviamente, puede usted crear nuevos mensajes con las nuevas direcciones y enviarlos de nuevo a todos, pero… ¿realmente desea hacer eso cada vez que cambie de proveedor?

Los repositorios

En 1995, Robert Kahn (Premio Príncipe de Asturias 2002) y Robert Wilensky publicaron un trabajo en el que sentaron las bases de la gestión de contenido digital moderna. La elegante idea de Kahn y Wilensky se sustentó sobre tres principios básicos. En primer lugar, crearon una abstracción para representar cualquier tipo de contenido digital (texto, imagen, sonido, video, software, etc.) a la que llamaron Objeto Digital. Según esto, la web (o cualquier otro ecosistema de contenido digital) no es más que un conjunto enorme de objetos digitales. Los objetos digitales no están vagando por la Web, sino que se almacenan enRepositorios, una especie de almacenes de objetos digitales, de los que no hablaremos por mor de la concisión. Y, por último, la noción de identificador ohandle: a cada objeto digital, en el momento de su creación, se le asigna un identificador único, que no cambia en toda la vida del objeto y que, además, no se reutiliza aunque el objeto al que identifica se destruya.
Cuando alguien deposita un objeto digital en un repositorio, este notifica la llegada del mismo a un servidor de handles, encargado de gestionar los identificadores. El servidor almacena la dirección donde se puede encontrar el objeto digital y la asocia al identificador del objeto. Si alguien quiere acceder al objeto digital, debe conocer su handle, que es convertido automáticamente en la dirección por un servidor de handles en un proceso conocido como resolución. Si el objeto digital cambia de repositorio (esto es, de dirección), basta con notificar el cambio al servidor de handles, el cual, a partir de entonces, resuelve a la nueva dirección, sin que el identificador del objeto digital cambie.

Cambio de dirección

Volvamos al caso de las imágenes compartidas. Para evitar los problemas de cambio de servidor, debe asignarse un identificador único a cada una de las imágenes. Para ello, el sistema Handle, que gestiona el universo de identificadores, le asignaría a su repositorio un prefijo único (por ejemplo, 11.abcde), al que usted puede añadir los sufijos que desee (siempre que sean únicos, por supuesto), de modo que su colección de imágenes estaría compuesta por objetos digitales con handles 11.abcde/imagen1, … , 11.abcde/imagen25. Al depositar sus imágenes en Dropbox, el sistema Handle hace corresponder con cada uno de estos identificadores la dirección correspondiente. Al cambiarlas a Drive, tan solo hay que notificar al sistema Handle el cambio de dirección. Pero el identificador de cada imagen sigue siendo el mismo, por lo que usted no necesita enviar un nuevo mensaje a sus amigos, los cuales no notarán para nada el cambio de servidor.
El trabajo de Kahn y Wilensky se considera el germen de todo el desarrollo posterior de la arquitectura de Bibliotecas Digitales. Handle es utilizado por la mayoría de instituciones académicas del mundo en la gestión de sus repositorios institucionales, y también por SISTEDES en su Biblioteca Digital.
José H. Canós es profesor titular en la Universitat Politècnica de València
Crónicas del Intangible es un espacio de divulgación sobre las ciencias de la computación, coordinado por la sociedad académica SISTEDES (Sociedad de Ingeniería de Software y de Tecnologías de Desarrollo de Software). El intangible es la parte no material de los sistemas informáticos (es decir, el software), y aquí se relatan su historia y su devenir. Los autores son profesores de las universidades españolas, coordinados por Ricardo Peña Marí (catedrático de la Universidad Complutense de Madrid) y Macario Polo Usaola (profesor titular de la Universidad de Castilla-La Mancha).

No hay comentarios:

Publicar un comentario