Aprovechamiento de la metadata en eBooks
El Jueves último, me pidieron un brief relativo a metadatos en vistas de la próxima reunión de la Comisión de eBooks y nuevas tecnologías de la CAL.
Debía un post que tratara de metadata porque la verdad es que es un tema muy importante en una publicación digital y con la excusa de enviar la info, salió este post.
La metadata es un conjunto de información estrictamente ordenada relativa a la publicación. La definición de manual de metadata es «los datos de los datos». Ésta información va dentro del .epub (o sea, información descriptiva dentro del libro) y para el editor debe ser tan importante como su contenido, la información descriptiva o informativa de la información.
Diferentes dispositivos y Apps de lectura usarán la metadata de formas diferentes.
En ePub2, la metadata era por decirlo de alguna forma no-técnica, desordenada. La defino así porque con la aparición de la nueva versión del estándar ePub (ePUB 3 en 2011) la metadata evolucionó a un nivel que también definiré como correcto.
Entonces, vamos al tema metadata en ePUB3.
En principio hay 3 campos relacionados con la metadata que será obligatorios para cualquier publicación:
- El identificador (ISBN, ASIN, ISSN etc.)
- El nombre del autor.
- El idioma.
Hasta acá, nada del otro mundo, es el requerimiento mínimo. La metadata se pone interesante cuando vemos los no obligatorios u optativos, que es donde podemos sacar verdadero provecho para informar acertadamente todo dato del libro que se identifique como relevante a criterio del editor:
- Fecha de publicación: Siendo la fecha en la que se publicó, ésta será diferente a la de «última modificación» (si se usara).
- Fecha de última modificación: se usará para especificar la última fecha en la que el contenido fue actualizado, modificado o editado.
- Idioma: Ejemplo, Español. Pero incluso podemos especificar Español, Argentina.
- Título: Se define el Título, así como también, si hubiera uno, el subtitulo. una aclaración respecto de la Edición y dentro de este espectro podemos definir el orden de toda nuestra información. Por ejemplo:
- Título Principal: La Comunidad del Anillo
Colección: El Señor de los Anillos
Orden: del título en la colección
Título extendido: El Señor de los Anillos, Parte 1: La Comunidad del Anillo
Título en otro idioma.
- Título Principal: La Comunidad del Anillo
- ISBN Fuente: Si el libro tuviese un equivalente en otro soporte (Papel), poder identificar su ISBN.
- Contribuidores: se debe definir como tal a cualquier persona (que no sea el autor) u Organización que haya participado en la publicación, pudiendo especificar para cada participante su relación con el contenido (Ejemplo: Ilustrador, Editor, diseñador de tapa, etc) y su nombre. También es posible refinar cada definición, por ejemplo, Julián Marcelo Calderazi cuyo rol se define como Ilustrador, podría indicarse opcionalmente como «Calderazi, Julián Marcelo» y/o especificar el mismo nombre en otro idioma. Indicando que en Japonés, el nombre será «こんにちは世界» si fuera necesario.
- Cobertura: se puede definir si esta versión es mundial o para determinados países.
- Creador: Es el nombre de la persona, organización, etc. responsable de la creación del contenido de la Publicación. A éste se le puede (conviene) definir el rol. Por ejemplo, Autor. Puede ser más de uno y el orden de éstos debe ser especificado también.
- Descripción: Se utilizará para agregar la descripción de la publicación y cualquier palabra clave que sea necesaria.
- Fuente: la fuente debe ser usada para especificar la fuente de la que deriva este contenido (Ejemplo, el ISBN del libro en formato papel si fuera el caso).
- Tema: Se utiliza para definir un tema del libro, se puede definir una temática o una categoría BISAC.
Hay más para listar, además de la metadata específica de ePUB3, hay metadata específica para Kindle y para iBookstore también. Si bien corresponde a semántica, es posible definir secciones, capítulos, qué es un prólogo, qué contenido corresponde a la bibliografía, incluso algunas cuestiones en lo particular tanto para Kindle como para iBookstore relativas a metadata (por ejemplo, cuando queremos indicar una versión de un libro ya publicado). Pero para resumir un poco acerca de cuánto más se puede especificar de un libro creo hasta acá alcanza. Cabe aclarar, todos los canales están en proceso de mejorar la en esta cuestión.
Tratameinto de la metadata:
Hasta hoy, cada canal trata la metadata que incluimos en nuestro libro de forma diferente. Ejemplo, iBookstore no hace uso de las palabras clave sino que utiliza estrictamente la información que proporcionamos al publicar el libro.
Es por esto que en iBooks, solo cuando busquemos palabras contenidas en el título, subtitulo, nombre del autor, ISBN o editorial, nuestro libro será parte del resultado de búsqueda de nuestra biblioteca (igual caso en iTunes o iBookstore).
En el caso de Kindle, nos permite definir hasta 7 palabras clave. Pero por ejemplo, buscando el subtitulo, no nos devolverá como resultado nuestro libro. iBookstore en cambio, si.
la metadata de un eBook tiene el potencial de colaborar en la optimización de los motores de búsqueda (como en la Web, el SEO)
Es aventurado predecir cómo los lectores (me refiero a eReaders) harán uso de la metadata en el futuro, y precisamente por esto, es importante que la metadata sea lo más exacta y completa posible ya que la metadata también tiene el potencial de colaborar en la optimización de los motores de búsqueda (como en la Web, el SEO) y un buen uso de ésta, terminará beneficiando a nuestro/s ePub/s en los resultados de búsqueda.
hay más de la metadata.
Es cierto, hay mucho más respecto de eBooks, ePUB3 y metadata, pero no es la idea escribir código, sino explicar un poco que hay más de lo que normalmente se suele ver y es importante tenerlo en cuenta ya que el aprovechamiento ofrece.
Lo más importante es que cuando el lector se encuentre con una biblioteca digital abultada, supongamos 70, 150, 200 títulos, buscar y encontrar será mucho más fácil si los títulos hacen uso de la metadata efectivamente. Es el editor quien agrega toda estos datos del dato (información) para lograr la discoverabilidad (discoverability) del contenido que consiste ni más ni menos en que el contenido sea ‘encontrable’ tanto en nuestro lector como en el motor de búsqueda de los canales de distribución.