XML. El ADN del artículo científico

www.cygnusmind.com

XML. El ADN del artículo científico – CygnusMind Blog

por Cygnusmind.com

ARTÍCULO

Desde la aparición de Internet hemos escuchado muchas veces que la información puede ser legible para máquinas y que hay un lenguaje llamado XML que lo permite, pero ¿qué es el XML?

Los antecesores del XML son el SGML, formato que surge en los 80’s cuando los retos giraban en torno a la publicación electrónica sea cual fuere la forma de publicarse. En los años 90 surge el HTML para extender las capacidades de presentaciónde la información, es decir, vista, diseño gráfico. Años más tarde inicia el XML como una solución a la representación de datos.

Las siglas XML provienen de eXtensible Markup Language (Lenguaje de Marcado Extensible). El XML es un metalenguaje, es decir, un lenguaje que se utiliza para generar otros lenguajes y fue desarrollado por el World Wide Web Consortium (W3C). XML provee un método uniforme para describir e intercambiar datos estructurados. Describe estructura y semántica, no formato.

¿Por qué es tan importante el uso de XML?

〉El contenido es separado de cualquier noción de presentación.

〉Estándar internacional independiente de las plataformas.

〉El XML es un formato abiertoque puede ser interpretado por cualquier aplicación.

〉El XML puede ser intercambiadoentre sistemas que incluso pudieron no haber sido diseñados para este propósito.

Si el XML es un meta-lenguaje, entonces cualquiera puede crear su propio lenguaje. Existen múltiples lenguajes creados a partir del XML diseñados para propósitos específicos. Entre ellos se encuentran: MathML para matemáticas, VML para imágenes con vectores, entre otros.

Para que el XML sirva como forma de comunicación es necesario hablar el mismo lenguaje, es cuando resulta necesario implementar un mismo vocabulario.

Un vocabulario es un conjunto de términos comunes. En XML el DTD (Document Type Definition) y XSD (XML Schema Definition)describen el vocabulario de un lenguaje, nos dicen cuáles etiquetas utilizar y cómo organizarlas.

¿Cuál es la diferencia entre XML y JATS?

El JATS (Journal Article Tag Suite) es el vocabulario de las revistas científicas, define el conjunto de etiquetas -metadatos- particulares para artículos científicos. JATS es un estándar técnico basado en la Organización Nacional de Estándares de Información (NISO) actualmente en la versión Z39.96 2012 (NISO z39.96-2015 (JATS 1.1; Current Standard)). Proviene originalmente de un estándar definido por la NLM, la Biblioteca Nacional de Medicina de Estados Unidos.

Para comprenderlo debemos imaginar la ficha bibliográfica de un libro o texto en una biblioteca: la ficha catalográfica identifica, separa y, al hacerlo, puede organizar, distribuir, por año, tema, editor, autor, etc… las posibilidades de organización dependen de las etiquetas: en el trabajo científico se identifica el título <título>La revista digital nativa</título>; el año, <año>2018</año>; el formato <formato>HTML</formato>; autor<autor>cygnusmind</autor>; URL, <url>https://www.cygnusmind.com/blog/</url>; resumen <resumen>……….</resumen>; palabras clave…… etc.

Sin embargo la catalogación para bibliotecas, únicamente identifica lo que se denomina “FRONT” o cabecera, que se refiere a los datos de identificación del trabajo, autores, afiliaciones institucionales, incluyendo resumen y palabras clave.

El “BODY”o texto completo: se refiere a la etiquetación de las secciones (introducción, método, resultados, etc.), los párrafos en orden y secuencia, las tablas (de forma que puedan ser manipulables), las fórmulas (de forma que puedan ejecutarse), las imágenes, etc.

El “BACK” o parte final del artículo: es el marcado de todos los elementos incluidos en la sección de referencias o bibliografía, sección tan importante para la articulación, la liga para poder identificar citas y generar los indicadores bibliométricos tan conocidos y valorados hoy en día, tales como, Factor de Impacto (FI), Scimago Journal Rank (SJR), Cite Score (CS), Índice H (IH), etc. Es importante enfatizar que hay decenas de indicadores derivados de las referencias y múltiples formas de agrupación (autor, país, institución, etc.), pero dichos resultados o productos solo pueden generarse si la información está identificada.

Para entender la complejidad y extensión del vocabulario de etiquetas de JATS es importante mencionar que son más de 200 metadatos, aunque muchos no se utilizan regularmente, sin embargo, entre más información se etiquete mayor semántica e interoperabilidad se alcanza.

La marcación XML además ayuda en diferentes aspectos, como son:

Recuperación de información: cómo sobresalir ante la magnitud de información que se encuentra en la red y que crece exponencialmente día a día. Precisamente el etiquetado y marcado da mayores posibilidades para que los motores de búsqueda y los “robots”, “arañas”, encuentren de forma inmediata y eficiente y puedan proporcionar dicha información: por ejemplo, a través de los metadatos los motores pueden identificar las condiciones de uso de un contenido reconociendo las licencias Creative Commons.
Identidad digital: La identidad digital es algo nuevo y poco trabajado y discutido, pero esencial en el mundo digital. Es la huella, rastro que está en la red, producto del contenido o de la interrelación. En una palabra es lo que está asociado a una entidad (revista, autor, institución) en la web. En el medio académico y científico enmarcado en una competencia extrema y en la necesidad de sobresalir y mostrar su producción científica, académica, técnica y cultural es esencial, muchas veces la visibilidad y posicionamiento está asociado a los recursos obtenidos y, en muchos sentidos, el metadato adecuado es determinante.
Preservación digital: La preservación de los documentos físicos ha sido un reto constante en el mundo moderno. Sin embargo, la preservación digital implica, además de la conservación del soporte de almacenamiento, la capacidad de acceder a la información almacenada. El XML en tanto es un formato codificado de manera estandarizada es posible que sea decodificado en el tiempo para poder ser usado con herramientas o software creados en el futuro.
Indexación: La producción académica hoy se encuentra ante la presión de estar presente en diversos índices, que dan cuenta de su calidad y cumplimiento de criterios internacionales. Esto obliga a una interacción, mayor o menor, con los índices, y esta interacción muchas veces implica el intercambio de información, que va desde el envío de archivos XML con los metadatos del “FRONT” o el “BACK” para el uso de las referencias en los procesos de análisis de citas, hasta el texto completo etiquetado en XML.
Visualización y ubicuidad: cuando se dice que el XML es el ADN del artículo científico se quiere expresar que es el código detrás de la información científica, que permite a partir de él sustentar múltiples procesos, entre ellos la generación de formatos de lectura. Así puede derivarse un PDF inmediato, HTML, ePUB, y muchos más.
Interoperabilidad, el XML es el formato de intercambio de información por excelencia. Permitiendo incrementar sustancialmente la visibilidad y alcance del contenido publicado en la Web.

Por todo ello, no dudamos en decir que el XML es el ADN en el que descansa una Revista Nativa Digital.

Cómo citar: Cygnusmind (2019). XML. El ADN del artículo científico. Obtenido de Cygnusmind Blog: https://www.cygnusmind.com/blog/xml/xml-el-adn-del-articulo-cientifico/.

XML. El ADN del artículo científico

La publicación digital no es un PDF

About the Author

Salvador Chávez

Leave a Reply

About the Author

Salvador Chávez

You may also like

Leave a Reply