XML
jueves, 24 de junio de 2010
7.1 ANTECEDENTES


El XML proviene de un lenguaje que inventó IBM allá por los años 70. El lenguaje de IBM se llama GML (General Markup Language) y surgió por la necesidad que tenían en la empresa de almacenar grandes cantidades de información de temas diversos.
Este lenguaje gustó mucho a la gente de ISO, una entidad que se encarga de
normalizar cuantas cosas puedas imaginar para los procesos del mundo actual, de modo que en 1986 trabajaron para normalizar el lenguaje, creando el SGML, que no era más que el GML pero estándar.
SGML es un lenguaje muy trabajado, capaz de adaptarse a un gran abanico de problemas y a partir de él se han creado los siguientes sistemas para almacenar información.
Los objetivos de diseño del XML eran que:
*Debería ser directamente utilizable en Internet.
*Debería soportar una amplia variedad de aplicaciones.
*Debería ser compatible con SGML.
*Debería ser sencillo escribir programas que procesaran el XML.
*El número de capacidades opcionales de XML debería ser el mínimo, a ser posible cero.
*Los documentos XML deberían ser legibles para las personas y razonablemente claros.
*El diseño del XML debería finalizar de forma rápida.
Este lenguaje gustó mucho a la gente de ISO, una entidad que se encarga de
normalizar cuantas cosas puedas imaginar para los procesos del mundo actual, de modo que en 1986 trabajaron para normalizar el lenguaje, creando el SGML, que no era más que el GML pero estándar.
SGML es un lenguaje muy trabajado, capaz de adaptarse a un gran abanico de problemas y a partir de él se han creado los siguientes sistemas para almacenar información.
Los objetivos de diseño del XML eran que:
*Debería ser directamente utilizable en Internet.
*Debería soportar una amplia variedad de aplicaciones.
*Debería ser compatible con SGML.
*Debería ser sencillo escribir programas que procesaran el XML.
*El número de capacidades opcionales de XML debería ser el mínimo, a ser posible cero.
*Los documentos XML deberían ser legibles para las personas y razonablemente claros.
*El diseño del XML debería finalizar de forma rápida.
7.2 Estructura de los Datos XML
La tecnología XML busca dar solución al problema de expresar información estructurada de la manera más abstracta y reutilizable posible. Que la información sea estructurada quiere decir que se compone de partes bien definidas, y que esas partes se componen a su vez de otras partes. Entonces se tiene un árbol de pedazos de información. Ejemplos son un tema musical, que se compone de compases, que están formados a su vez con notas. Estas partes se llaman elementos, y se las señala mediante etiquetas.
Como con otras características de XML, esta libertad tiene más sentido en un contexto de procesamiento de documentos que en el contexto de procesamiento de datos y no es particularmente útil para representar en XML datos más estructurados como son el contenido de las bases de datos. La capacidad de anidar elementos con otros elementos proporciona una forma alternativa de representar información.
Como con otras características de XML, esta libertad tiene más sentido en un contexto de procesamiento de documentos que en el contexto de procesamiento de datos y no es particularmente útil para representar en XML datos más estructurados como son el contenido de las bases de datos. La capacidad de anidar elementos con otros elementos proporciona una forma alternativa de representar información.
7.3 Esquema de los Documentos XML
Las bases de datos tienen esquemas que se usan para restringir qué información se puede almacenar en la base de datos y para restringir los tipos de datos de la información almacenada. En cambio, los documentos XML se pueden crear de forma predeterminada sin un esquema asociado. Un elemento puede tener entonces cualquier subelemento o atributo. Aunque dicha libertad puede ser aceptable algunas veces, dada la naturaleza auto descriptiva del formato de datos, no es útil generalmente cuando los documentos XML se deben procesar automáticamente como parte de una aplicación o incluso cuando se van a dar formato en XML a grandes cantidades de datos relacionados.
el esquema de XML se puede utilizar para expresar un esquema, un sistema de las reglas con las cuales un documento de XML debe conformarse para ser considerado ‘válido ‘según ese esquema. Sin embargo, desemejante de la mayoría de los otros lenguajes del esquema, el esquema de XML también fue diseñado con el intento de la validación dando por resultado una colección de información que adhiriéndose a los datatypes específicos, que pueden ser útiles en el desarrollo del documento de XML que procesa el software, pero que también ha provocado crítica.
el esquema de XML se puede utilizar para expresar un esquema, un sistema de las reglas con las cuales un documento de XML debe conformarse para ser considerado ‘válido ‘según ese esquema. Sin embargo, desemejante de la mayoría de los otros lenguajes del esquema, el esquema de XML también fue diseñado con el intento de la validación dando por resultado una colección de información que adhiriéndose a los datatypes específicos, que pueden ser útiles en el desarrollo del documento de XML que procesa el software, pero que también ha provocado crítica.
7.3.1definiciòn de tipos de documentos (dtd)
Una definición de tipo de documento o DTD es una descripción de estructura y sintaxis de un documento XML o SGML.
Su función es la descripción del formato de datos, para usar un formato común y mantener la consistencia entre todos los documentos que utilicen la misma DTD. De esta forma, dichos documentos, pueden ser validados, conocen la estructura de los elementos y la descripción de los datos que trae consigo cada documento, y pueden además compartir la misma descripción y forma de validación dentro de un grupo de trabajo que usa el mismo tipo de información.
Las DTD se emplean generalmente para determinar la estructura de un documento mediante etiquetas XML o SGML.
Una DTD describe:
*Elementos: indican qué etiquetas son permitidas y el contenido de dichas etiquetas.
*Estructura: indica el orden en que van las etiquetas en el documento.
*Anidamiento: indica qué etiquetas van dentro de otras.
Su función es la descripción del formato de datos, para usar un formato común y mantener la consistencia entre todos los documentos que utilicen la misma DTD. De esta forma, dichos documentos, pueden ser validados, conocen la estructura de los elementos y la descripción de los datos que trae consigo cada documento, y pueden además compartir la misma descripción y forma de validación dentro de un grupo de trabajo que usa el mismo tipo de información.
Las DTD se emplean generalmente para determinar la estructura de un documento mediante etiquetas XML o SGML.
Una DTD describe:
*Elementos: indican qué etiquetas son permitidas y el contenido de dichas etiquetas.
*Estructura: indica el orden en que van las etiquetas en el documento.
*Anidamiento: indica qué etiquetas van dentro de otras.
7.3.2 ESQUEMAS XML
El esquema XML es un lenguaje de esquema más sofisticado. Soluciona alguno de los inconvenientes de las DTD.
En otras palabras, un esquema XML es un documento XML. Esto significa que se puede procesar un esquema igual que cualquier otro documento. Por ejemplo, se puede escribir una hoja de estilo XSLT que invierta un esquema XML en un formulario Web completo con código java script generado automáticamente que valide los datos conforme se vayan introduciendo.
Los esquemas XML Soportan:
*Declaración de tipos de valores.
*Enteros, cadenas, etc.
*Restricciones de valores mínimos/máximos.
*Tipos definidos por el usuario.
*Tipos específicos mediante la restricción de otros tipos.
*Extensión de tipos complejos mediante una especie de “herencia”.
*Restricciones de unicidad y claves ajenas.
En otras palabras, un esquema XML es un documento XML. Esto significa que se puede procesar un esquema igual que cualquier otro documento. Por ejemplo, se puede escribir una hoja de estilo XSLT que invierta un esquema XML en un formulario Web completo con código java script generado automáticamente que valide los datos conforme se vayan introduciendo.
Los esquemas XML Soportan:
*Declaración de tipos de valores.
*Enteros, cadenas, etc.
*Restricciones de valores mínimos/máximos.
*Tipos definidos por el usuario.
*Tipos específicos mediante la restricción de otros tipos.
*Extensión de tipos complejos mediante una especie de “herencia”.
*Restricciones de unicidad y claves ajenas.
7.4 consulta y transformación

Debido al número de aplicaciones que usan XML para intercambiar, transmitir y almacenar datos, las herramientas para una gestión efectiva de datos XML están siendo cada vez más importantes.
En particular las herramientas para consultar y transformar los datos XML son esenciales para extraer información de grandes cuerpos de datos XML y para convertir los datos entre distintas representaciones (esquemas) en XML. Al igual que la salida de una consulta relacional es una relación, la salida de una consulta XML puede ser un documento XML.
En particular las herramientas para consultar y transformar los datos XML son esenciales para extraer información de grandes cuerpos de datos XML y para convertir los datos entre distintas representaciones (esquemas) en XML. Al igual que la salida de una consulta relacional es una relación, la salida de una consulta XML puede ser un documento XML.
Suscribirse a:
Comentarios (Atom)