Afin de bien comprendre la structure de l'EAD, et de progresser dans son utilisation, il est nécessaire de posséder certaines connaissances en XML.
Le XML (Extensible Markup Language) est un langage de balisage étendu, développé par le World Wide Web Consortium (W3C [1]). Un document XML est un ensemble d'informations textuelles structurées dans un modèle arborescent d'éléments délimités par des balises.
Les éléments définissent un contenu sémantique. Ils peuvent contenir d’autres éléments (il est ainsi possible de regrouper des informations de même nature) et/ou des données textuelles. Des attributs, accompagnés d'une valeur permettent de qualifier les éléments. Les attributs permettent ainsi de donner des informations sur la nature de l'élément et facilitent l'exploitation informatique.
La structure du contenu de l'élément, et encore davantage la valeur des attributs, sont soumises à certaines règles :
Le XML est un langage aux règles strictes. Par exemple, à l'inverse de ce qui était admis dans les versions initiales de HTML, tout balise ouvrante doit être accompagnée d'une balise fermante. Un document XML bien formé doit se conformer à des exigences précises :
Exemple de document XML bien formé :
<?xml version="1.0" encoding="utf-8"?>
<notice>
<cote type="actuelle">Mss. M. 1001-2800</cote>
<cote type="ancienne">Mont. 1-1864</cote>
<intitule>Fonds Montesquieu</intitule>
<date>1201-1900</date>
<descriptionPhysique>
<importanceMaterielle>1800 manuscrits</importanceMaterielle>
</descriptionPhysique>
<producteur>
<nomPersonne normal="Montesquieu, Charles-Louis de Secondat (1689-1755 ; baron de La Brède et de)">Montesquieu </nomPersonne>
</producteur>
<!-- Ceci est un commentaire, qui n'est pas parsé par le validateur -->
<acquisition>Achats, dons, legs et dation</acquisition>
<acces>Consultation dans la salle de la Réserve uniquement</acces>
<note> Fonds consacré à Montesquieu : livres et manuscrits du philosophe, archives de la seigneurie de La Brède dont les plus anciennes pièces remontent au XIIIe siècle.</note>
</notice>
Un document XML « valide » est un document XML bien formé, qui de surcroît est conforme à une DTD ou à un schéma. Cette validité est vérifiable grâce à un outil logiciel appelé parseur, présent dans les navigateurs Internet et dans les éditeurs XML.
Une DTD (Définition de type de document) fournit à la fois le vocabulaire et la syntaxe nécessaires pour exploiter les potentialités de l'XML :
Les DTD laissent de plus en plus la place à des schémas, qui sont eux aussi des langages de descriptions de documents XML, et qui présentent des avantages supplémentaires :
Les schémas sont définis selon deux modalités principales :
Le schéma EAD 2002, créé en 2007 à partir de la DTD EAD 2002, existe dans ces deux formats.
Autres points notables :
Une présentation détaillée du XML se trouve dans le document ci-dessous.
Il existe aussi un j.e-cours proposé par l'ABES [4].
Liens
[1] http://www.w3.org
[2] http://www.bonnespratiques-ead.net/guide/annexes/FT-indexation
[3] http://bonnespratiques-ead.net/sites/default/files/xml_-_elements_de_base.pdf
[4] http://moodle.abes.fr/mod/resource/view.php?id=929