Text only | Skip links
Skip links||IT Services, University of Oxford

1. Personnalisation des schémas TEI

  • TEI au-dessous de la capote
  • Construction d'un schéma TEI
  • Personnalisation de la TEI
  • Exploration des TEI Guidelines

2. Reprise terminologique

  • Le système TEI comprend plusieurs modules
  • Chaque module comprend plusieurs spécifications d'élément
  • Chaque spécification comprend:
    • un nom canonique (<gi>) en anglais pour l'élément et facultativememt des noms équivalents en d'autre langues
    • une description canonique de sa fonction ou mode d'emploi (facultativement traduite en d'autre langues) function
    • une déclaration pour chacune des classes auxquelles il appartient
    • une définition pour chacun de ses attributss
    • une définition de son modele de contenu
    • des exemples d'usage, des notes, des liens
  • une spécification de schéma TEI (<schemaSpec>) se fait par une sélection de modules ou d'éléments, avec (eventuellement) des modifications
  • un document TEI qui contient une spécification de schema s'appelle (informellement!) un ODD (One Document Does it all)

3. Qu'est-ce que c'est qu'un module?

  • Une manière convenable de regrouper un ensemble de déclarations d'éléments
  • D'habitude (mais pas forcément) associés avec champs de travail ou topos specifique
  • La plupart des chapitres de P5 fournissent la définition d'un seul module
  • On crée un schéma TEI en selectionnant des modules, et en supprimant ou en selectionnant des éléments spécifiques de ces modules

4. Liste des modules

Nom des module chapitre
analysis Simple Analytic Mechanisms
certainty Certainty and Responsibility
core Éléments Available in All TEI Documents
corpus Language Corpora
dictionaries Dictionaries
drama Performance Texts
figures Tables, Formulae, and Graphics
gaiji Representation of Non-standard Characters and Glyphs
header The TEI Header
iso-fs Feature Structures
linking Linking, Segmentation, and Alignment
msdescription Manuscript Description
namesdates Names, Dates, People, and Places
nets Graphs, Networks, and Trees
spoken Transcriptions of Speech
tagdocs Documentation Éléments
tei The TEI Infrastructure
textcrit Critical Apparatus
textstructure Default Text Structure
transcr Representation of Primary Sources
verse Verse

5. Comment choisir?

  • On peut tout choisir! (pas vraiment une bonne idée)
  • On peut partir d'une selection prédéfinie (TEI Lite, TEI Bare...)
  • On peut faire artisanal -- selon les besoins spécifique de son projet

Dans ce dernier cas, il faut prendre conscience de toutes les possibilités disponibles...

Roma
un logiciel en ligne qui simplifie cette procedure

http://www.tei-c.org/Roma/

6. Un cas d'étude: la carte postale

Supposons qu'on a proposé un ANR pour la numérisation et transcription d'une collection gigantesque de cartes postales. Comment on va créer un schéma apte à gérer des centaines de choses comme celles-ci?

7. Une carte postale

8. Une carte postale

9. Une autre carte postale

10. Quelles sont les éléments significatifs, qu'il faut absolument distinguer dans notre encodage?

  • image
  • oblitération
  • partie imprimée
  • message(s) écrit(s)
  • destinataire(s)
  • metadonnées à volonté
  • ...

11. Propositions

On va commencer en structurant chaque carte en divisions de type variés:
  • recto : la surface qui porte l'image (normalement)
  • verso : la surface qui porte (normalement) le message
Ensuite, on observe que on pourrait avoir indifférement sur ces deux surfaces d'autres sous-divisions telles:
  • le message
  • le destinataire
  • l'oblitération

12. Première proposition d'encodage

<carte n="0010">
 <recto url="Sables-olonne_recto_v.jpg"/>
 <verso url="Sables-olonne_verso_v.jpg">
  <obliteration>
   <date>26-07-1967</date>
   <lieu>Les Sables d'Olonne, Vendée</lieu>
  </obliteration>
  <message>
   <p>Bientôt sur le chemin du retour avons eu du beau temps, tout le
       mois de juillet. Vous souhaite à tous la même chose. J'espère que vous
       êtes tous en bonne santé – A chacun son tour, le bon temps et le
       repos. Avec d'affectueuses pensées et bons baises à tous. Marcelle
   </p>
  </message>
  <destinataire>Mme Veyssade Lucienne
     31, rue du Président Kennedy
     ALFORTVILLE
     Val de Marne
  </destinataire>
 </verso>
</carte>

13. Commentaire

  • On ne s'est pas servi du vocabulaire TEI: donc on aura de mal à expliquer cet encodage à des non francophones, ou de partager nos travaux avec des autres.
  • On n'a pas mis en evidence tout ce qui pourrait nous interesser de point de vue patrimoniale, par exemple les ratures, les retours à ligne, les noms de personnes ou de lieux, les aspects linguistiques, les metadonnées ...
  • Pour ajouter de telles choses on doit inventer encore de vocabulaire... ce qui gaspille un peu notre temps, vue que la TEI l'a déjà fait...

14. Proposition TEI

On traite chaque carte comme un <text>

On traite chaque division comme un <div type="[fonction]">

Les noms de lieux seront balisés avec <placeName>, les noms de personnes avec <persName>, et les addresses avec <address> (qui regroupe des <addrLine>)

En plus, on se servira de <del> (pour les ratures), <add> (pour les ajouts), <reg> (pour les regularisations), <lb> pour les retours a ligne, <p> pour les paragraphes, <list> et <item> pour les listes, <hi> pour les mots ou phrases mises en evidence.

On aura egalement besoin de l'attribut facs pour associer une partie de texte avec son image numerise, et des balises <figure> et <graphic> pour signaler les images.

Est-ce que cela servira?



TEI@Oxford. Date: 2011-01
Copyright University of Oxford