Guide d'annotation

De TimeUsage
Révision datée du 11 avril 2018 à 13:03 par Alix (discussion | contributions) (Tags prédéfinis)
Aller à : navigation, rechercher

Cette page rassemble des éléments pour guider l'annotation des sources dans Transkribus et rassembler un certain nombre de questions méthodologiques.

Utilisation des Tags

Transkribus fournit des tags prédéfinis prévus pour les besoins de la transcription et pour rendre possible la création d'un index. Transkribus a fourni en 2015 un manuel d'utilisation qui donne des indications sur la majorité des tags prédéfinis et leurs usages. La section qui suit reprend des éléments de ce manuel.

Tags prédéfinis

Transcription du texte
tag attribut(s) TEI tag utilisation
Abbrev @expansion <abbrev> signale un mot abrégé
Add @place (localisation de l'ajout) <add> indique que du contenu a été ajouté sur le document par l'auteur ou par une autre personne
Gap supplied <gap> signale du texte omis ou illisible
Sic @correction <sic> signale une erreur évidente dans le texte
Speech @speaker <speaker> signale du discours direct
Supplied @reason <supplied> (non-TEI) signale une portion de texte fournie par le ou la transcripteur.se
Unclear @alternative, @reason <unclear> signale une portion illisible ou une lecture incertaine
Identification d'entités
tag attribut(s) TEI tag utilisation
Blackening @comment <blackening> (non-TEI) signale des données sensibles qui ne peuvent être rendues publiques
Date @year, @month, @day <date> signale une entité de type date
Organization aucun <orgName> signale une organisation
Person @dateofDeath, @dateofBirth, @lastname, @firstname, @occupation @notize <persName> signale une personne
Place @country <placeName> signale une entité de type lieu

Trois tags ne sont pas documentés :

  • Div
  • Work : mais compte tenu des intentions de l'équipe Transkribus et des usages du terme, il s'agit très certainement de signaler une référence bibliographique.
  • textStyle : qui sert cependant à l'annotation de l'apparence du texte transcrit.

Tags ajoutés

...

Exemple de la série AD69 9M5

La sous-série AD65 9M rassemble des documents concernant l'industrie de la soie et du textile (an VIII-1930). La côte 9M5 renvoie à un ensemble documentaire couvrant la période allant de 1894 à 1911. Elle commence par un dossier sur la crise de l'industrie du tissage lyonnais entre novembre 1894 et juillet 1895, composé d'enquêtes administratives sur la situation et les grèves. Partiellement transcrit et annoté, cet ensemble documentaire peut servir de base à partir de laquelle formuler une ébauche de guide pour l'annotation dans Transkribus dans le cadre du projet. La première analyse des choix d'annotation a donné lieu à un tableau récapitulatif qui se trouve ici. Cette section de l'article synthétise l'ensemble des remarques établies à cette occasion.

Corrections à apporter

  • Identification des noms de fabriques ou d'ateliers


  • Choix des informations à annoter


  • Oublis volontaires ou involontaire ?


Questions

  • Application de "TypeRemuneration"
  • Application de "Place"
  • Application de "Occupation" (actuellement "Work")
  • Application de "Person"
  • Annotation des informations sur le genre