Guide d'annotation : Différence entre versions

De TimeUsage
Aller à : navigation, rechercher
(Utilisation des Tags)
Ligne 1 : Ligne 1 :
 
Cette page rassemble des éléments pour guider l'annotation des sources dans Transkribus et rassembler un certain nombre de questions méthodologiques.  
 
Cette page rassemble des éléments pour guider l'annotation des sources dans Transkribus et rassembler un certain nombre de questions méthodologiques.  
  
== Utilisation des Tags ==
+
== Tags Transkribus par défaut ==
 
Transkribus fournit des tags prédéfinis prévus pour les besoins de la transcription et pour rendre possible la création d'un index. Transkribus a fourni en 2015 un [https://transkribus.eu/Transkribus/docs/How%20to%20use%20TRANSKRIBUS-0.1.7.pdf manuel d'utilisation] qui donne des indications sur la majorité des tags prédéfinis et leurs usages. La section qui suit reprend des éléments de ce manuel, mais pas de manière exhaustive.  
 
Transkribus fournit des tags prédéfinis prévus pour les besoins de la transcription et pour rendre possible la création d'un index. Transkribus a fourni en 2015 un [https://transkribus.eu/Transkribus/docs/How%20to%20use%20TRANSKRIBUS-0.1.7.pdf manuel d'utilisation] qui donne des indications sur la majorité des tags prédéfinis et leurs usages. La section qui suit reprend des éléments de ce manuel, mais pas de manière exhaustive.  
  
=== Tags prédéfinis ===
+
=== Transcription du texte ===
 
{| class="wikitable alternance"
 
{| class="wikitable alternance"
|+ Transcription du texte
 
|-
 
 
  ! scope="col" | tag
 
  ! scope="col" | tag
 
  ! scope="col" | attribut(s)
 
  ! scope="col" | attribut(s)
Ligne 49 : Ligne 47 :
 
  |}
 
  |}
  
 +
=== Identification des entités ===
 
{| class="wikitable alternance"
 
{| class="wikitable alternance"
|+ Identification d'entités
 
|-
 
 
  ! scope="col" | tag
 
  ! scope="col" | tag
 
  ! scope="col" | attribut(s)
 
  ! scope="col" | attribut(s)
Ligne 88 : Ligne 85 :
 
* '''textStyle''' : qui sert cependant à l'annotation de l'apparence du texte transcrit.
 
* '''textStyle''' : qui sert cependant à l'annotation de l'apparence du texte transcrit.
  
Tous ces tags ne sont pas utile pour le projet TimeUs et leur utilisation peut être plus précise que celle prévue par l'équipe Transkribus. Voici une liste des principaux tags utilisés pour l'annotation des sources dans le projet TimeUs :
+
== Tags pour le projet TimeUs ==
  
 +
Tous ces tags ne sont pas utiles pour le projet TimeUs et leur utilisation peut être plus précise que celle prévue par l'équipe Transkribus. Voici une liste des principaux tags utilisés pour l'annotation des sources dans le projet TimeUs :
 +
 +
=== Tags prédéfinis ===
 
==== Person ====
 
==== Person ====
 
Le tag "Person" doit servir à identifier la mention d'une personne. Il ne se limite pas au signalement des patronymes. Précisions à venir.  
 
Le tag "Person" doit servir à identifier la mention d'une personne. Il ne se limite pas au signalement des patronymes. Précisions à venir.  

Version du 11 avril 2018 à 13:20

Cette page rassemble des éléments pour guider l'annotation des sources dans Transkribus et rassembler un certain nombre de questions méthodologiques.

Tags Transkribus par défaut

Transkribus fournit des tags prédéfinis prévus pour les besoins de la transcription et pour rendre possible la création d'un index. Transkribus a fourni en 2015 un manuel d'utilisation qui donne des indications sur la majorité des tags prédéfinis et leurs usages. La section qui suit reprend des éléments de ce manuel, mais pas de manière exhaustive.

Transcription du texte

tag attribut(s) TEI tag utilisation
Abbrev @expansion <abbrev> signale un mot abrégé
Add @place (localisation de l'ajout) <add> indique que du contenu a été ajouté sur le document par l'auteur ou par une autre personne
Gap supplied <gap> signale du texte omis ou illisible
Sic @correction <sic> signale une erreur évidente dans le texte
Speech @speaker <speaker> signale du discours direct
Supplied @reason <supplied> (non-TEI) signale une portion de texte fournie par le ou la transcripteur.se
Unclear @alternative, @reason <unclear> signale une portion illisible ou une lecture incertaine

Identification des entités

tag attribut(s) TEI tag utilisation
Blackening @comment <blackening> (non-TEI) signale des données sensibles qui ne peuvent être rendues publiques
Date @year, @month, @day <date> signale une entité de type date
Organization aucun <orgName> signale une organisation
Person @dateofDeath, @dateofBirth, @lastname, @firstname, @occupation @notize <persName> signale une personne
Place @country <placeName> signale une entité de type lieu

Trois tags ne sont pas documentés :

  • Div
  • Work : mais compte tenu des intentions de l'équipe Transkribus et des usages du terme, il s'agit très certainement de signaler une référence bibliographique.
  • textStyle : qui sert cependant à l'annotation de l'apparence du texte transcrit.

Tags pour le projet TimeUs

Tous ces tags ne sont pas utiles pour le projet TimeUs et leur utilisation peut être plus précise que celle prévue par l'équipe Transkribus. Voici une liste des principaux tags utilisés pour l'annotation des sources dans le projet TimeUs :

Tags prédéfinis

Person

Le tag "Person" doit servir à identifier la mention d'une personne. Il ne se limite pas au signalement des patronymes. Précisions à venir.

Organization

Le tag "Organization" doit servir à identifier la mention d'un établissement, d'une institution, etc, en lien avec l'industrie du textile. La sélection sur laquelle s'étend le tag doit contenir l'ensemble du nom de l'établissement. Précisions à venir.

Place

Le tag "Place" doit servir à identifier un lieu. La sélection sur laquelle s'étend le tag doit contenir le nom du lieu. On peut utiliser le tag "Address" en complément pour signaler la portion du tag contenu une adresse. Précisions à venir.

Tags ajoutés

typeRemuneration

Le tag "typeRemuneration" doit servir à signaler les informations concernant la rémunération des travailleurs du textile. Précision à venir.

Address

Précisions à venir.

Occupation (à venir)

Le tag "Occupation" doit servir à signaler les mentions de métier, de fonction ou d'occupation. Attention toutefois car toutes les occurrences de métier ne sont pas à annoter. Précisions à venir.

Exemple de la série AD69 9M5

La sous-série AD65 9M rassemble des documents concernant l'industrie de la soie et du textile (an VIII-1930). La côte 9M5 renvoie à un ensemble documentaire couvrant la période allant de 1894 à 1911. Elle commence par un dossier sur la crise de l'industrie du tissage lyonnais entre novembre 1894 et juillet 1895, composé d'enquêtes administratives sur la situation et les grèves. Partiellement transcrit et annoté, cet ensemble documentaire peut servir de base à partir de laquelle formuler une ébauche de guide pour l'annotation dans Transkribus dans le cadre du projet. La première analyse des choix d'annotation a donné lieu à un tableau récapitulatif qui se trouve ici. Cette section de l'article synthétise l'ensemble des remarques établies à cette occasion.

Corrections à apporter

  • Identification des noms de fabriques ou d'ateliers


  • Choix des informations à annoter


  • Oublis volontaires ou involontaire ?


Questions

  • Application de "TypeRemuneration"
  • Application de "Place"
  • Application de "Occupation" (actuellement "Work")
  • Application de "Person"
  • Annotation des informations sur le genre