Guide d'annotation

De TimeUsage
Révision datée du 27 avril 2018 à 13:51 par Alix (discussion | contributions) (organization)
Aller à : navigation, rechercher

Cette page rassemble des éléments pour guider l'annotation des sources dans Transkribus ainsi qu'un certain nombre de questions méthodologiques.

Remarques générales

Sélectionner le texte

Appliquer un tag

Faire un commentaire

Tags du projet Time Us

Tableau récapitulatif

Tag Propriété Usage
TU_adresse Mot ou groupe de mots désignant une adresse postale
date Date explicite en chiffres ou en lettres
TU_document type Titre de document de différents types
TU_duree Mot ou groupe de mots désignant une durée pour une travail ou un événement
TU_heure Mot ou groupe de mots désignant un horaire
TU_incertitude Mot ou groupe de mots problématique pour l'annotation
TU_montant type Montant exprimé en lettres et/ou en chiffres
TU_occupation normal Mot ou groupe de mots désignant un métier ou une occupation en rapport avec l'industrie du textile.
organization Mot ou groupe de mots désignant un établissement ou une organisation
TU_personne sex Nom(s) d'une personne
place Nom de lieu
TU_produit Mot ou groupe de mots désignant
TU_remuneration Groupe de mots désignant une rémunération
TU_statutMatrimonial Mot ou groupe de mots désignant le statut matrimonial d'une personne
TU_tache Mot, nom ou verbe, ou groupe de mots désignant une tâche salariale ou domestique
TU_typeRemuneration type Mot ou groupe de mots désignant la nature d'une rémunération

TU_adresse

Règle

Le tag "TU_adresse" doit être utilisé pour identifier les informations de type adresse en particulier les adresses postales. On n'utilisera pas ce tag mais le tag "Place" (voir plus bas) pour identifier les noms de lieux.

Exemples

Annotation correcte Commentaires
1 Phrase Commentaire
2 Phrase Commentaire
  • Maison Schutz, Salle Bichommier, Avenue des Tapis, 1

date

Règle

Le tag "date" doit être utilisé pour identifier des dates exprimées en chiffres ou en lettres. On n'identifie pas les éléments de datation de type "hier", "aujourd'hui", etc.

Exemples

Annotation correcte Commentaires
1 Phrase Commentaire
2 Phrase Commentaire
  • une date : (à venir)...

TU_document

Règles

Le tag "TU_document" doit être utilisé pour identifier des références à des documents existants, comme par exemple un article de journal, une loi, un règlement, etc. La propriété type de ce tag doit être remplie afin de préciser de quel type de document il s'agit. En cas de doute, on préfère ne pas remplir la propriété type.

Liste des valeurs possibles pour la propriété type (cette liste sera complétée en fonction des cas rencontrés) :

presse loi tarif règlement ...

Exemples

Annotation correcte Commentaires
1 Phrase Commentaire
2 Phrase Commentaire
  • La Maison Chavent (art façonné) s'est rendue aux justes réclamations des tisseurs ; elle a accepté le tarif de 85, en son entier.

TU_duree

Règle

Le tag "TU_duree" doit être utilisé pour identifier des mots ou groupes de mots faisant référence à une durée soit pour une tâche précise, soit pour un événement précis.

Exemples

Annotation correcte Commentaires
1 Phrase Commentaire
2 Phrase Commentaire
  • une durée : (à venir)...

TU_heure

Règles

Le tag "TU_heure" doit être utilisé pour identifier une référence à un horaire rythmant notamment la vie des ouvriers du textile.


Exemples

Annotation correcte Commentaires
1 Phrase Commentaire
2 Phrase Commentaire
  • Il invite les grévistes à se réunir aujourd'hui à 2heures de l'après-midi

TU_incertitude

Règle

Le tag "TU_incertitude" permet à l'annotateur.ice de signaler un cas problématique dans l'annotation : une hésitation sur le tag à employer, sur la zone à sélectionner, sur la nécessité de tagger le passage. Une bonne pratique de signalement consiste à accompagner l'utilisation de ce tag d'un commentaire expliquant le problème rencontré.

Exemples

Annotation correcte Commentaires
1 Phrase Commentaire
2 Phrase Commentaire
  • un problème d'annotation : (à venir)...

TU_montant

Règle

Le tag "TU_montant" doit être utilisé pour identifier la mention d'un montant dans le cadre d'une rémunération. Ce montant peut se référer ou non à une rémunération financière. On essaiera autant que possible de préciser si ce montant est exprimé de manière absolue ou relative en remplissant la propriété type. En cas de doute, on préfère ne pas remplir la propriété type

Liste des valeurs possibles pour la propriété type :

relatif absolu

Exemples

Annotation correcte Commentaires
1 Phrase Commentaire
2 Phrase Commentaire
  • Moyenne du salaire journalier des 10 plus mauvaises ouvrières, 2fr. 26c. pendant le mois dernier.

TU_occupation

Règle

Le tag "Tu_occupation" doit être utilisé pour identifier un métier ou une occupation. On veillera à sélectionner la totalité de l'expression désignant le métier ou l'occupation. On veillera cependant à ne pas annoter les fonctions comme "Commissaire général" ou encore "président" ou "secrétaire (général)". La propriété normal doit être remplie avec l'expression normalisée de ce métier ou de cette occupation dans le cas ou la tournure de la phrase rendrait impossible l'encodage de la totalité de la mention du métier.

Exemples

Annotation correcte Commentaires
1 Phrase Commentaire
2 Phrase Commentaire
  • Une réunion privée des ouvriers et ouvrières du tissage mécanique a eu lieu hier,

organization

Règle

Le tag "organization" doit être utilisé pour identifier les établissement et organisations comme les usines, les chambres syndicales, etc. Ce tag peut être accompagné du tag "personne" ou du tag "occupation" lorsque l'organisation contient le nom d'une personne ou fait référence à un métier.

Exemples

Annotation correcte Commentaires
1 Phrase Commentaire
2 Phrase Commentaire
  • Une gréviste de la Maison Gindre
  • Une gréviste de la Maison Gindre
  • La continuation de la mise à l'index des Maison Algoud, frères et Coté, Ducoté et Cie.

TU_personne

Le tag "TU_personne" doit être utilisé pour identifier des personnes généralement mentionnées par leur nom. Le tag porte sur la totalité de l'identité de la personne, pas uniquement sur son patronyme. La propriété sex peut être utilisée pour préciser le genre de la personne lorsque cela n'est pas explicite.

Exemples :

  • M. Gindre lui aurait répondu qu'elle pouvait reprendre le travail si ça lui faisait plaisir

Place

Le tag "place" doit être utilisé pour identifier un lieu. Le tag porte sur la totalité des mots qui désignent le lieu annoté. Il ne sert pas à identifier les adresses, car c'est le rôle du tag "adresse". Dans certains cas, un établissement peut également être considéré comme un lieu : on laisse à l'annotateur le soin de trancher ce qui fait le plus sens dans la phrase ; il est cependant possible de combiner les tags "place" et "organization" sur une même sélection.

Exemples :

  • Place de la Croix-Rousse. 4 dans une des salles du café Verdior.

TU_produit

Le tag "TU_produit" doit être utilisé pour identifier un produit, qu'il s'agisse d'un produit fini ou dans un état intermédiaire, le plus souvent dans le cadre d'une rémunération.

Exemples :

  • Les chefs d'atelier de cette Maison ont fait tout ce qu'il était possible de faire et ils sont arrivés à lui faire accepter le tarif de 1885, en ce qui concerne les façonnés.

TU_remuneration

Le tag "TU_remuneration" doit être utilisé pour identifier une partie d'une phrase contenant des informations sur une rémunération. Les rémunérations étant exprimées d'une manière très diverse en fonction des documents, ce tag est un tag général qui permet de localiser un ensemble d'information qui peuvent par ailleurs être difficile à annoter. En complément du tag "TU_remuneration", on utilisera autant que possible le tag "TU_typeRemuneration", et les tags "Tu_duree", "TU_montant", "TU_produit" et "TU_tache", car ils permettent de préciser les différents éléments qui compose la rémunération.

Exemples :

  • si les ouvrières [...] avaient su toucher 1f50 par jour

TU_statutMatrimonial

Le tag "TU_statutMatrimonal" doit être utilisé pour identifier les titres et expressions qui permettent d'identifier le statut matrimonial des personnes, en particulier des femmes.

Exemples :

  • Le Sieur Simon, rédacteur, au Journal "Le Peuple" a également annoncé à l'assemblée qu'une somme de 500 francs serait fournie par son journal aux grévistes.

TU_tache

Le tag "TU_tache" doit être utilisé pour identifier un mot ou un groupe de mots évoquant une action ou une tâche se rapportant au textile dans un contexte domestique ou salarial.

Exemples :

  • une tache : (à venir)...

TU_typeRemuneration

Le tag "TU_typeRemuneration" doit être utilisé pour identifier une expression précisant le type d'une rémunération. La propriété type permet de classer le type de rémunération en fonction d'une liste pré-établie.

Liste des valeurs possibles de la propriété type (cette liste sera complétée en fonction des cas rencontrés) :

avance solde total indemnité_judiciaire indemnité_syndicale solidarité

Exemples :

  • Les fabricants se sont montrés favorables à une augmentation immédiate des prix de façon
  • elle ne veut accorder qu'une augmentation de 15% sur les pièces en cours et ne donne le tarif de 1885, qu'après l'achèvement de ces pièces.