Guide d'annotation

De TimeUsage
Révision datée du 27 avril 2018 à 16:33 par Alix (discussion | contributions) (Sélectionner le texte)
Aller à : navigation, rechercher

Cette page rassemble des éléments pour guider l'annotation des sources dans Transkribus ainsi qu'un certain nombre de questions méthodologiques.

Remarques générales

Sélectionner le texte

Lors de l'application d'un tag dans Transkribus, il est fondamental de respecter quelques règles afin d'optimiser l'annotation des textes.

1. La portion de texte sélectionnée ne doit pas inclure les signes de ponctuations et les espaces situés de part et d'autre du mot ou du groupe de mots annoté. Si la ponctuation se trouve à l'intérieur de la sélection, dans une locution ou dans une adresse par exemple, elle fait bien légitimement partie du groupe de mot sur lequel porte l'annotation.

2. La portion de texte sélectionnée ne doit pas inclure les déterminants précédent le mot ou le groupe de mots annoté.

Select-1.png La sélection inclut uniquement le texte sur lequel doit porter l'annotation.
Select-2.png Cette sélection n'est pas bonne car elle intègre un déterminant inutile dans le groupe de mots annoté.
Select-3.png Cette sélection n'est pas bonne car elle inclut l'espace qui précède le mot sur lequel porte l'annotation.
Select-4.png Cette sélection n'est pas bonne car elle inclut la virgule qui suit le mot sur lequel porte l'annotation.

3. La portion de texte sélectionnée doit être la plus correcte possible : elle ne doit pas inclure plus de mots que nécessaires, mais elle doit contenir l'ensemble des éléments du groupe de mot qui constituent l'entité identifiée.

Select-5.png Cette sélection n'est pas bonne car elle ne prend qu'un seul mot en compte alors qu'il fait partie d'une groupe de mots formant une entité.
Select-6.png Cette sélection n'est pas bonne car elle ne prend pas tous les mots du groupe formant une entité.
Select-7.png Cette sélection est correcte car elle prend en compte la totalité de l'expression formant une entité et permet d'avoir une dénomination la plus précise possible.
Select-8.png Cette sélection est correction car elle prend en compte la totalité de l'expression formant une entité ; on perdrait des informations en n'intégrant pas "ouvriers" dans la sélection, de même si on ignorait "du tissage mécannique".

Appliquer un tag

Pour appliquer un tag dans Transkribus, il est nécessaire de sélectionner, dans le cadre supérieur gauche de l'interface, l'onglet "metadata" puis "Textual" (1). Il faut ensuite se positionner dans la zone de transcription, c'est-à-dire dans le cadre inférieur droit de l'application, et sélectionner le texte sur lequel on souhaite appliquer un tag. Cette sélection peut s'étendre sur plusieurs lignes (2). Dans le cadre inférieur gauche, dans l'onglet Tag, sélectionner le tag à appliquer en cliquant sur le "+" vert qui lui correspond (3). Vous verrez alors apparaître le tag dans la liste de "Tags of current Transcript" en haut à gauche (4).

Tagging.png

Utiliser les propriétés

Certains tags ont des propriétés dont la complétion peut s'avérer nécessaire pour l'annotation des documents du projet Time Us. Attention cependant, tous les tags possèdent certaines propriétés telles que "length", "continued" et "offset" dont les valeurs ne peuvent pas être modifiées car elles sont remplies automatiquement par l'application.

Certains tags par défaut possèdent des propriétés qu'il n'est pas utile de renseigner dans le cadre du projet Time Us. L'existence de propriétés attachées à un tag n'est donc pas à interpréter comme une obligation pour l'annotateur.rice de remplir le champ en question. Il faut au contraire décider si cela est nécessaire en fonction des indications données dans ce guide d'annotation. Certaines propriétés ont vocation à être remplies avec des valeurs fixes dont la liste est donnée dans ce guide.

Pour accéder aux propriétés, il faut sélectionner le texte dans la zone de transcription, ou sélectionner le tag dans la liste "Tags of current Transcript" (1). Attention, lorsqu'un tag s'étend sur plusieurs lignes, il est multiplié par le nombre de lignes concernées dans la liste "Tag of current Transcript". Toutes ses propriétés ne seront accessibles qu'à partir de la dernière occurrence du tag dans la liste. Lorsque plusieurs tags sont appliqués à une même portion de texte, il est préférable d'utiliser l'accès par la liste des tags plutôt que par la zone de transcription.

Lorsque le tag souhaité est sélectionné, cliquez sur l'onglet "Properties" dans le cadre inférieur gauche (2). Cela fera apparaître la liste des propriétés du tag ainsi que leur valeur. Cliquez dans la zone de texte en face d'une propriété pour lui ajouter une valeur ou modifier celle-ci (3). Pour valider cette valeur, cliquez sur "Apply to selected" en bas du cadre (4) ou tapez "Entrée". Lorsque la valeur est bien enregistrée, celle-ci s'affiche dans la colonne "Properties" dans la liste "Tags of current Transcript". Si rien ne s'affiche, c'est que la valeur entrée n'a pas été prise en compte par Transkribus. Cela arrive, il suffit de recommencer. Il est parfois nécessaire de rafraîchir la liste en cliquant sur l'icône (6).

Tagging-properties.png

Faire un commentaire

Tags du projet Time Us

Tableau récapitulatif

Tag Propriété Usage
TU_adresse Mot ou groupe de mots désignant une adresse postale
date Date explicite en chiffres ou en lettres
TU_document type Titre de document de différents types
TU_duree Mot ou groupe de mots désignant une durée pour une travail ou un événement
TU_heure Mot ou groupe de mots désignant un horaire
TU_incertitude Mot ou groupe de mots problématique pour l'annotation
TU_montant type Montant exprimé en lettres et/ou en chiffres
TU_occupation normal Mot ou groupe de mots désignant un métier ou une occupation en rapport avec l'industrie du textile.
organization Mot ou groupe de mots désignant un établissement ou une organisation
TU_personne sex Nom(s) d'une personne
place Nom de lieu
TU_produit Mot ou groupe de mots désignant
TU_remuneration Groupe de mots désignant une rémunération
TU_statutMatrimonial Mot ou groupe de mots désignant le statut matrimonial d'une personne
TU_tache Mot, nom ou verbe, ou groupe de mots désignant une tâche salariale ou domestique
TU_typeRemuneration type Mot ou groupe de mots désignant la nature d'une rémunération

TU_adresse

Règle

Le tag "TU_adresse" doit être utilisé pour annoter une adresse postale plus ou moins complète.

Une rue, avec ou sans numéro, peut être considérée comme une adresse postale.

Si une rue est accompagnée d'un numéro, on inclut toujours le numéro dans la sélection.

Si un nom de lieu est évoqué à proximité d'une adresse dans le texte, on n'inclut pas le nom du lieu dans la sélection pour le tag "TU_adresse".

Exemples

Annotation correcte Commentaires
1 Maison Schutz, Salle Bichommier, Avenue des Tapis, 1 L'annotation de l'adresse porte uniquement sur "Avenue des Tapis, 1" : on n'inclut pas le nom de la salle, ni le nom de l'organisation en lien avec cette adresse.
2 au siège du Syndicat ouvrier des tisseurs et similaires 8, rue d'Austerlitz L'annotation de l'adresse porte uniquement sur "8, rue d'Austerlitz" : on n'inclut pas le nom du lieu en lien avec cette adresse.
3 quatre Maisons de fabriques, savoir les Maisons : Atuyer, place Tolozan, 20 et 23 ; Schulz, rue du Griffon, 8 ; Béraud, place Tolozan, 18 : Tresca, frères, rue du Griffon, 8. La première adresse peut poser problème puisqu'elle inclut deux numéros, dans ce cas, dans la mesure où l'adresse est celle d'un seul établissement, on inclut les deux numéros dans la sélection : "place Tolozan, 20 et 23".

date

Règle

Le tag "date" doit être utilisé pour annoter une date absolue exprimée en chiffres et/ou en lettres.

On annote une date lorsqu'elle est constituée d'une année seulement, ou bien d'un mois et une année, ou encore d'un jour, un mois et une année.

On n'identifie pas les expressions comme "hier", "aujourd'hui", qui sont des dates relatives au contexte.

Pour des intervalles de date, on annote les deux dates séparément.

Dans la mesure du possible, on n'annote pas les dates qui font partie d'un titre de document ou d'une expression désignant une organisation, un événement ou un lieu.

Exemples

Annotation correcte Commentaires
1 la mon Bejui accepte la moité du tarif de 1885, à partir du 26 Décembre 1894. Cas typique d'annotation de la date.
2 Les soussignés ont l'honneur de vous informer qu'ils organisent une réunion publique à la Brasserie Française, rue des Ecoles, le Mardi 18 décembre à 8 heures

du soir

Faut-il annoter cette date, vu qu'il n'y a pas d'année ?
3 la réunion publique tenue le 20 courant à la Croix-Rousse On n'annote pas cette date car sa résolution est dépendante du contexte

TU_document

Règles

Le tag "TU_document" doit être utilisé pour identifier des références à des documents existants, comme par exemple un article de journal, une loi, un règlement, etc. La propriété type de ce tag doit être remplie afin de préciser de quel type de document il s'agit. En cas de doute, on préfère ne pas remplir la propriété type.

Liste des valeurs possibles pour la propriété type (cette liste sera complétée en fonction des cas rencontrés) :

presse loi tarif règlement ...

Exemples

Annotation correcte Commentaires
1 Phrase Commentaire
2 Phrase Commentaire
  • La Maison Chavent (art façonné) s'est rendue aux justes réclamations des tisseurs ; elle a accepté le tarif de 85, en son entier.

TU_duree

Règle

Le tag "TU_duree" doit être utilisé pour identifier des mots ou groupes de mots faisant référence à une durée soit pour une tâche précise, soit pour un événement précis.

Exemples

Annotation correcte Commentaires
1 Phrase Commentaire
2 Phrase Commentaire
  • une durée : (à venir)...

TU_heure

Règles

Le tag "TU_heure" doit être utilisé pour identifier une référence à un horaire rythmant notamment la vie des ouvriers du textile.


Exemples

Annotation correcte Commentaires
1 Phrase Commentaire
2 Phrase Commentaire
  • Il invite les grévistes à se réunir aujourd'hui à 2heures de l'après-midi

TU_incertitude

Règle

Le tag "TU_incertitude" permet à l'annotateur.ice de signaler un cas problématique dans l'annotation : une hésitation sur le tag à employer, sur la zone à sélectionner, sur la nécessité de tagger le passage. Une bonne pratique de signalement consiste à accompagner l'utilisation de ce tag d'un commentaire expliquant le problème rencontré.

Exemples

Annotation correcte Commentaires
1 Phrase Commentaire
2 Phrase Commentaire
  • un problème d'annotation : (à venir)...

TU_montant

Règle

Le tag "TU_montant" doit être utilisé pour identifier la mention d'un montant dans le cadre d'une rémunération. Ce montant peut se référer ou non à une rémunération financière. On essaiera autant que possible de préciser si ce montant est exprimé de manière absolue ou relative en remplissant la propriété type. En cas de doute, on préfère ne pas remplir la propriété type

Liste des valeurs possibles pour la propriété type :

relatif absolu

Exemples

Annotation correcte Commentaires
1 Phrase Commentaire
2 Phrase Commentaire
  • Moyenne du salaire journalier des 10 plus mauvaises ouvrières, 2fr. 26c. pendant le mois dernier.
  • Leur salaire personnel varie de 1f50 à 2f50 par jour pour tous les articles courants
  • La mon Ritton. Bardon, accepte le tarif fe 1885 avec réserves sur les beugalines et petits taffetas, articles qu'elle s'engage à payer 0f05 de plus que toutes ses concurentes

TU_occupation

Règle

Le tag "Tu_occupation" doit être utilisé pour identifier un métier ou une occupation. On veillera à sélectionner la totalité de l'expression désignant le métier ou l'occupation. On veillera cependant à ne pas annoter les fonctions comme "Commissaire général" ou encore "président" ou "secrétaire (général)". La propriété normal doit être remplie avec l'expression normalisée de ce métier ou de cette occupation dans le cas ou la tournure de la phrase rendrait impossible l'encodage de la totalité de la mention du métier.

Exemples

Annotation correcte Commentaires
1 Phrase Commentaire
2 Phrase Commentaire
  • Une réunion privée des ouvriers et ouvrières du tissage mécanique a eu lieu hier,

organization

Règle

Le tag "organization" doit être utilisé pour identifier les établissement et organisations comme les usines, les chambres syndicales, etc. Ce tag peut être accompagné du tag "personne" ou du tag "occupation" lorsque l'organisation contient le nom d'une personne ou fait référence à un métier.

Exemples

Annotation correcte Commentaires
1 Phrase Commentaire
2 Phrase Commentaire
  • Une gréviste de la Maison Gindre
  • Une gréviste de la Maison Gindre
  • La continuation de la mise à l'index des Maison Algoud, frères et Coté, Ducoté et Cie.

TU_personne

Règle

Le tag "TU_personne" doit être utilisé pour identifier des personnes généralement mentionnées par leur nom. Le tag porte sur la totalité de l'identité de la personne, pas uniquement sur son patronyme. La propriété sex peut être utilisée pour préciser le genre de la personne lorsque cela n'est pas explicite.

Exemples

Annotation correcte Commentaires
1 Phrase Commentaire
2 Phrase Commentaire
  • M. Gindre lui aurait répondu qu'elle pouvait reprendre le travail si ça lui faisait plaisir
  • Monsieur le Préfet du Rhône

Place

Règle

Le tag "place" doit être utilisé pour identifier un lieu. Le tag porte sur la totalité des mots qui désignent le lieu annoté. Il ne sert pas à identifier les adresses, car c'est le rôle du tag "adresse". Dans certains cas, un établissement peut également être considéré comme un lieu : on laisse à l'annotateur le soin de trancher ce qui fait le plus sens dans la phrase ; il est cependant possible de combiner les tags "place" et "organization" sur une même sélection.

Exemples

Annotation correcte Commentaires
1 Phrase Commentaire
2 Phrase Commentaire
  • Place de la Croix-Rousse. 4 dans une des salles du café Verdior.

TU_produit

Règle

Le tag "TU_produit" doit être utilisé pour identifier un produit, qu'il s'agisse d'un produit fini ou dans un état intermédiaire, le plus souvent dans le cadre d'une rémunération.

Exemples

Annotation correcte Commentaires
1 Phrase Commentaire
2 Phrase Commentaire
  • Les chefs d'atelier de cette Maison ont fait tout ce qu'il était possible de faire et ils sont arrivés à lui faire accepter le tarif de 1885, en ce qui concerne les façonnés.
  • La mon Ritton. Bardon, accepte le tarif fe 1885 avec réserves sur les beugalines et petits taffetas, articles qu'elle s'engage à payer 0f05 de plus que toutes ses concurentes

TU_remuneration

Règle

Le tag "TU_remuneration" doit être utilisé pour identifier une partie d'une phrase contenant des informations sur une rémunération. Les rémunérations étant exprimées d'une manière très diverse en fonction des documents, ce tag est un tag général qui permet de localiser un ensemble d'information qui peuvent par ailleurs être difficile à annoter. En complément du tag "TU_remuneration", on utilisera autant que possible le tag "TU_typeRemuneration", et les tags "Tu_duree", "TU_montant", "TU_produit" et "TU_tache", car ils permettent de préciser les différents éléments qui compose la rémunération.

Exemples

Annotation correcte Commentaires
1 Phrase Commentaire
2 Phrase Commentaire
  • si les ouvrières [...] avaient su toucher 1f50 par jour

TU_statutMatrimonial

Règle

Le tag "TU_statutMatrimonal" doit être utilisé pour identifier les titres et expressions qui permettent d'identifier le statut matrimonial des personnes, en particulier des femmes.

Exemples

Annotation correcte Commentaires
1 Phrase Commentaire
2 Phrase Commentaire
  • Le Sieur Simon, rédacteur, au Journal "Le Peuple" a également annoncé à l'assemblée qu'une somme de 500 francs serait fournie par son journal aux grévistes.

TU_tache

Règle

Le tag "TU_tache" doit être utilisé pour identifier un mot ou un groupe de mots évoquant une action ou une tâche se rapportant au textile dans un contexte domestique ou salarial.

Exemples

Annotation correcte Commentaires
1 Phrase Commentaire
2 Phrase Commentaire
  • une tache : (à venir)...

TU_typeRemuneration

Règle

Le tag "TU_typeRemuneration" doit être utilisé pour identifier une expression précisant le type d'une rémunération. La propriété type permet de classer le type de rémunération en fonction d'une liste pré-établie.

Liste des valeurs possibles de la propriété type (cette liste sera complétée en fonction des cas rencontrés) :

avance solde total indemnité_judiciaire indemnité_syndicale solidarité

Exemples

Annotation correcte Commentaires
1 Phrase Commentaire
2 Phrase Commentaire
  • Les fabricants se sont montrés favorables à une augmentation immédiate des prix de façon
  • elle ne veut accorder qu'une augmentation de 15% sur les pièces en cours et ne donne le tarif de 1885, qu'après l'achèvement de ces pièces.