Guide d'annotation : tags du projet Time Us

De TimeUsage
Aller à : navigation, rechercher

Cette page donne la liste des tags utilisés pour l'annotation des entités et des informations dans les documents du projet Time Us. Cette liste est classée par groupe de tags construits en fonction des types de données à annoter.

Pour installer l'ensemble des tags utiles à l'annotation dans Transkribus pour le projet Time Us, consultez la page Guide pour l'installation de la liste des tags Time Us.

Pour des informations sur l'annotation dans Transkribus en général et des éléments de méthodologie, consultez la page Guide d'annotation : remarques générales.

Tableau récapitulatif

Tag Propriété Usage
TU_adresse Mot ou groupe de mots désignant une adresse postale
date Date explicite en chiffres ou en lettres
TU_document type Titre de document de différents types
TU_duree Mot ou groupe de mots désignant une durée pour une travail ou un événement
TU_heure Mot ou groupe de mots désignant un horaire
TU_incertitude Mot ou groupe de mots problématique pour l'annotation
TU_montant subtype Montant exprimé en lettres et/ou en chiffres
TU_occupation normal Mot ou groupe de mots désignant un métier ou une occupation en rapport avec l'industrie du textile.
organization Mot ou groupe de mots désignant un établissement ou une organisation
TU_personne sex Nom(s) d'une personne
place Nom de lieu
TU_produit Mot ou groupe de mots désignant
TU_quantite unit Mot ou groupe de mots désignant une quantité matérielle
TU_remuneration Groupe de mots désignant une rémunération
TU_statut Mot ou groupe de mots désignant le statut social d'un·e travailleur·se
TU_statutMatrimonial Mot ou groupe de mots désignant le statut matrimonial d'une personne
TU_tache Mot, nom ou verbe, ou groupe de mots désignant une tâche salariale ou domestique
TU_typeRemuneration subtype Mot ou groupe de mots désignant la nature d'une rémunération

Problèmes d'annotation

"TU_incertitude"

Règle

Le tag "TU_incertitude" permet à l'annotateur·ice de signaler un cas problématique dans l'annotation.

Il est à utiliser en cas d'hésitation sur le tag à employer, sur la zone à sélectionner ou sur la nécessité d'annoter un passage, etc.

Une bonne pratique de signalement consiste à accompagner l'utilisation de ce tag d'un commentaire expliquant le problème rencontré ou la raison de l'hésitation.

Exemples

Annotation correcte Commentaires
1 Une réunion privée organisée par la Commission du relèvement des salaires et par le syndicat des ouvrières et ouvriers du tisage mécanique, a eu lieu hier 18. Dans ce cas de figure, on couplerait la sélection d'un commentaire, par exemple : "faut-il utiliser le tag organization?"

Personnes et organisations

"TU_personne"

Règle

Le tag "TU_personne" doit être utilisé pour annoter les noms de personnes.

Si plusieurs noms sont donnés à la suite, ils doivent être annotés séparément.

L'annotation porte sur l'ensemble "nom-prénom" ou "nom-initiale" mais pas sur les titres comme "sieur", "la dame", etc.

Lorsqu'un nom de personne évoqué dans un nom de rue ou le nom d'une organisation, on ne l'annote pas.

La propriété "sex" est utilisée pour préciser le genre d'une personne lorsque cela n'est pas explicite. Ses valeurs peuvent être "f" ou "h".

Exemples

Annotation correcte Commentaires
1 Ce matin une délégation composée de 3 ouvrières de la maison Gindre et 3 membres du syndicat s'est rendue auprès de M. Gindre pour lui demander une augmentation des salaires. "Gindre" dans le groupe "M. Gindre" est annoté car il s'agit d'une personne (et "M." ne pas inclus dans la sélection), en revanche, le même mot n'est pas annoté dans l'expression "maison Gindre". Dans la mesure où "Gindre" est précédé de "M.", son genre est explicite, il n'est pas nécessaire d'attribuer une valeur à la propriété "sex".
2 Une autre ouvrière lui répond Dans cette phrase, c'est bien une personne qui est évoquée, mais dans la mesure où elle reste anonyme, on ne l'annote pas avec le tag "TU_personne".
3 Monsieur le Préfet du Rhône Il ne s'agit pas d'un nom mais d'un titre, c'est la raison pour laquelle cet ensemble n'est pas annoté.
4 Entre Jean marie ferroussat mtre fabqt demdr et ledit Donzier marchand On n'annote que le nom de la personne et pas son métier. Dans certains cas, le métier fait effectivement partie de la mention de la personne, mais comme le statut matrimonial, cette information ne fait pas partie du nom d'une personne.

"TU_statutMatrimonial"

Règle

Le tag "TU_statutMatrimonal" doit être utilisé pour annoter les titres et expressions qui permettent d'identifier le statut matrimonial des personnes, en particulier des femmes.

Sauf cas particulier, on n'annote pas un statut matrimonial s'il n'est pas associé à l'annotation d'un nom de personne.

Les formulations pour désigner le statut matrimonial des femmes changent en fonction des documents, des contextes et des époques.

Exemples

Annotation correcte Commentaires
1 Entre madame Marie Thérèse, épouse assistée et autorisée du sieur Jules Alexandre Yékiche, et ce dernier [...] Cas typique d'annotation d'un statut matrimonial.
2 Le citoyen Naudan lit le rapport de la commission. Le Sieur Simon est rédacteur, au Journal "Le Peuple". Il ne s'agit pas de statuts matrimoniaux. "citoyen" n'est pas annoté comme un statut matrimonial. Ce n'est pas non plus le cas de "sieur" qui correspond d'avantage à un statut social.
2 Monsieur Le Procureur de la République S'agissant d'une fonction et non pas d'une personne, on n'annote pas "Monsieur" comme un statut matrimonial.
3 Entre Marianne Prost brodeuse à Lyon demanderesse et les mariés Tabard la femme aussi brodeuse aud Lyon deffendeurs et incidemment demandeurs. Dans cette phrase, "femme" a bien le sens d'épouse, c'est la raison pour laquelle on peut l'annoter comme un statut matrimonial.
4 Entre Margueritte Sella fille domestique à Lyon demanderesse et le nommé Gret maitre fabricant audit Lyon deffendeur. Dans cette phrase, "fille" a le sens de "mineure", cela ne constitue pas un statut matrimonial.

"Organization"

Règle

Le tag "organization" doit être utilisé pour annoter les institutions, les entreprises ou encore les associations.

Lorsqu'un groupe de mot désignant une organisation contient un nom de métier ou une occupation, on utilise également le tag "TU_occupation" sur la portion de texte concernée. En revanche, on n'annote pas le nom d'une personne dans le nom d'une organisation.

La désignation d'une organisation peut avoir plusieurs variantes, par exemple : "Maison Gindre" peut aussi être appelée "Gindre et Cie" ou encore "usine Gindre".

En fonction du contexte, une organisation peut servir à désigner un lieu plutôt que l'organisation elle-même. Autant que possible, on prendra en compte le contexte.

Exemples

Annotation correcte Commentaires
1 Une gréviste de la Maison Gindre L'annotation de l'organisation porte sur "Maison Gindre" ; on n'annote pas "Gindre" comme un nom de personne.
2 Le siège du syndicat des ouvriers tisseurs et similaires, rue d'Austerlitz 8, ... On distingue ce qui relève de la dénomination d'un lieu (ici : "siège du syndicat des ouvriers tisseurs et similaires") et ce qui relève de l'organisation (ici : "syndicat des ouvriers tisseurs et similaires"). En outre, le nom de cette organisation comprend un nom de métier, que l'on annote avec le tag "TU_occupation" : "ouvriers tisseurs".
3 L'entrevue a eu lieu cette après-midi à 3 heures au Palais du Commerce. Il est possible d'utiliser les tags "place" et "organization" simultanément. Dans ce contexte cependant, "Palais du Commerce" est avant tout utilisé pour désigner un lieu, on peut donc se contenter de l'annoter avec le tag "place" uniquement.

Localisations

"TU_adresse"

Règle

Le tag "TU_adresse" doit être utilisé pour annoter une adresse postale plus ou moins complète.

Une rue, avec ou sans numéro, peut être considérée comme une adresse postale.

Si une rue est accompagnée d'un numéro, on inclut toujours le numéro dans la sélection.

Si un nom de lieu est évoqué à proximité d'une adresse dans le texte, on n'inclut pas le nom du lieu dans la sélection pour le tag "TU_adresse".

Exemples

Annotation correcte Commentaires
1 Maison Schutz, Salle Bichommier, Avenue des Tapis, 1 L'annotation de l'adresse porte uniquement sur "Avenue des Tapis, 1" : on n'inclut pas le nom de la salle, ni le nom de l'organisation en lien avec cette adresse.
2 au siège du Syndicat ouvrier des tisseurs et similaires 8, rue d'Austerlitz L'annotation de l'adresse porte uniquement sur "8, rue d'Austerlitz" : on n'inclut pas le nom du lieu en lien avec cette adresse.
3 quatre Maisons de fabriques, savoir les Maisons : Atuyer, place Tolozan, 20 et 23 ; Schulz, rue du Griffon, 8 ; Béraud, place Tolozan, 18 : Tresca, frères, rue du Griffon, 8. La première adresse peut poser problème puisqu'elle inclut deux numéros, dans ce cas, dans la mesure où l'adresse est celle d'un seul établissement, on inclut les deux numéros dans la sélection : "place Tolozan, 20 et 23".


"Place"

Règle

Le tag "place" doit être utilisé pour annoter un nom de lieu.

Le tag porte sur la totalité des mots qui désignent le lieu annoté.

Une adresse n'est pas un lieu. Une adresse est annotée avec un tag spécifique : "TU_adresse".

Les villes sont considérées comme des lieux.

Exemples

Annotation correcte Commentaires
1 Entre Antoinette Jarlent fille domestique à Lyon demanderesse et le nommé Charbonnier maitre fabricant aud Lyon deffend. Cas typique d'annotation d'un nom de lieu.
2 Place de la Croix-Rousse. 4 dans une des salles du café Verdior. L'annotation porte uniquement sur "café Verdior" : on n'inclut pas les éléments comme des noms de salles, et on utilise un autre tag pour annoter "Place de la Crois-Rousse.4".

Temps

"Date"

Règle

Le tag "date" doit être utilisé pour annoter une date absolue exprimée en chiffres et/ou en lettres.

On annote une date lorsqu'elle est constituée d'une année seulement, ou bien d'un mois et une année, ou encore d'un jour, un mois et une année.

On n'identifie pas les expressions comme "hier", "aujourd'hui", qui sont des dates relatives au contexte.

Pour des intervalles de date, on annote les deux dates séparément.

Dans la mesure du possible, on n'annote pas les dates qui font partie d'un titre de document ou d'une expression désignant une organisation, un événement ou un lieu.

Exemples

Annotation correcte Commentaires
1 la mon Bejui accepte la moité du tarif de 1885, à partir du 26 Décembre 1894. Cas typique d'annotation de la date. On n'a pas encodé "1885" car on peut considérer qu'il s'agit du titre d'un document de référence, le "tarif de 1885".
2 Les soussignés ont l'honneur de vous informer qu'ils organisent une réunion publique à la Brasserie Française, rue des Ecoles, le Mardi 18 décembre à 8 heures

du soir

Faut-il annoter cette date, vu qu'il n'y a pas d'année ?
3 la réunion publique tenue le 20 courant à la Croix-Rousse On n'annote pas cette date car sa résolution est dépendante du contexte


"TU_heure"

Règles

L'usage du tag "TU_heure" est plus strict que le tag "TU_duree". Il ne doit être utilisé que pour annoter les heures clairement exprimées dans les documents.

De manière générale, on se concentre sur les heures qui concernent des activités se rapportant à l'industrie du textile.

Exemples

Annotation correcte Commentaires
1 La séance a été ouverte à 8h 1/4 et levée à 10 heures. On inclut dans la sélection tous les éléments qui composent l'heure, quelle que soit la forme utilisée pour les exprimer : ici par exemple "1/4".
2 Les heures d'entrées et de sorties sont exactement les suivantes :

Matin : Entrée 7 heures - sortie midi Soir : Entrée 2h. - sortie 7h

On distingue chaque occurrence de l'expression d'une heure.
3 Il invite les grévistes à se réunir aujourd'hui à 2 heures de l'après-midi Lorsque cela est possible, on peut inclure dans la sélection des formules comme "de l'après-midi" qui permettent de préciser l'horaire dont il est question.


"TU_duree"

Règle

Le tag "TU_duree" doit être utilisé pour identifier des mots ou groupes de mots faisant référence à une information permettant de mesurer la durée d'une tâche précise ou d'un événement.

Les entités concernées peuvent correspondre à une plage de temps (le nombre d'heures travaillées quotidiennement, ou encore la durée d'une réunion syndicale), à un rythme ("par jour", "par semaine", etc) ou encore une échéance associée à un travail.

Les entités concernées sont très variées et parfois difficiles à cerner : en cas de doute, on préfère donc ne pas annoter.

Exemples

Annotation correcte Commentaires
1 Les prix sont toujours les mêmes il y a des ouvriers depuis 3f jusqu'à 10 et 12 par journée. Cas typique d'annotation d'une durée associée à une rémunération.
2 L'ouvrier a du subir une baisse nuisible dans les prix de la journée de travail. L'expression "journée de travail" n'est pas à proprement une durée ici, on ne l'annote donc pas.
3 Les ouvriers qui travaillent pour le compte d'un chef d'atelier gagnent à peine de 35 à 45f par mois. Quant à ceux qui ont leur métier ils ont subi une diminution de 50c par mètre. L'expression "par mois" qui se rapporte aux sommes qui la précèdent est annotée comme une durée. Ce n'est en revanche pas le cas de l'expression "par mètre" qui, même si elle apporte une information sur ce à quoi se rapporte la somme qui la précède, n'est pas une information de temps.
4 Les grévistes pouvaient toucher tous les soirs la somme de 1f50. "Tous les soirs" est bien une information sur le rythme ou la durée associé(e) à une rémunération.
5 Seulement il a que cette maison ne tienne plus d'ici deux ou trois mois, l'engagement qu'elle prend aujourd'hui. On a bien ici l'expression d'une échéance, qui pourrait être annotée comme une durée dans un autre cas. Cependant, dans ce contexte, l'information n'est pas pertinente : il ne s'agit pas d'une échéance donnée pour l'accomplissement d'une tâche.


Rémunérations et activités

"TU_occupation"

Règle

Le tag "Tu_occupation" doit être utilisé pour identifier un métier ou une occupation.

On veillera à sélectionner la totalité de l'expression désignant le métier ou l'occupation.

On évitera cependant d'annoter les fonctions comme "Commissaire général" ou encore "président" ou "secrétaire (général)".

La propriété normal doit être remplie avec l'expression normalisée du métier ou de l'occupation dans le cas où la tournure de la phrase rendrait impossible l'encodage de la totalité de la mention du métier.

Exemples

Annotation correcte Commentaires
1 l'usine occupe encore 20 autres femmes, travaillant comme fileuses. Cas typique d'annotation d'un métier.
2 Cette grève qui comprend actuellement les ouvriers du tissage à bras, ceux du tissage mécanique et les chefs d'ateliers, se poursuit sans incidents sérieux. "ouvriers du tissage à bras" ne pose pas de problème, mais ce n'est pas le cas de "ceux du tissage mécanique", car la structure de la phrase nous fait perdre une partie de l'information. C'est dans un cas comme celui-ci que l'attribut "normal" doit être utilisé. On lui donne donc la valeur "ouvriers du tissage mécanique".
3 Le Bureau est constitué de la façon suivante : MM. Borias, président ; Labrosse-Bardin et Sage, Assesseurs. On n'annote pas les fonctions entourant la tenue d'une assemblée.
4 Lyon le 22 Décembre 1894. Le commissaire spécial, L. Perny On n'annote pas non plus les fonctions entourant la rédaction d'un rapport.
5 ... si les ouvrières de l'usine Gindre ne s'entendait pas mieux, elles n'aboutiront qu'à un échec certain. On n'inclut dans l'annotation que les éléments qui font partie de la caractérisation du métier de manière générale. On n'inclut donc pas des éléments comme "de l'usine X", qui sont des données contextuelles. Le métier, ici, est uniquement "ouvrière".
6 Une réunion privée des ouvriers et ouvrières du tissage mécanique a eu lieu hier. Dans un cas comme celui-ci, on fera porter l'annotation sur l'ensemble de l'expression, sans distinguer d'une part la forme masculine et d'autre part la forme féminine. On n'a donc pas besoin d'utiliser l'attribut "normal".
7 jeanne Curia fille de maitre étoit contrevenüe à la disposition (...) Si "fille de maître" suggère une situation matrimoniale, pour laquelle on utilisera le tag "TU_statutMatrimonial", il évoque également une occupation professionnelle, c'est pourquoi on l'annote également avec le tag "TU_occupation".

"TU_statut"

Règle

Le tag "TU_statut" permet d'annoter les statuts associés à une occupation ou un métier.

Exemples

Annotation correcte Commentaires
1 la communauté des maitres fabriquants en etoffes de soyes de cette ville Cas typique d'annotation d'un statut de travailleur.

"TU_remuneration"

Règle

Le tag "TU_remuneration" doit être utilisé pour signaler une phrase ou partie de phrase contenant des informations sur une rémunération.

La manière d'exprimer une rémunération varie en fonction du contexte, c'est pourquoi l'usage de ce tag est principalement de signaler un passage dans le texte pour ensuite permettre une analyse plus fine.

En complément du tag "TU_remuneration", on utilisera autant que possible le tag "TU_typeRemuneration", et les tags "Tu_duree", "TU_montant", "TU_produit" et "TU_tache", car ils permettent de préciser les différents éléments qui composent la rémunération.

Exemples

Annotation correcte Commentaires
1 si les ouvrières avaient su toucher 1f50 par jour ... Le tag "TU_remuneration" s'étend sur toute la partie du texte exprimant une rémunération, les tag "TU_montant" et "TU_duree" sont utilisés en complément.
2 Leur salaire personnel varie de 1f50 à 2f50 par jour pour tous les articles courants, et sans parler de l'article riche beaucoup plus rémunérateur mais qui n'occupe qu'une infime minorité. Il est nécessaire de distinguer (et d'annoter) les informations claires et précises des formulations vagues, qu'on évitera d'annoter car elles sont difficiles à délimiter et peu exploitables. On peut utiliser des tags supplémentaires pour préciser les éléments dans la phrase.


"TU_typeRemuneration"

Règle

Le tag "TU_typeRemuneration" doit être utilisé pour annoter un mot ou groupe de mot désignant un type de rémunération.

Le type d'une rémunération n'est pas toujours explicite, auquel cas il n'est pas possible d'utiliser le tag "TU_typeRemuneration".

Le type d'une rémunération peut être explicité en dehors de la zone annotée "TU_remuneration".

La propriété subtype permet de classer le type de rémunération en fonction d'une liste pré-établie.

Liste des valeurs possibles de la propriété subtype :

avance solde total indemnité_judiciaire indemnité_syndicale solidarité amende

En cas de doute, on préfère ne pas remplir la propriété subtype.

Exemples

Annotation correcte Commentaires
1 elle ne veut accorder qu'une augmentation de 15% sur les pièces en cours et ne donne le tarif de 1885, qu'après l'achèvement de ces pièces. "sur les pièces en cours" précise qu'il s'agit d'une avance tandis que "après l'achèvement de ces pièces" correspond à un solde. On donnera donc ces deux valeurs respectivement à la propriété "subtype" de ces tags.
2 Il est dit que led. Charbonnier est condamné et sera contraint même par corps de payer à lad. demanderesse la somme de treize livres un sol pour solde de gages avec depens liquidés à trente deux sols outre ceux de mise a exécution "solde de gages" précise que la rémunération est de type "solde", tandis que "depens" correspond à une "indemnité judiciaire" ; ce sont donc les valeurs des propriétés "subtype" de l'un et l'autre tag.

"TU_montant"

Règle

Le tag "TU_montant" doit être utilisé pour identifier la mention d'un montant dans le cadre d'une rémunération.

Ce montant peut se référer ou non à une rémunération financière.

On essaiera autant que possible de préciser si ce montant est exprimé de manière absolue ou relative en remplissant la propriété subtype.

Liste des valeurs possibles pour la propriété subtype :

relatif absolu

En cas de doute, on préfère ne pas remplir la propriété subtype.

Exemples

Annotation correcte Commentaires
1 Moyenne du salaire journalier des 10 plus mauvaises ouvrières, 2fr. 26c. pendant le mois dernier. Cas typique d'annotation d'un montant. On inclut dans la sélection les unités monétaires. On précise comme valeur de l'attribut "subtype" : "absolu"
2 Leur salaire personnel varie de 1f50 à 2f50 par jour pour tous les articles courants. Dans le cas d'un intervalle entre deux montants, on annote les deux bornes séparément. On donne à chacun des attributs "subtype" la valeur "absolu".
3 La mon Ritton. Bardon, accepte le tarif de 1885 avec réserves sur les bengalines et petits taffetas, articles qu'elle s'engage à payer 0f05 de plus que toutes ses concurrentes. S'agissant d'un montant relatif aux autres éléments de la phrase, on donne à l'attribut "subtype" la valeur "relatif".

"TU_tache"

Règle

Le tag "TU_tache" doit être utilisé pour annoter un mot ou un groupe de mots évoquant une action ou une tâche se rapportant au textile dans un contexte domestique ou salarial.

Exemples

Annotation correcte Commentaires
... Il n'y a pas encore d'exemple

"TU_produit"

Règle

Le tag "TU_produit" doit être utilisé pour annoter la mention d'un produit, qu'il s'agisse d'un produit fini ou dans un état intermédiaire, le plus souvent dans le cadre d'une rémunération.

L'annotation porte sur l'expression la plus précise possible du produit mais d'inclut pas les quantités.

Exemples

Annotation correcte Commentaires
1 La mon Ritton. Bardon, accepte le tarif de 1885 avec réserves sur les bengalines et petits taffetas, articles qu'elle s'engage à payer 0f05 de plus que toutes ses concurrentes Cas typique d'annotation d'un produit.
2 Les chefs d'atelier de cette Maison ont fait tout ce qu'il était possible de faire et ils sont arrivés à lui faire accepter le tarif de 1885, en ce qui concerne les façonnés. Cas typique d'annotation d'un produit.

"TU_quantite"

Règle

Le tag "TU_quantite" doit être utilisé pour identifier des quantités se rattachant à des produits ou des personnes.

Autant que possible, on ne sélectionne que le nombre précisant la quantité. L'unité sera reportée dans la propriété unit.

Exemples

Annotation correcte Commentaires
1 vingt cinq francs cinquante centimes pour le dévidage de trente quatre Kilogrammes de coton à raison de soixante quinze centimes le Kilogramme Cas typique d'annotation d'une quantité pour un produit. On précise comme valeur de l'attribut "unit" : "kilogramme".
2 l'après-midi, une centaine d'ouvrières ont repris le travail tandis que ce matin il n'y en avait que 46. Cas typique d'annotation d'une quantité de personnes.

Références bibliographiques

"TU_document"

Règles

Le tag "TU_document" doit être utilisé pour annoter les mentions de documents extérieurs réels faites dans le cadre du texte transcrit. Il peut s'agir d'un article de journal, d'une loi, d'un règlement, etc.

On annote uniquement la mention d'un document extérieur lorsque celui-ci est nommé précisément.

On remplit systématiquement la propriété "type" en lui attribuant une valeur tirée de la liste suivante, qui permet d'identifier la nature du document.

presse loi tarif règlement ...

En cas de doute sur la nature du document, on préfère cependant ne attribuer de valeur à la propriété.

Exemples

Annotation correcte Commentaires
1 Naudot a demandé ensuite si l'article de fond du "Nouveau Lyon" de ce matin intitulé "Grève générale" n'avait pas été inspiré par les fabricants On a annoté le titre du document en attribuant la valeur "presse" à la propriété "type" du tag. On n'a pas inclus dans la sélection le nom du journal qui l'a publié.
2 La Maison Chavent (art façonné) s'est rendue aux justes réclamations des tisseurs ; elle a accepté le tarif de 85, en son entier. Ce cas est plus difficile à traiter, mais on peut considérer qu'il s'agit d'une référence à un document dans la mesure où dans ce contexte un "tarif" fait référence à une série de tables où sont énumérés tous les prix sur lesquels se sont accordés les acteurs de l'industrie. En outre, identifier ce genre de référence permet souvent de clarifier un prix exprimé de manière relative à un tarif. On donnera à la propriété "type" la valeur "tarif".