Guide d'annotation : Différence entre versions

De TimeUsage
Aller à : navigation, rechercher
(Tags du projet Time Us)
Ligne 132 : Ligne 132 :
 
|}
 
|}
  
=== TU_adresse ===
+
=== Adresse : "TU_adresse" ===
  
 
==== Règle ====
 
==== Règle ====
Ligne 162 : Ligne 162 :
 
|}
 
|}
  
=== date ===
+
=== Date : "date" ===
 
==== Règle ====
 
==== Règle ====
 
Le tag "date" doit être utilisé pour annoter une date absolue exprimée en chiffres et/ou en lettres.  
 
Le tag "date" doit être utilisé pour annoter une date absolue exprimée en chiffres et/ou en lettres.  
Ligne 194 : Ligne 194 :
 
|}
 
|}
  
=== TU_document ===
+
=== Référence bibliographique : "TU_document" ===
  
 
==== Règles ====
 
==== Règles ====
Ligne 229 : Ligne 229 :
 
|}
 
|}
  
=== TU_duree ===
+
=== Information de temps : "TU_duree" ===
  
 
==== Règle ====
 
==== Règle ====
Ligne 266 : Ligne 266 :
 
|}
 
|}
  
=== TU_heure ===
+
=== Horaire : "TU_heure" ===
  
 
==== Règles ====
 
==== Règles ====
Ligne 294 : Ligne 294 :
 
|}
 
|}
  
=== TU_incertitude ===
+
=== Problème d'annotation : "TU_incertitude" ===
 
==== Règle ====
 
==== Règle ====
 
Le tag "TU_incertitude" permet à l'annotateur·ice de signaler un cas problématique dans l'annotation.  
 
Le tag "TU_incertitude" permet à l'annotateur·ice de signaler un cas problématique dans l'annotation.  
Ligne 313 : Ligne 313 :
 
|}
 
|}
  
=== TU_montant ===
+
=== Montant : "TU_montant" ===
 
==== Règle ====
 
==== Règle ====
 
Le tag "TU_montant" doit être utilisé pour identifier la mention d'un montant dans le cadre d'une rémunération.  
 
Le tag "TU_montant" doit être utilisé pour identifier la mention d'un montant dans le cadre d'une rémunération.  
Ligne 349 : Ligne 349 :
 
|}
 
|}
  
=== TU_occupation ===
+
=== Métier ou occupation : "TU_occupation" ===
 
==== Règle ====
 
==== Règle ====
 
Le tag "Tu_occupation" doit être utilisé pour identifier un métier ou une occupation.  
 
Le tag "Tu_occupation" doit être utilisé pour identifier un métier ou une occupation.  
Ligne 390 : Ligne 390 :
 
|}
 
|}
  
=== organization ===
+
=== Organisations : "organization" ===
 
==== Règle ====
 
==== Règle ====
 
Le tag "organization" doit être utilisé pour annoter les institutions, les entreprises ou encore les associations.  
 
Le tag "organization" doit être utilisé pour annoter les institutions, les entreprises ou encore les associations.  
Ligne 419 : Ligne 419 :
 
|}
 
|}
  
=== TU_personne ===
+
=== Nom de personne : "TU_personne" ===
 
==== Règle ====
 
==== Règle ====
 
Le tag "TU_personne" doit être utilisé pour annoter les noms de personnes.  
 
Le tag "TU_personne" doit être utilisé pour annoter les noms de personnes.  
Ligne 450 : Ligne 450 :
 
|}
 
|}
  
=== Place ===
+
=== Lieu : "place" ===
 
==== Règle ====
 
==== Règle ====
 
Le tag "place" doit être utilisé pour annoter un nom de lieu.  
 
Le tag "place" doit être utilisé pour annoter un nom de lieu.  
Ligne 475 : Ligne 475 :
 
|}
 
|}
  
=== TU_produit ===
+
=== Production textile : "TU_produit" ===
 
==== Règle ====
 
==== Règle ====
 
Le tag "TU_produit" doit être utilisé pour annoter la mention d'un produit, qu'il s'agisse d'un produit fini ou dans un état intermédiaire, le plus souvent dans le cadre d'une rémunération.
 
Le tag "TU_produit" doit être utilisé pour annoter la mention d'un produit, qu'il s'agisse d'un produit fini ou dans un état intermédiaire, le plus souvent dans le cadre d'une rémunération.
Ligne 496 : Ligne 496 :
 
|}
 
|}
  
=== TU_remuneration ===
+
=== Rémunération : "TU_remuneration" ===
 
==== Règle ====
 
==== Règle ====
 
Le tag "TU_remuneration" doit être utilisé pour signaler une phrase ou partie de phrase contenant des informations sur une rémunération.
 
Le tag "TU_remuneration" doit être utilisé pour signaler une phrase ou partie de phrase contenant des informations sur une rémunération.
Ligne 519 : Ligne 519 :
 
|}
 
|}
  
=== TU_statutMatrimonial ===
+
=== Statut matrimonial : "TU_statutMatrimonial" ===
 
==== Règle ====
 
==== Règle ====
 
Le tag "TU_statutMatrimonal" doit être utilisé pour annoter les titres et expressions qui permettent d'identifier le statut matrimonial des personnes, en particulier des femmes.  
 
Le tag "TU_statutMatrimonal" doit être utilisé pour annoter les titres et expressions qui permettent d'identifier le statut matrimonial des personnes, en particulier des femmes.  
Ligne 554 : Ligne 554 :
 
|}
 
|}
  
=== TU_tache ===
+
=== Tâche : "TU_tache" ===
 
==== Règle ====
 
==== Règle ====
 
Le tag "TU_tache" doit être utilisé pour identifier un mot ou un groupe de mots évoquant une action ou une tâche se rapportant au textile dans un contexte domestique ou salarial.  
 
Le tag "TU_tache" doit être utilisé pour identifier un mot ou un groupe de mots évoquant une action ou une tâche se rapportant au textile dans un contexte domestique ou salarial.  
Ligne 575 : Ligne 575 :
 
* <TU_tache>une tache</TU_tache> : (à venir)...
 
* <TU_tache>une tache</TU_tache> : (à venir)...
  
=== TU_typeRemuneration ===
+
=== Type de rémunération : "TU_typeRemuneration" ===
 
==== Règle ====
 
==== Règle ====
 
Le tag "TU_typeRemuneration" doit être utilisé pour annoter un mot ou groupe de mot désignant un type de rémunération.  
 
Le tag "TU_typeRemuneration" doit être utilisé pour annoter un mot ou groupe de mot désignant un type de rémunération.  

Version du 3 mai 2018 à 15:11

Cette page rassemble des éléments pour guider l'annotation des sources dans Transkribus ainsi qu'un certain nombre de questions méthodologiques.

Pour installer l'ensemble des tags utiles à l'annotation dans Transkribus pour le projet Time Us, consultez la page Guide pour l'installation des fichiers config.

Remarques générales

Sélectionner le texte

Lors de l'application d'un tag dans Transkribus, il est fondamental de respecter quelques règles afin d'optimiser l'annotation des textes.

1. La portion de texte sélectionnée ne doit pas inclure les signes de ponctuations et les espaces situés de part et d'autre du mot ou du groupe de mots annoté. Si la ponctuation se trouve à l'intérieur de la sélection, dans une locution ou dans une adresse par exemple, elle fait bien légitimement partie du groupe de mot sur lequel porte l'annotation.

2. La portion de texte sélectionnée ne doit pas inclure les déterminants précédent le mot ou le groupe de mots annoté.

Select-1.png La sélection inclut uniquement le texte sur lequel doit porter l'annotation.
Select-2.png Cette sélection n'est pas bonne car elle intègre un déterminant inutile dans le groupe de mots annoté.
Select-3.png Cette sélection n'est pas bonne car elle inclut l'espace qui précède le mot sur lequel porte l'annotation.
Select-4.png Cette sélection n'est pas bonne car elle inclut la virgule qui suit le mot sur lequel porte l'annotation.

3. La portion de texte sélectionnée doit être la plus correcte possible : elle ne doit pas inclure plus de mots que nécessaires, mais elle doit contenir l'ensemble des éléments du groupe de mots qui constituent l'entité identifiée.

Select-5.png Cette sélection n'est pas bonne car elle ne prend qu'un seul mot en compte alors qu'il fait partie d'un groupe de mots formant une entité.
Select-6.png Cette sélection n'est pas bonne car elle ne prend pas tous les mots du groupe formant une entité.
Select-7.png Cette sélection est correcte car elle prend en compte la totalité de l'expression formant une entité et permet d'avoir une dénomination la plus précise possible.
Select-8.png Cette sélection est correcte car elle prend en compte la totalité de l'expression formant une entité ; on perdrait des informations en n'intégrant pas "ouvriers" dans la sélection, de même si on ignorait "du tissage mécanique".

Appliquer un tag

Pour appliquer un tag dans Transkribus, il est nécessaire de sélectionner, dans le cadre supérieur gauche de l'interface, l'onglet "metadata" puis "Textual" (1). Il faut ensuite se positionner dans la zone de transcription, c'est-à-dire dans le cadre inférieur droit de l'application, et sélectionner le texte sur lequel on souhaite appliquer un tag. Cette sélection peut s'étendre sur plusieurs lignes (2). Dans le cadre inférieur gauche, dans l'onglet Tag, sélectionner le tag à appliquer en cliquant sur le "+" vert qui lui correspond (3). Vous verrez alors apparaître le tag dans la liste de "Tags of current Transcript" en haut à gauche (4).

Tagging.png

Utiliser les propriétés

Certains tags ont des propriétés dont la complétion peut s'avérer nécessaire pour l'annotation des documents du projet Time Us. Attention cependant, tous les tags possèdent certaines propriétés telles que "length", "continued" et "offset" dont les valeurs ne peuvent pas être modifiées car elles sont remplies automatiquement par l'application.

Certains tags par défaut possèdent des propriétés qu'il n'est pas utile de renseigner dans le cadre du projet Time Us. L'existence de propriétés attachées à un tag ne doit pas être interprétée comme une obligation pour l'annotateur·rice de remplir le champ en question. Il faut au contraire décider si cela est nécessaire en fonction des indications données dans ce guide d'annotation. Certaines propriétés ont vocation à être remplies avec des valeurs fixes dont la liste est donnée dans ce guide.

Pour accéder aux propriétés, il faut sélectionner le texte dans la zone de transcription, ou sélectionner le tag dans la liste "Tags of current Transcript" (1). Attention, lorsqu'un tag s'étend sur plusieurs lignes, il est affiché dans la liste "Tag of current Transcript" autant de fois qu'il y a de lignes concernées : toutes ses propriétés ne seront accessibles qu'à partir de la dernière occurrence du tag dans la liste. Lorsque plusieurs tags sont appliqués à une même portion de texte, il est préférable d'utiliser l'accès par la liste des tags plutôt que par la zone de transcription.

Lorsque le tag souhaité est sélectionné, cliquez sur l'onglet "Properties" dans le cadre inférieur gauche (2). Cela fera apparaître la liste des propriétés du tag ainsi que leurs valeurs. Cliquez dans la zone de texte en face d'une propriété pour lui ajouter une valeur ou modifier celle-ci (3). Pour valider cette valeur, cliquez sur "Apply to selected" en bas du cadre (4) ou tapez "Entrée". Lorsque la valeur est bien enregistrée, celle-ci s'affiche dans la colonne "Properties" dans la liste "Tags of current Transcript". Si rien ne s'affiche, c'est que la valeur entrée n'a pas été prise en compte par Transkribus. Cela arrive, il suffit de recommencer. Il est parfois nécessaire de rafraîchir la liste en cliquant sur l'icône (6).

Tagging-properties.png

Faire un commentaire

Tags du projet Time Us

Tableau récapitulatif

Tag Propriété Usage
TU_adresse Mot ou groupe de mots désignant une adresse postale
date Date explicite en chiffres ou en lettres
TU_document type Titre de document de différents types
TU_duree Mot ou groupe de mots désignant une durée pour une travail ou un événement
TU_heure Mot ou groupe de mots désignant un horaire
TU_incertitude Mot ou groupe de mots problématique pour l'annotation
TU_montant type Montant exprimé en lettres et/ou en chiffres
TU_occupation normal Mot ou groupe de mots désignant un métier ou une occupation en rapport avec l'industrie du textile.
organization Mot ou groupe de mots désignant un établissement ou une organisation
TU_personne sex Nom(s) d'une personne
place Nom de lieu
TU_produit Mot ou groupe de mots désignant
TU_remuneration Groupe de mots désignant une rémunération
TU_statutMatrimonial Mot ou groupe de mots désignant le statut matrimonial d'une personne
TU_tache Mot, nom ou verbe, ou groupe de mots désignant une tâche salariale ou domestique
TU_typeRemuneration type Mot ou groupe de mots désignant la nature d'une rémunération

Adresse : "TU_adresse"

Règle

Le tag "TU_adresse" doit être utilisé pour annoter une adresse postale plus ou moins complète.

Une rue, avec ou sans numéro, peut être considérée comme une adresse postale.

Si une rue est accompagnée d'un numéro, on inclut toujours le numéro dans la sélection.

Si un nom de lieu est évoqué à proximité d'une adresse dans le texte, on n'inclut pas le nom du lieu dans la sélection pour le tag "TU_adresse".

Exemples

Annotation correcte Commentaires
1 Maison Schutz, Salle Bichommier, Avenue des Tapis, 1 L'annotation de l'adresse porte uniquement sur "Avenue des Tapis, 1" : on n'inclut pas le nom de la salle, ni le nom de l'organisation en lien avec cette adresse.
2 au siège du Syndicat ouvrier des tisseurs et similaires 8, rue d'Austerlitz L'annotation de l'adresse porte uniquement sur "8, rue d'Austerlitz" : on n'inclut pas le nom du lieu en lien avec cette adresse.
3 quatre Maisons de fabriques, savoir les Maisons : Atuyer, place Tolozan, 20 et 23 ; Schulz, rue du Griffon, 8 ; Béraud, place Tolozan, 18 : Tresca, frères, rue du Griffon, 8. La première adresse peut poser problème puisqu'elle inclut deux numéros, dans ce cas, dans la mesure où l'adresse est celle d'un seul établissement, on inclut les deux numéros dans la sélection : "place Tolozan, 20 et 23".

Date : "date"

Règle

Le tag "date" doit être utilisé pour annoter une date absolue exprimée en chiffres et/ou en lettres.

On annote une date lorsqu'elle est constituée d'une année seulement, ou bien d'un mois et une année, ou encore d'un jour, un mois et une année.

On n'identifie pas les expressions comme "hier", "aujourd'hui", qui sont des dates relatives au contexte.

Pour des intervalles de date, on annote les deux dates séparément.

Dans la mesure du possible, on n'annote pas les dates qui font partie d'un titre de document ou d'une expression désignant une organisation, un événement ou un lieu.

Exemples

Annotation correcte Commentaires
1 la mon Bejui accepte la moité du tarif de 1885, à partir du 26 Décembre 1894. Cas typique d'annotation de la date. On n'a pas encodé "1885" car on peut considérer qu'il s'agit du titre d'un document de référence, le "tarif de 1885".
2 Les soussignés ont l'honneur de vous informer qu'ils organisent une réunion publique à la Brasserie Française, rue des Ecoles, le Mardi 18 décembre à 8 heures

du soir

Faut-il annoter cette date, vu qu'il n'y a pas d'année ?
3 la réunion publique tenue le 20 courant à la Croix-Rousse On n'annote pas cette date car sa résolution est dépendante du contexte

Référence bibliographique : "TU_document"

Règles

Le tag "TU_document" doit être utilisé pour annoter les mentions de documents extérieurs réels faites dans le cadre du texte transcrit. Il peut s'agir d'un article de journal, d'une loi, d'un règlement, etc.

On annote uniquement la mention d'un document extérieur lorsque celui-ci est nommé précisément.

On remplit systématiquement la propriété "type" en lui attribuant une valeur tirée de la liste suivante, qui permet d'identifier la nature du document.

presse loi tarif règlement ...

En cas de doute sur la nature du document, on préfère cependant ne attribuer de valeur à la propriété.

Exemples

Annotation correcte Commentaires
1 Naudot a demandé ensuite si l'article de fond du "Nouveau Lyon" de ce matin intitulé "Grève générale" n'avait pas été inspiré par les fabricants On a annoté le titre du document en attribuant la valeur "presse" à la propriété "type" du tag. On n'a pas inclus dans la sélection le nom du journal qui l'a publié.
2 La Maison Chavent (art façonné) s'est rendue aux justes réclamations des tisseurs ; elle a accepté le tarif de 85, en son entier. Ce cas est plus difficile à traiter, mais on peut considérer qu'il s'agit d'une référence à un document dans la mesure où dans ce contexte un "tarif" fait référence à une série de tables où sont énumérés tous les prix sur lesquels se sont accordés les acteurs de l'industrie. En outre, identifier ce genre de référence permet souvent de clarifier un prix exprimé de manière relative à un tarif. On donnera à la propriété "type" la valeur "tarif".

Information de temps : "TU_duree"

Règle

Le tag "TU_duree" doit être utilisé pour identifier des mots ou groupes de mots faisant référence à une information permettant de mesurer la durée d'une tâche précise ou d'un événement.

Les entités concernées peuvent correspondre à une plage de temps (le nombre d'heures travaillées quotidiennement, ou encore la durée d'une réunion syndicale), à un rythme ("par jour", "par semaine", etc) ou encore une échéance associée à un travail.

Les entités concernées sont très variées et parfois difficiles à cerner : en cas de doute, on préfère donc ne pas annoter.


Exemples

Annotation correcte Commentaires
1 Les prix sont toujours les mêmes il y a des ouvriers depuis 3f jusqu'à 10 et 12 par journée. Cas typique d'annotation d'une durée associée à une rémunération.
2 L'ouvrier a du subir une baisse nuisible dans les prix de la journée de travail. L'expression "journée de travail" n'est pas à proprement une durée ici, on ne l'annote donc pas.
3 Les ouvriers qui travaillent pour le compte d'un chef d'atelier gagnent à peine de 35 à 45f par mois. Quant à ceux qui ont leur métier ils ont subi une diminution de 50c par mètre. L'expression "par mois" qui se rapporte aux sommes qui la précèdent est annotée comme une durée. Ce n'est en revanche pas le cas de l'expression "par mètre" qui, même si elle apporte une information sur ce à quoi se rapporte la somme qui la précède, n'est pas une information de temps.
4 Les grévistes pouvaient toucher tous les soirs la somme de 1f50. "Tous les soirs" est bien une information sur le rythme ou la durée associé(e) à une rémunération.
5 Seulement il a que cette maison ne tienne plus d'ici deux ou trois mois, l'engagement qu'elle prend aujourd'hui. On a bien ici l'expression d'une échéance, qui pourrait être annotée comme une durée dans un autre cas. Cependant, dans ce contexte, l'information n'est pas pertinente : il ne s'agit pas d'une échéance donnée pour l'accomplissement d'une tâche.

Horaire : "TU_heure"

Règles

L'usage du tag "TU_heure" est plus strict que le tag "TU_duree". Il ne doit être utilisé que pour annoter les heures clairement exprimées dans les documents.

De manière générale, on se concentre sur les heures qui concernent des activités se rapportant à l'industrie du textile.

Exemples

Annotation correcte Commentaires
1 La séance a été ouverte à 8h 1/4 et levée à 10 heures. On inclut dans la sélection tous les éléments qui composent l'heure, quelle que soit la forme utilisée pour les exprimer : ici par exemple "1/4".
2 Les heures d'entrées et de sorties sont exactement les suivantes :

Matin : Entrée 7 heures - sortie midi Soir : Entrée 2h. - sortie 7h

On distingue chaque occurrence de l'expression d'une heure.
3 Il invite les grévistes à se réunir aujourd'hui à 2 heures de l'après-midi Lorsque cela est possible, on peut inclure dans la sélection des formules comme "de l'après-midi" qui permettent de préciser l'horaire dont il est question.

Problème d'annotation : "TU_incertitude"

Règle

Le tag "TU_incertitude" permet à l'annotateur·ice de signaler un cas problématique dans l'annotation.

Il est à utiliser en cas d'hésitation sur le tag à employer, sur la zone à sélectionner ou sur la nécessité d'annoter un passage, etc.

Une bonne pratique de signalement consiste à accompagner l'utilisation de ce tag d'un commentaire expliquant le problème rencontré ou la raison de l'hésitation.

Exemples

Annotation correcte Commentaires
1 Une réunion privée organisée par la Commission du relèvement des salaires et par le syndicat des ouvrières et ouvriers du tisage mécanique, a eu lieu hier 18. Dans ce cas de figure, on couplerait la sélection d'un commentaire, par exemple : "faut-il utiliser le tag organization?"

Montant : "TU_montant"

Règle

Le tag "TU_montant" doit être utilisé pour identifier la mention d'un montant dans le cadre d'une rémunération.

Ce montant peut se référer ou non à une rémunération financière.

On essaiera autant que possible de préciser si ce montant est exprimé de manière absolue ou relative en remplissant la propriété type.

Liste des valeurs possibles pour la propriété type :

relatif absolu

En cas de doute, on préfère ne pas remplir la propriété type.

Exemples

Annotation correcte Commentaires
1 Moyenne du salaire journalier des 10 plus mauvaises ouvrières, 2fr. 26c. pendant le mois dernier. Cas typique d'annotation d'un montant. On inclut dans la sélection les unités monétaires. On précise comme valeur de l'attribut "type" : "absolu"
2 Leur salaire personnel varie de 1f50 à 2f50 par jour pour tous les articles courants. Dans le cas d'un intervalle entre deux montants, on annote les deux bornes séparément. On donne à chacun des attributs "type" la valeur "absolu".
3 La mon Ritton. Bardon, accepte le tarif de 1885 avec réserves sur les bengalines et petits taffetas, articles qu'elle s'engage à payer 0f05 de plus que toutes ses concurrentes. S'agissant d'un montant relatif aux autres éléments de la phrase, on donne à l'attribut "type" la valeur "relatif".

Métier ou occupation : "TU_occupation"

Règle

Le tag "Tu_occupation" doit être utilisé pour identifier un métier ou une occupation.

On veillera à sélectionner la totalité de l'expression désignant le métier ou l'occupation.

On évitera cependant d'annoter les fonctions comme "Commissaire général" ou encore "président" ou "secrétaire (général)".

La propriété normal doit être remplie avec l'expression normalisée du métier ou de l'occupation dans le cas où la tournure de la phrase rendrait impossible l'encodage de la totalité de la mention du métier.

Exemples

Annotation correcte Commentaires
1 l'usine occupe encore 20 autres femmes, travaillant comme fileuses. Cas typique d'annotation d'un métier.
2 Cette grève qui comprend actuellement les ouvriers du tissage à bras, ceux du tissage mécanique et les chefs d'ateliers, se poursuit sans incidents sérieux. "ouvriers du tissage à bras" ne pose pas de problème, mais ce n'est pas le cas de "ceux du tissage mécanique", car la structure de la phrase nous fait perdre une partie de l'information. C'est dans un cas comme celui-ci que l'attribut "normal" doit être utilisé. On lui donne donc la valeur "ouvriers du tissage mécanique".
3 Le Bureau est constitué de la façon suivante : MM. Borias, président ; Labrosse-Bardin et Sage, Assesseurs. On n'annote pas les fonctions entourant la tenue d'une assemblée.
4 Lyon le 22 Décembre 1894. Le commissaire spécial, L. Perny On n'annote pas non plus les fonctions entourant la rédaction d'un rapport.
5 ... si les ouvrières de l'usine Gindre ne s'entendait pas mieux, elles n'aboutiront qu'à un échec certain. On n'inclut dans l'annotation que les éléments qui font partie de la caractérisation du métier de manière générale. On n'inclut donc pas des éléments comme "de l'usine X", qui sont des données contextuelles. Le métier, ici, est uniquement "ouvrière".
6 Une réunion privée des ouvriers et ouvrières du tissage mécanique a eu lieu hier. Dans un cas comme celui-ci, on fera porter l'annotation sur l'ensemble de l'expression, sans distinguer d'une part la forme masculine et d'autre part la forme féminine. On n'a donc pas besoin d'utiliser l'attribut "normal".

Organisations : "organization"

Règle

Le tag "organization" doit être utilisé pour annoter les institutions, les entreprises ou encore les associations.

Lorsqu'un groupe de mot désignant une organisation contient un nom de métier ou une occupation, on utilise également le tag "TU_occupation" sur la portion de texte concernée. En revanche, on n'annote pas le nom d'une personne dans le nom d'une organisation.

La désignation d'une organisation peut avoir plusieurs variantes, par exemple : "Maison Gindre" peut aussi être appelée "Gindre et Cie" ou encore "usine Gindre".

En fonction du contexte, une organisation peut servir à désigner un lieu plutôt que l'organisation elle-même. Autant que possible, on prendra en compte le contexte.

Exemples

Annotation correcte Commentaires
1 Une gréviste de la Maison Gindre L'annotation de l'organisation porte sur "Maison Gindre" ; on n'annote pas "Gindre" comme un nom de personne.
2 Le siège du syndicat des ouvriers tisseurs et similaires, rue d'Austerlitz 8, ... On distingue ce qui relève de la dénomination d'un lieu (ici : "siège du syndicat des ouvriers tisseurs et similaires") et ce qui relève de l'organisation (ici : "syndicat des ouvriers tisseurs et similaires"). En outre, le nom de cette organisation comprend un nom de métier, que l'on annote avec le tag "TU_occupation" : "ouvriers tisseurs".
3 L'entrevue a eu lieu cette après-midi à 3 heures au Palais du Commerce. Il est possible d'utiliser les tags "place" et "organization" simultanément. Dans ce contexte cependant, "Palais du Commerce" est avant tout utilisé pour désigner un lieu, on peut donc se contenter de l'annoter avec le tag "place" uniquement.

Nom de personne : "TU_personne"

Règle

Le tag "TU_personne" doit être utilisé pour annoter les noms de personnes.

Si plusieurs noms sont donnés à la suite, ils doivent être annotés séparément.

L'annotation porte sur l'ensemble "nom-prénom" ou "nom-initiale" mais pas sur les titres comme "sieur", "la dame", etc.

Lorsqu'un nom de personne évoqué dans un nom de rue ou le nom d'une organisation, on ne l'annote pas.

La propriété "sex" est utilisée pour préciser le genre d'une personne lorsque cela n'est pas explicite. Ses valeurs peuvent être "f" ou "h".

Exemples

Annotation correcte Commentaires
1 Ce matin une délégation composée de 3 ouvrières de la maison Gindre et 3 membres du syndicat s'est rendue auprès de M. Gindre pour lui demander une augmentation des salaires. "Gindre" dans le groupe "M. Gindre" est annoté car il s'agit d'une personne (et "M." ne pas inclus dans la sélection), en revanche, le même mot n'est pas annoté dans l'expression "maison Gindre". Dans la mesure où "Gindre" est précédé de "M.", son genre est explicite, il n'est pas nécessaire d'attribuer une valeur à la propriété "sex".
2 Une autre ouvrière lui répond Dans cette phrase, c'est bien une personne qui est évoquée, mais dans la mesure où elle reste anonyme, on ne l'annote pas avec le tag "TU_personne".
3 Monsieur le Préfet du Rhône Il ne s'agit pas d'un nom mais d'un titre, c'est la raison pour laquelle cet ensemble n'est pas annoté.

Lieu : "place"

Règle

Le tag "place" doit être utilisé pour annoter un nom de lieu.

Le tag porte sur la totalité des mots qui désignent le lieu annoté.

Une adresse n'est pas un lieu. Une adresse est annotée avec un tag spécifique : "TU_adresse".

Les villes sont considérées comme des lieux.

Exemples

Annotation correcte Commentaires
1 Entre Antoinette Jarlent fille domestique à Lyon demanderesse et le nommé Charbonnier maitre fabricant aud Lyon deffend. Cas typique d'annotation d'un nom de lieu.
2 Place de la Croix-Rousse. 4 dans une des salles du café Verdior. L'annotation porte uniquement sur "café Verdior" : on n'inclut pas les éléments comme des noms de salles, et on utilise un autre tag pour annoter "Place de la Crois-Rousse.4".

Production textile : "TU_produit"

Règle

Le tag "TU_produit" doit être utilisé pour annoter la mention d'un produit, qu'il s'agisse d'un produit fini ou dans un état intermédiaire, le plus souvent dans le cadre d'une rémunération.

L'annotation porte sur l'expression la plus précise possible du produit mais d'inclut pas les quantités.

Exemples

Annotation correcte Commentaires
1 La mon Ritton. Bardon, accepte le tarif de 1885 avec réserves sur les bengalines et petits taffetas, articles qu'elle s'engage à payer 0f05 de plus que toutes ses concurrentes Cas typique d'annotation d'un produit.
2 Les chefs d'atelier de cette Maison ont fait tout ce qu'il était possible de faire et ils sont arrivés à lui faire accepter le tarif de 1885, en ce qui concerne les façonnés. Cas typique d'annotation d'un produit.

Rémunération : "TU_remuneration"

Règle

Le tag "TU_remuneration" doit être utilisé pour signaler une phrase ou partie de phrase contenant des informations sur une rémunération.

La manière d'exprimer une rémunération varie en fonction du contexte, c'est pourquoi l'usage de ce tag est principalement de signaler un passage dans le texte pour ensuite permettre une analyse plus fine.

En complément du tag "TU_remuneration", on utilisera autant que possible le tag "TU_typeRemuneration", et les tags "Tu_duree", "TU_montant", "TU_produit" et "TU_tache", car ils permettent de préciser les différents éléments qui composent la rémunération.

Exemples

Annotation correcte Commentaires
1 si les ouvrières avaient su toucher 1f50 par jour ... Le tag "TU_remuneration" s'étend sur toute la partie du texte exprimant une rémunération, les tag "TU_montant" et "TU_duree" sont utilisés en complément.
2 Leur salaire personnel varie de 1f50 à 2f50 par jour pour tous les articles courants, et sans parler de l'article riche beaucoup plus rémunérateur mais qui n'occupe qu'une infime minorité. Il est nécessaire de distinguer (et d'annoter) les informations claires et précises des formulations vagues, qu'on évitera d'annoter car elles sont difficiles à délimiter et peu exploitables. On peut utiliser des tags supplémentaires pour préciser les éléments dans la phrase.

Statut matrimonial : "TU_statutMatrimonial"

Règle

Le tag "TU_statutMatrimonal" doit être utilisé pour annoter les titres et expressions qui permettent d'identifier le statut matrimonial des personnes, en particulier des femmes.

Sauf cas particulier, on n'annote pas un statut matrimonial s'il n'est pas associé à l'annotation d'un nom de personne.

Les formulations pour désigner le statut matrimonial des femmes changent en fonction des documents, des contextes et des époques.

Exemples

Annotation correcte Commentaires
1 Le Sieur Simon, rédacteur, au Journal "Le Peuple". Cas typique d'annotation d'un statut matrimonial.
2 Le citoyen Naudan lit le rapport de la commission. Il ne s'agit pas d'un statut matrimonial mais uniquement d'une dénomination, "citoyen" n'est pas annoté comme un statut matrimonial.
2 Monsieur Le Procureur de la République S'agissant d'une fonction et non pas d'une personne, on n'annote pas "Monsieur" comme un statut matrimonial.
3 Entre Marianne Prost brodeuse à Lyon demanderesse et les mariés Tabard la femme aussi brodeuse aud Lyon deffendeurs et incidemment demandeurs. Dans cette phrase, "femme" a bien le sens d'épouse, c'est la raison pour laquelle on peut l'annoter comme un statut matrimonial.
4 Entre Margueritte Sella fille domestique à Lyon demanderesse et le nommé Gret maitre fabricant audit Lyon deffendeur. Dans cette phrase, "fille" a le sens de "mineure", cela ne constitue pas un statut matrimonial.

Tâche : "TU_tache"

Règle

Le tag "TU_tache" doit être utilisé pour identifier un mot ou un groupe de mots évoquant une action ou une tâche se rapportant au textile dans un contexte domestique ou salarial.

Exemples

Annotation correcte Commentaires
1 Phrase Commentaire
2 Phrase Commentaire
  • une tache : (à venir)...

Type de rémunération : "TU_typeRemuneration"

Règle

Le tag "TU_typeRemuneration" doit être utilisé pour annoter un mot ou groupe de mot désignant un type de rémunération.

Le type d'une rémunération n'est pas toujours explicite, auquel cas il n'est pas possible d'utiliser le tag "TU_typeRemuneration".

Le type d'une rémunération peut être explicité en dehors de la zone annotée "TU_remuneration".

La propriété type permet de classer le type de rémunération en fonction d'une liste pré-établie.

Liste des valeurs possibles de la propriété type :

avance solde total indemnité_judiciaire indemnité_syndicale solidarité

En cas de doute, on préfère ne pas remplir la propriété type.

Exemples

Annotation correcte Commentaires
1 elle ne veut accorder qu'une augmentation de 15% sur les pièces en cours et ne donne le tarif de 1885, qu'après l'achèvement de ces pièces. "sur les pièces en cours" précise qu'il s'agit d'une avance tandis que "après l'achèvement de ces pièces" correspond à un solde. On donnera donc ces deux valeurs respectivement à la propriété "type" de ces tags.
2 Il est dit que led. Charbonnier est condamné et sera contraint même par corps de payer à lad. demanderesse la somme de treize livres un sol pour solde de gages avec depens liquidés à trente deux sols outre ceux de mise a exécution "solde de gages" précise que la rémunération est de type "solde", tandis que "depens" correspond à une "indemnité judiciaire" ; ce sont donc les valeurs des propriétés de l'un et l'autre tag.