|
|
(14 révisions intermédiaires par le même utilisateur non affichées) |
Ligne 1 : |
Ligne 1 : |
− | Cette page rassemble des éléments pour guider l'annotation des sources dans Transkribus ainsi qu'un certain nombre de questions méthodologiques.
| + | == [[Guide d'annotation : remarques générales]] == |
− | | + | == [[Guide d'annotation : tags du projet Time Us]] == |
− | == Remarques générales ==
| |
− | === Sélectionner le texte ===
| |
− | Lors de l'application d'un tag dans Transkribus, il est fondamental de respecter quelques règles afin d'optimiser l'annotation des textes.
| |
− | | |
− | '''1.''' La portion de texte sélectionnée ne doit pas inclure les signes de ponctuations et les espaces situés de part et d'autre du mot ou du groupe de mots annoté. Si la ponctuation se trouve à l'intérieur de la sélection, dans une locution ou dans une adresse par exemple, elle fait bien légitimement partie du groupe de mot sur lequel porte l'annotation.
| |
− | | |
− | '''2.''' La portion de texte sélectionnée ne doit pas inclure les déterminants précédent le mot ou le groupe de mots annoté.
| |
− | | |
− | {| class="wikitable" border="1"
| |
− | | width="20%"| [[Fichier:Select-1.png|border|250px]]
| |
− | | width="80%"| La sélection inclut uniquement le texte sur lequel doit porter l'annotation.
| |
− | |-
| |
− | | width="20%"| [[Fichier:Select-2.png|border|250px]]
| |
− | | width="80%"| Cette sélection n'est pas bonne car elle intègre un déterminant inutile dans le groupe de mots annoté.
| |
− | |-
| |
− | | width="20%"| [[Fichier:Select-3.png|border|250px]]
| |
− | | width="80%"| Cette sélection n'est pas bonne car elle inclut l'espace qui précède le mot sur lequel porte l'annotation.
| |
− | |-
| |
− | | width="20%"| [[Fichier:Select-4.png|border|250px]]
| |
− | | width="80%"| Cette sélection n'est pas bonne car elle inclut la virgule qui suit le mot sur lequel porte l'annotation.
| |
− | |}
| |
− | | |
− | '''3.''' La portion de texte sélectionnée doit être la plus correcte possible : elle ne doit pas inclure plus de mots que nécessaires, mais elle doit contenir l'ensemble des éléments du groupe de mots qui constituent l'entité identifiée.
| |
− | | |
− | {| class="wikitable" border="1"
| |
− | | width="20%"| [[Fichier:Select-5.png|border|250px]]
| |
− | | width="80%"| Cette sélection n'est pas bonne car elle ne prend qu'un seul mot en compte alors qu'il fait partie d'un groupe de mots formant une entité.
| |
− | |-
| |
− | | width="20%"| [[Fichier:Select-6.png|border|250px]]
| |
− | | width="80%"| Cette sélection n'est pas bonne car elle ne prend pas tous les mots du groupe formant une entité.
| |
− | |-
| |
− | | width="20%"| [[Fichier:Select-7.png|border|250px]]
| |
− | | width="80%"| Cette sélection est correcte car elle prend en compte la totalité de l'expression formant une entité et permet d'avoir une dénomination la plus précise possible.
| |
− | |-
| |
− | | width="20%"| [[Fichier:Select-8.png|border|250px]]
| |
− | | width="80%"| Cette sélection est correcte car elle prend en compte la totalité de l'expression formant une entité ; on perdrait des informations en n'intégrant pas "ouvriers" dans la sélection, de même si on ignorait "du tissage mécanique".
| |
− | |}
| |
− | | |
− | === Appliquer un tag ===
| |
− | Pour appliquer un tag dans Transkribus, il est nécessaire de sélectionner, dans le cadre supérieur gauche de l'interface, l'onglet "metadata" puis "Textual" ('''1'''). Il faut ensuite se positionner dans la zone de transcription, c'est-à-dire dans le cadre inférieur droit de l'application, et sélectionner le texte sur lequel on souhaite appliquer un tag. Cette sélection peut s'étendre sur plusieurs lignes ('''2'''). Dans le cadre inférieur gauche, dans l'onglet Tag, sélectionner le tag à appliquer en cliquant sur le "+" vert qui lui correspond ('''3'''). Vous verrez alors apparaître le tag dans la liste de "Tags of current Transcript" en haut à gauche ('''4''').
| |
− | | |
− | [[Fichier:Tagging.png|900px|border]]
| |
− | | |
− | ==== Utiliser les propriétés ====
| |
− | Certains tags ont des propriétés dont la complétion peut s'avérer nécessaire pour l'annotation des documents du projet Time Us. Attention cependant, tous les tags possèdent certaines propriétés telles que "length", "continued" et "offset" dont les valeurs ne peuvent pas être modifiées car elles sont remplies automatiquement par l'application.
| |
− | | |
− | Certains tags par défaut possèdent des propriétés qu'il n'est pas utile de renseigner dans le cadre du projet Time Us. L'existence de propriétés attachées à un tag ne doit pas être interprétée comme une obligation pour l'annotateur·rice de remplir le champ en question. Il faut au contraire décider si cela est nécessaire en fonction des indications données dans ce guide d'annotation. Certaines propriétés ont vocation à être remplies avec des valeurs fixes dont la liste est donnée dans ce guide.
| |
− | | |
− | Pour accéder aux propriétés, il faut sélectionner le texte dans la zone de transcription, ou sélectionner le tag dans la liste "Tags of current Transcript" ('''1'''). Attention, lorsqu'un tag s'étend sur plusieurs lignes, il est affiché dans la liste "Tag of current Transcript" autant de fois qu'il y a de lignes concernées : toutes ses propriétés ne seront accessibles qu'à partir de la dernière occurrence du tag dans la liste. Lorsque plusieurs tags sont appliqués à une même portion de texte, il est préférable d'utiliser l'accès par la liste des tags plutôt que par la zone de transcription.
| |
− | | |
− | Lorsque le tag souhaité est sélectionné, cliquez sur l'onglet "Properties" dans le cadre inférieur gauche ('''2'''). Cela fera apparaître la liste des propriétés du tag ainsi que leurs valeurs. Cliquez dans la zone de texte en face d'une propriété pour lui ajouter une valeur ou modifier celle-ci ('''3'''). Pour valider cette valeur, cliquez sur "Apply to selected" en bas du cadre ('''4''') ou tapez "Entrée". Lorsque la valeur est bien enregistrée, celle-ci s'affiche dans la colonne "Properties" dans la liste "Tags of current Transcript". Si rien ne s'affiche, c'est que la valeur entrée n'a pas été prise en compte par Transkribus. Cela arrive, il suffit de recommencer. Il est parfois nécessaire de rafraîchir la liste en cliquant sur l'icône ('''6''').
| |
− | | |
− | [[Fichier:Tagging-properties.png|900px|border]]
| |
− | | |
− | === Faire un commentaire ===
| |
− | | |
− | == Tags du projet Time Us ==
| |
− | | |
− | === Tableau récapitulatif ===
| |
− | {| class="wikitable" border="1"
| |
− | !scope="col"| Tag
| |
− | !scope="col"| Propriété
| |
− | !scope="col"| Usage
| |
− | |-
| |
− | |width="20%"| TU_adresse
| |
− | |width="20%"|
| |
− | |width="60%"| Mot ou groupe de mots désignant une adresse postale
| |
− | |-
| |
− | |width="20%"| date
| |
− | |width="20%"|
| |
− | |width="60%"| Date explicite en chiffres ou en lettres
| |
− | |-
| |
− | |width="20%"| TU_document
| |
− | |width="20%"| ''type''
| |
− | |width="60%"| Titre de document de différents types
| |
− | |-
| |
− | |width="20%"| TU_duree
| |
− | |width="20%"|
| |
− | |width="60%"| Mot ou groupe de mots désignant une durée pour une travail ou un événement
| |
− | |-
| |
− | |width="20%"| TU_heure
| |
− | |width="20%"|
| |
− | |width="60%"| Mot ou groupe de mots désignant un horaire
| |
− | |-
| |
− | |width="20%"| TU_incertitude
| |
− | |width="20%"|
| |
− | |width="60%"| Mot ou groupe de mots problématique pour l'annotation
| |
− | |-
| |
− | |width="20%"| TU_montant
| |
− | |width="20%"| ''type''
| |
− | |width="60%"| Montant exprimé en lettres et/ou en chiffres
| |
− | |-
| |
− | |width="20%"| TU_occupation
| |
− | |width="20%"| ''normal''
| |
− | |width="60%"| Mot ou groupe de mots désignant un métier ou une occupation en rapport avec l'industrie du textile.
| |
− | |-
| |
− | |width="20%"| organization
| |
− | |width="20%"|
| |
− | |width="60%"| Mot ou groupe de mots désignant un établissement ou une organisation
| |
− | |-
| |
− | |width="20%"| TU_personne
| |
− | |width="20%"| ''sex''
| |
− | |width="60%"| Nom(s) d'une personne
| |
− | |-
| |
− | |width="20%"| place
| |
− | |width="20%"|
| |
− | |width="60%"| Nom de lieu
| |
− | |-
| |
− | |width="20%"| TU_produit
| |
− | |width="20%"|
| |
− | |width="60%"| Mot ou groupe de mots désignant
| |
− | |-
| |
− | |width="20%"| TU_remuneration
| |
− | |width="20%"|
| |
− | |width="60%"| Groupe de mots désignant une rémunération
| |
− | |-
| |
− | |width="20%"| TU_statutMatrimonial
| |
− | |width="20%"|
| |
− | |width="60%"| Mot ou groupe de mots désignant le statut matrimonial d'une personne
| |
− | |-
| |
− | |width="20%"| TU_tache
| |
− | |width="20%"|
| |
− | |width="60%"| Mot, nom ou verbe, ou groupe de mots désignant une tâche salariale ou domestique
| |
− | |-
| |
− | |width="20%"| TU_typeRemuneration
| |
− | |width="20%"| ''type''
| |
− | |width="60%"| Mot ou groupe de mots désignant la nature d'une rémunération
| |
− | |}
| |
− | | |
− | === TU_adresse ===
| |
− | | |
− | ==== Règle ====
| |
− | Le tag "TU_adresse" doit être utilisé pour annoter une adresse postale plus ou moins complète.
| |
− | | |
− | Une rue, avec ou sans numéro, peut être considérée comme une adresse postale.
| |
− | | |
− | Si une rue est accompagnée d'un numéro, on inclut toujours le numéro dans la sélection.
| |
− | | |
− | Si un nom de lieu est évoqué à proximité d'une adresse dans le texte, on n'inclut pas le nom du lieu dans la sélection pour le tag "TU_adresse".
| |
− | | |
− | ==== Exemples ====
| |
− | {| class="wikitable" border="1"
| |
− | !scope="col"| N°
| |
− | !scope="col"| Annotation correcte
| |
− | !scope="col"| Commentaires
| |
− | |-
| |
− | | width="10%" | 1
| |
− | | width="45%" | Maison Schutz, Salle Bichommier, <TU_adresse>Avenue des Tapis, 1</TU_adresse>
| |
− | | width="45%" | L'annotation de l'adresse porte uniquement sur "Avenue des Tapis, 1" : on n'inclut pas le nom de la salle, ni le nom de l'organisation en lien avec cette adresse.
| |
− | |-
| |
− | | width="10%" | 2
| |
− | | width="45%" | au siège du Syndicat ouvrier des tisseurs et similaires <TU_adresse>8, rue d'Austerlitz</TU_adresse>
| |
− | | width="45%" | L'annotation de l'adresse porte uniquement sur "8, rue d'Austerlitz" : on n'inclut pas le nom du lieu en lien avec cette adresse.
| |
− | |-
| |
− | | width="10%" | 3
| |
− | | width="45%" | quatre Maisons de fabriques, savoir les Maisons : Atuyer, <TU_adresse>place Tolozan, 20 et 23</TU_adresse> ; Schulz, <TU_adresse>rue du Griffon, 8</TU_adresse> ; Béraud, <TU_adresse>place Tolozan, 18</TU_adresse> : Tresca, frères, <TU_adresse>rue du Griffon, 8</TU_adresse>.
| |
− | | width="45%" | La première adresse peut poser problème puisqu'elle inclut deux numéros, dans ce cas, dans la mesure où l'adresse est celle d'un seul établissement, on inclut les deux numéros dans la sélection : "place Tolozan, 20 et 23".
| |
− | |}
| |
− | | |
− | === date === | |
− | ==== Règle ====
| |
− | Le tag "date" doit être utilisé pour annoter une date absolue exprimée en chiffres et/ou en lettres.
| |
− | | |
− | On annote une date lorsqu'elle est constituée d'une année seulement, ou bien d'un mois et une année, ou encore d'un jour, un mois et une année.
| |
− | | |
− | On n'identifie pas les expressions comme "hier", "aujourd'hui", qui sont des dates relatives au contexte.
| |
− | | |
− | Pour des intervalles de date, on annote les deux dates séparément.
| |
− | | |
− | Dans la mesure du possible, on n'annote pas les dates qui font partie d'un titre de document ou d'une expression désignant une organisation, un événement ou un lieu.
| |
− | | |
− | ==== Exemples ====
| |
− | {| class="wikitable" border="1"
| |
− | !scope="col"| N°
| |
− | !scope="col"| Annotation correcte
| |
− | !scope="col"| Commentaires
| |
− | |-
| |
− | | width="10%" | 1
| |
− | | width="45%" | la m<sup>on</sup> Bejui accepte la moité du tarif de 1885, à partir du <TU_date>26 Décembre 1894</TU_date>.
| |
− | | width="45%" | Cas typique d'annotation de la date. On n'a pas encodé "1885" car on peut considérer qu'il s'agit du titre d'un document de référence, le "tarif de 1885".
| |
− | |-
| |
− | | width="10%" | 2
| |
− | | width="45%" | Les soussignés ont l'honneur de vous informer qu'ils organisent une réunion publique à la Brasserie Française, rue des Ecoles, le Mardi <TU_date>18 décembre</TU_date> à 8 heures
| |
− | du soir
| |
− | | width="45%" | ''Faut-il annoter cette date, vu qu'il n'y a pas d'année ?''
| |
− | |-
| |
− | | width="10%" | 3
| |
− | | width="45%" | la réunion publique tenue le 20 courant à la Croix-Rousse
| |
− | | width="45%" | On n'annote pas cette date car sa résolution est dépendante du contexte
| |
− | |}
| |
− | | |
− | === TU_document ===
| |
− | | |
− | ==== Règles ====
| |
− | | |
− | Le tag "TU_document" doit être utilisé pour annoter les mentions de documents extérieurs réels faites dans le cadre du texte transcrit. Il peut s'agir d'un article de journal, d'une loi, d'un règlement, etc.
| |
− | | |
− | On annote uniquement la mention d'un document extérieur lorsque celui-ci est nommé précisément.
| |
− | | |
− | On remplit systématiquement la propriété "'''type'''" en lui attribuant une valeur tirée de la liste suivante, qui permet d'identifier la nature du document.
| |
− | {| class="wikitable" border="1"
| |
− | |-
| |
− | |width="20%"| presse
| |
− | |width="20%"| loi
| |
− | |width="20%"| tarif
| |
− | |width="20%"| règlement
| |
− | |width="20%"| ...
| |
− | |}
| |
− | | |
− | En cas de doute sur la nature du document, on préfère cependant ne attribuer de valeur à la propriété.
| |
− | | |
− | ==== Exemples ====
| |
− | {| class="wikitable" border="1"
| |
− | !scope="col"| N°
| |
− | !scope="col"| Annotation correcte
| |
− | !scope="col"| Commentaires
| |
− | |-
| |
− | | width="10%" | 1
| |
− | | width="45%" | Naudot a demandé ensuite si l'article de fond du "Nouveau Lyon" de ce matin intitulé "<TU_document>Grève générale</TU_document>" n'avait pas été inspiré par les fabricants
| |
− | | width="45%" | On a annoté le titre du document en attribuant la valeur "presse" à la propriété "type" du tag. On n'a pas inclus dans la sélection le nom du journal qui l'a publié.
| |
− | |-
| |
− | | width="10%" | 2
| |
− | | width="45%" | La Maison Chavent (art façonné) s'est rendue aux justes réclamations des tisseurs ; elle a accepté le <TU_document>tarif de 85</TU_document>, en son entier.
| |
− | | width="45%" | Ce cas est plus difficile à traiter, mais on peut considérer qu'il s'agit d'une référence à un document dans la mesure où dans ce contexte un "tarif" fait référence à une série de tables où sont énumérés tous les prix sur lesquels se sont accordés les acteurs de l'industrie. En outre, identifier ce genre de référence permet souvent de clarifier un prix exprimé de manière relative à un tarif. On donnera à la propriété "type" la valeur "tarif".
| |
− | |}
| |
− | | |
− | === TU_duree ===
| |
− | | |
− | ==== Règle ====
| |
− | Le tag "TU_duree" doit être utilisé pour identifier des mots ou groupes de mots faisant référence à une information permettant de mesurer la durée d'une tâche précise ou d'un événement.
| |
− | | |
− | Les entités concernées peuvent correspondre à une plage de temps (le nombre d'heures travaillées quotidiennement, ou encore la durée d'une réunion syndicale), à un rythme ("par jour", "par semaine", etc) ou encore une échéance associée à un travail.
| |
− | | |
− | Les entités concernées sont très variées et parfois difficiles à cerner : en cas de doute, on préfère donc ne pas annoter.
| |
− | | |
− | | |
− | ==== Exemples ====
| |
− | {| class="wikitable" border="1"
| |
− | !scope="col"| N°
| |
− | !scope="col"| Annotation correcte
| |
− | !scope="col"| Commentaires
| |
− | |-
| |
− | | width="10%" | 1
| |
− | | width="45%" | Les prix sont toujours les mêmes il y a des ouvriers depuis 3f jusqu'à 10 et 12 <TU_duree>par journée</TU_duree>.
| |
− | | width="45%" | Cas typique d'annotation d'une durée associée à une rémunération.
| |
− | |-
| |
− | | width="10%" | 2
| |
− | | width="45%" | L'ouvrier a du subir une baisse nuisible dans les prix de la journée de travail.
| |
− | | width="45%" | L'expression "journée de travail" n'est pas à proprement une durée ici, on ne l'annote donc pas.
| |
− | |-
| |
− | | width="10%" | 3
| |
− | | width="45%" | Les ouvriers qui travaillent pour le compte d'un chef d'atelier gagnent à peine de 35 à 45f <TU_duree>par mois</TU_duree>. Quant à ceux qui ont leur métier ils ont subi une diminution de 50c par mètre.
| |
− | | width="45%" | L'expression "par mois" qui se rapporte aux sommes qui la précèdent est annotée comme une durée. Ce n'est en revanche pas le cas de l'expression "par mètre" qui, même si elle apporte une information sur ce à quoi se rapporte la somme qui la précède, n'est pas une information de temps.
| |
− | |-
| |
− | | width="10%" | 4
| |
− | | width="45%" | Les grévistes pouvaient toucher <TU_duree>tous les soirs</TU_duree> la somme de 1f50.
| |
− | | width="45%" | "Tous les soirs" est bien une information sur le rythme ou la durée associé(e) à une rémunération.
| |
− | |-
| |
− | | width="10%" | 5
| |
− | | width="45%" | Seulement il a que cette maison ne tienne plus d'ici deux ou trois mois, l'engagement qu'elle prend aujourd'hui.
| |
− | | width="45%" | On a bien ici l'expression d'une échéance, qui pourrait être annotée comme une durée dans un autre cas. Cependant, dans ce contexte, l'information n'est pas pertinente : il ne s'agit pas d'une échéance donnée pour l'accomplissement d'une tâche.
| |
− | |}
| |
− | | |
− | === TU_heure ===
| |
− | | |
− | ==== Règles ====
| |
− | L'usage du tag "TU_heure" est plus strict que le tag "TU_duree". Il ne doit être utilisé que pour annoter les heures clairement exprimées dans les documents.
| |
− | | |
− | De manière générale, on se concentre sur les heures qui concernent des activités se rapportant à l'industrie du textile.
| |
− | | |
− | ==== Exemples ====
| |
− | {| class="wikitable" border="1"
| |
− | !scope="col"| N°
| |
− | !scope="col"| Annotation correcte
| |
− | !scope="col"| Commentaires
| |
− | |-
| |
− | | width="10%" | 1
| |
− | | width="45%" | La séance a été ouverte à <TU_heure>8h 1/4</TU_heure> et levée à <TU_heure>10 heures</TU_heure>.
| |
− | | width="45%" | On inclut dans la sélection tous les éléments qui composent l'heure, quelle que soit la forme utilisée pour les exprimer : ici par exemple "1/4".
| |
− | |-
| |
− | | width="10%" | 2
| |
− | | width="45%" | Les heures d'entrées et de sorties sont exactement les suivantes :
| |
− | Matin : Entrée <TU_heure>7 heures</TU_heure> - sortie <TU_heure>midi</TU_heure>
| |
− | Soir : Entrée <TU_heure>2h</TU_heure>. - sortie <TU_heure>7h</TU_heure>
| |
− | | width="45%" | On distingue chaque occurrence de l'expression d'une heure.
| |
− | |-
| |
− | | width="10%" | 3
| |
− | | width="45%" | Il invite les grévistes à se réunir aujourd'hui à <TU_heure>2 heures de l'après-midi</TU_heure>
| |
− | | width="45%" | Lorsque cela est possible, on peut inclure dans la sélection des formules comme "de l'après-midi" qui permettent de préciser l'horaire dont il est question.
| |
− | |}
| |
− | | |
− | === TU_incertitude ===
| |
− | ==== Règle ====
| |
− | Le tag "TU_incertitude" permet à l'annotateur·ice de signaler un cas problématique dans l'annotation.
| |
− | | |
− | Il est à utiliser en cas d'hésitation sur le tag à employer, sur la zone à sélectionner ou sur la nécessité d'annoter un passage, etc.
| |
− | | |
− | Une bonne pratique de signalement consiste à accompagner l'utilisation de ce tag d'un commentaire expliquant le problème rencontré ou la raison de l'hésitation.
| |
− | | |
− | ==== Exemples ====
| |
− | {| class="wikitable" border="1"
| |
− | !scope="col"| N°
| |
− | !scope="col"| Annotation correcte
| |
− | !scope="col"| Commentaires
| |
− | |-
| |
− | | width="10%" | 1
| |
− | | width="45%" | Une réunion privée organisée par la <TU_incertitude>Commission du relèvement des salaires</TU_incertitude> et par le syndicat des ouvrières et ouvriers du tisage mécanique, a eu lieu hier 18.
| |
− | | width="45%" | Dans ce cas de figure, on couplerait la sélection d'un commentaire, par exemple : "faut-il utiliser le tag organization?"
| |
− | |}
| |
− | | |
− | === TU_montant ===
| |
− | ==== Règle ====
| |
− | Le tag "TU_montant" doit être utilisé pour identifier la mention d'un montant dans le cadre d'une rémunération. Ce montant peut se référer ou non à une rémunération financière. On essaiera autant que possible de préciser si ce montant est exprimé de manière absolue ou relative en remplissant la propriété '''type'''. En cas de doute, on préfère ne pas remplir la propriété '''type'''
| |
− | | |
− | Liste des valeurs possibles pour la propriété '''type''' :
| |
− | {| class="wikitable" border="1"
| |
− | |-
| |
− | |width="50%"| relatif
| |
− | |width="50%"| absolu
| |
− | |}
| |
− | ==== Exemples ====
| |
− | {| class="wikitable" border="1"
| |
− | !scope="col"| N°
| |
− | !scope="col"| Annotation correcte
| |
− | !scope="col"| Commentaires
| |
− | |-
| |
− | | width="10%" | 1
| |
− | | width="45%" | Phrase
| |
− | | width="45%" | Commentaire
| |
− | |-
| |
− | | width="10%" | 2
| |
− | | width="45%" | Phrase
| |
− | | width="45%" | Commentaire
| |
− | |}
| |
− | | |
− | * Moyenne du salaire journalier des 10 plus mauvaises ouvrières, <TU_montant>2fr. 26c</TU_montant>. pendant le mois dernier.
| |
− | * Leur salaire personnel varie de 1f50 à 2f50 par jour pour tous les articles courants
| |
− | * La mon Ritton. Bardon, accepte le tarif fe 1885 avec réserves sur les beugalines et petits taffetas, articles qu'elle s'engage à payer 0f05 de plus que toutes ses concurentes
| |
− | | |
− | === TU_occupation ===
| |
− | ==== Règle ====
| |
− | Le tag "Tu_occupation" doit être utilisé pour identifier un métier ou une occupation. On veillera à sélectionner la totalité de l'expression désignant le métier ou l'occupation. On veillera cependant à ne pas annoter les fonctions comme "Commissaire général" ou encore "président" ou "secrétaire (général)". La propriété '''normal''' doit être remplie avec l'expression normalisée de ce métier ou de cette occupation dans le cas ou la tournure de la phrase rendrait impossible l'encodage de la totalité de la mention du métier.
| |
− | | |
− | ==== Exemples ====
| |
− | {| class="wikitable" border="1"
| |
− | !scope="col"| N°
| |
− | !scope="col"| Annotation correcte
| |
− | !scope="col"| Commentaires
| |
− | |-
| |
− | | width="10%" | 1
| |
− | | width="45%" | Phrase
| |
− | | width="45%" | Commentaire
| |
− | |-
| |
− | | width="10%" | 2
| |
− | | width="45%" | Phrase
| |
− | | width="45%" | Commentaire
| |
− | |}
| |
− |
| |
− | * Une réunion privée des <TU_occupation>ouvriers et ouvrières du tissage mécanique</TU_occupation> a eu lieu hier,
| |
− | | |
− | === organization ===
| |
− | ==== Règle ====
| |
− | Le tag "organization" doit être utilisé pour identifier les établissement et organisations comme les usines, les chambres syndicales, etc. Ce tag peut être accompagné du tag "personne" ou du tag "occupation" lorsque l'organisation contient le nom d'une personne ou fait référence à un métier.
| |
− | | |
− | ==== Exemples ====
| |
− | {| class="wikitable" border="1"
| |
− | !scope="col"| N°
| |
− | !scope="col"| Annotation correcte
| |
− | !scope="col"| Commentaires
| |
− | |-
| |
− | | width="10%" | 1
| |
− | | width="45%" | Phrase
| |
− | | width="45%" | Commentaire
| |
− | |-
| |
− | | width="10%" | 2
| |
− | | width="45%" | Phrase
| |
− | | width="45%" | Commentaire
| |
− | |}
| |
− |
| |
− | * Une gréviste de la <TU_organization>Maison Gindre</TU_organization>
| |
− | * Une gréviste de la <TU_organization>Maison <TU_personne>Gindre</TU_personne></TU_organization>
| |
− | * La continuation de la mise à l'index des <TU_organization>Maison <TU_personne>Algoud</TU_personne>, frères</TU_organization> et <TU_organization>Coté, Ducoté et Cie</TU_organization>.
| |
− | | |
− | === TU_personne ===
| |
− | ==== Règle ====
| |
− | Le tag "TU_personne" doit être utilisé pour identifier des personnes généralement mentionnées par leur nom. Le tag porte sur la totalité de l'identité de la personne, pas uniquement sur son patronyme. La propriété '''sex''' peut être utilisée pour préciser le genre de la personne lorsque cela n'est pas explicite.
| |
− | | |
− | ==== Exemples ====
| |
− | {| class="wikitable" border="1"
| |
− | !scope="col"| N°
| |
− | !scope="col"| Annotation correcte
| |
− | !scope="col"| Commentaires
| |
− | |-
| |
− | | width="10%" | 1
| |
− | | width="45%" | Phrase
| |
− | | width="45%" | Commentaire
| |
− | |-
| |
− | | width="10%" | 2
| |
− | | width="45%" | Phrase
| |
− | | width="45%" | Commentaire
| |
− | |}
| |
− | | |
− | * <TU_personne>M. Gindre</TU_personne> lui aurait répondu qu'elle pouvait reprendre le travail si ça lui faisait plaisir
| |
− | * Monsieur le Préfet du Rhône
| |
− | | |
− | === Place ===
| |
− | ==== Règle ====
| |
− | Le tag "place" doit être utilisé pour identifier un lieu. Le tag porte sur la totalité des mots qui désignent le lieu annoté. Il ne sert pas à identifier les adresses, car c'est le rôle du tag "adresse". Dans certains cas, un établissement peut également être considéré comme un lieu : on laisse à l'annotateur le soin de trancher ce qui fait le plus sens dans la phrase ; il est cependant possible de combiner les tags "place" et "organization" sur une même sélection.
| |
− | | |
− | ==== Exemples ====
| |
− | {| class="wikitable" border="1"
| |
− | !scope="col"| N°
| |
− | !scope="col"| Annotation correcte
| |
− | !scope="col"| Commentaires
| |
− | |-
| |
− | | width="10%" | 1
| |
− | | width="45%" | Phrase
| |
− | | width="45%" | Commentaire
| |
− | |-
| |
− | | width="10%" | 2
| |
− | | width="45%" | Phrase
| |
− | | width="45%" | Commentaire
| |
− | |}
| |
− |
| |
− | * Place de la Croix-Rousse. 4 dans une des salles du <TU_place>café Verdior</TU_place>.
| |
− | | |
− | === TU_produit ===
| |
− | ==== Règle ====
| |
− | Le tag "TU_produit" doit être utilisé pour identifier un produit, qu'il s'agisse d'un produit fini ou dans un état intermédiaire, le plus souvent dans le cadre d'une rémunération.
| |
− | | |
− | ==== Exemples ====
| |
− | {| class="wikitable" border="1"
| |
− | !scope="col"| N°
| |
− | !scope="col"| Annotation correcte
| |
− | !scope="col"| Commentaires
| |
− | |-
| |
− | | width="10%" | 1
| |
− | | width="45%" | Phrase
| |
− | | width="45%" | Commentaire
| |
− | |-
| |
− | | width="10%" | 2
| |
− | | width="45%" | Phrase
| |
− | | width="45%" | Commentaire
| |
− | |}
| |
− |
| |
− | * Les chefs d'atelier de cette Maison ont fait tout ce qu'il était possible de faire et ils sont arrivés à lui faire accepter le tarif de 1885, en ce qui concerne les <TU_produit>façonnés</TU_produit>.
| |
− | * La mon Ritton. Bardon, accepte le tarif fe 1885 avec réserves sur les beugalines et petits taffetas, articles qu'elle s'engage à payer 0f05 de plus que toutes ses concurentes
| |
− | | |
− | === TU_remuneration ===
| |
− | ==== Règle ====
| |
− | Le tag "TU_remuneration" doit être utilisé pour identifier une partie d'une phrase contenant des informations sur une rémunération. Les rémunérations étant exprimées d'une manière très diverse en fonction des documents, ce tag est un tag général qui permet de localiser un ensemble d'information qui peuvent par ailleurs être difficile à annoter. En complément du tag "TU_remuneration", on utilisera autant que possible le tag "TU_typeRemuneration", et les tags "Tu_duree", "TU_montant", "TU_produit" et "TU_tache", car ils permettent de préciser les différents éléments qui compose la rémunération.
| |
− | | |
− | ==== Exemples ====
| |
− | {| class="wikitable" border="1"
| |
− | !scope="col"| N°
| |
− | !scope="col"| Annotation correcte
| |
− | !scope="col"| Commentaires
| |
− | |-
| |
− | | width="10%" | 1
| |
− | | width="45%" | Phrase
| |
− | | width="45%" | Commentaire
| |
− | |-
| |
− | | width="10%" | 2
| |
− | | width="45%" | Phrase
| |
− | | width="45%" | Commentaire
| |
− | |}
| |
− | | |
− | * si les ouvrières [...] avaient su <TU_remuneration>toucher <TU_montant>1f50</TU_montant> <TU_duree>par jour</TU_duree></TU_remuneration>
| |
− | | |
− | === TU_statutMatrimonial ===
| |
− | ==== Règle ====
| |
− | Le tag "TU_statutMatrimonal" doit être utilisé pour identifier les titres et expressions qui permettent d'identifier le statut matrimonial des personnes, en particulier des femmes.
| |
− | | |
− | ==== Exemples ====
| |
− | {| class="wikitable" border="1"
| |
− | !scope="col"| N°
| |
− | !scope="col"| Annotation correcte
| |
− | !scope="col"| Commentaires
| |
− | |-
| |
− | | width="10%" | 1
| |
− | | width="45%" | Phrase
| |
− | | width="45%" | Commentaire
| |
− | |-
| |
− | | width="10%" | 2
| |
− | | width="45%" | Phrase
| |
− | | width="45%" | Commentaire
| |
− | |}
| |
− | | |
− | * Le <TU_statutMatrimonial>Sieur</TU_statutMatrimonial> Simon, rédacteur, au Journal "Le Peuple" a également annoncé à l'assemblée qu'une somme de 500 francs serait fournie par son journal aux grévistes.
| |
− | | |
− | === TU_tache ===
| |
− | ==== Règle ====
| |
− | Le tag "TU_tache" doit être utilisé pour identifier un mot ou un groupe de mots évoquant une action ou une tâche se rapportant au textile dans un contexte domestique ou salarial.
| |
− | | |
− | ==== Exemples ====
| |
− | {| class="wikitable" border="1"
| |
− | !scope="col"| N°
| |
− | !scope="col"| Annotation correcte
| |
− | !scope="col"| Commentaires
| |
− | |-
| |
− | | width="10%" | 1
| |
− | | width="45%" | Phrase
| |
− | | width="45%" | Commentaire
| |
− | |-
| |
− | | width="10%" | 2
| |
− | | width="45%" | Phrase
| |
− | | width="45%" | Commentaire
| |
− | |}
| |
− | | |
− | * <TU_tache>une tache</TU_tache> : (à venir)...
| |
− | | |
− | === TU_typeRemuneration ===
| |
− | ==== Règle ====
| |
− | Le tag "TU_typeRemuneration" doit être utilisé pour identifier une expression précisant le type d'une rémunération. La propriété '''type''' permet de classer le type de rémunération en fonction d'une liste pré-établie.
| |
− | | |
− | Liste des valeurs possibles de la propriété '''type''' ''(cette liste sera complétée en fonction des cas rencontrés)'' :
| |
− | {| class="wikitable" border="1"
| |
− | |-
| |
− | |width="15%"| avance
| |
− | |width="15%"| solde
| |
− | |width="15%"| total
| |
− | |width="15%"| indemnité_judiciaire
| |
− | |width="15%"| indemnité_syndicale
| |
− | |width="15%"| solidarité
| |
− | |}
| |
− | | |
− | ==== Exemples ====
| |
− | {| class="wikitable" border="1"
| |
− | !scope="col"| N°
| |
− | !scope="col"| Annotation correcte
| |
− | !scope="col"| Commentaires
| |
− | |-
| |
− | | width="10%" | 1
| |
− | | width="45%" | Phrase
| |
− | | width="45%" | Commentaire
| |
− | |-
| |
− | | width="10%" | 2
| |
− | | width="45%" | Phrase
| |
− | | width="45%" | Commentaire
| |
− | |}
| |
− |
| |
− | * Les fabricants se sont montrés favorables à une augmentation immédiate des <TU_typeRemuneration>prix de façon</TU_typeRemuneration>
| |
− | * elle ne veut accorder qu'<TU_remuneration>une augmentation de 15% <TU_typeRemuneration>sur les pièces en cours</TU_typeRemuneration></TU_remuneration> et <TU_remuneration>ne donne le tarif de 1885, qu'<TU_typeRemuneration>après l'achèvement de ces pièces</TU_typeRemuneration></TU_remuneration>.
| |