Guide d'annotation : Différence entre versions
(→Sélectionner le texte) |
(→Sélectionner le texte) |
||
Ligne 36 : | Ligne 36 : | ||
|- | |- | ||
| width="20%"| [[Fichier:Select-8.png|border|250px]] | | width="20%"| [[Fichier:Select-8.png|border|250px]] | ||
− | | width="80%"| Cette sélection est | + | | width="80%"| Cette sélection est correcte car elle prend en compte la totalité de l'expression formant une entité ; on perdrait des informations en n'intégrant pas "ouvriers" dans la sélection, de même si on ignorait "du tissage mécannique". |
|} | |} | ||
Version du 27 avril 2018 à 16:34
Cette page rassemble des éléments pour guider l'annotation des sources dans Transkribus ainsi qu'un certain nombre de questions méthodologiques.
Sommaire
- 1 Remarques générales
- 2 Tags du projet Time Us
Remarques générales
Sélectionner le texte
Lors de l'application d'un tag dans Transkribus, il est fondamental de respecter quelques règles afin d'optimiser l'annotation des textes.
1. La portion de texte sélectionnée ne doit pas inclure les signes de ponctuations et les espaces situés de part et d'autre du mot ou du groupe de mots annoté. Si la ponctuation se trouve à l'intérieur de la sélection, dans une locution ou dans une adresse par exemple, elle fait bien légitimement partie du groupe de mot sur lequel porte l'annotation.
2. La portion de texte sélectionnée ne doit pas inclure les déterminants précédent le mot ou le groupe de mots annoté.
3. La portion de texte sélectionnée doit être la plus correcte possible : elle ne doit pas inclure plus de mots que nécessaires, mais elle doit contenir l'ensemble des éléments du groupe de mot qui constituent l'entité identifiée.
Appliquer un tag
Pour appliquer un tag dans Transkribus, il est nécessaire de sélectionner, dans le cadre supérieur gauche de l'interface, l'onglet "metadata" puis "Textual" (1). Il faut ensuite se positionner dans la zone de transcription, c'est-à-dire dans le cadre inférieur droit de l'application, et sélectionner le texte sur lequel on souhaite appliquer un tag. Cette sélection peut s'étendre sur plusieurs lignes (2). Dans le cadre inférieur gauche, dans l'onglet Tag, sélectionner le tag à appliquer en cliquant sur le "+" vert qui lui correspond (3). Vous verrez alors apparaître le tag dans la liste de "Tags of current Transcript" en haut à gauche (4).
Utiliser les propriétés
Certains tags ont des propriétés dont la complétion peut s'avérer nécessaire pour l'annotation des documents du projet Time Us. Attention cependant, tous les tags possèdent certaines propriétés telles que "length", "continued" et "offset" dont les valeurs ne peuvent pas être modifiées car elles sont remplies automatiquement par l'application.
Certains tags par défaut possèdent des propriétés qu'il n'est pas utile de renseigner dans le cadre du projet Time Us. L'existence de propriétés attachées à un tag n'est donc pas à interpréter comme une obligation pour l'annotateur.rice de remplir le champ en question. Il faut au contraire décider si cela est nécessaire en fonction des indications données dans ce guide d'annotation. Certaines propriétés ont vocation à être remplies avec des valeurs fixes dont la liste est donnée dans ce guide.
Pour accéder aux propriétés, il faut sélectionner le texte dans la zone de transcription, ou sélectionner le tag dans la liste "Tags of current Transcript" (1). Attention, lorsqu'un tag s'étend sur plusieurs lignes, il est multiplié par le nombre de lignes concernées dans la liste "Tag of current Transcript". Toutes ses propriétés ne seront accessibles qu'à partir de la dernière occurrence du tag dans la liste. Lorsque plusieurs tags sont appliqués à une même portion de texte, il est préférable d'utiliser l'accès par la liste des tags plutôt que par la zone de transcription.
Lorsque le tag souhaité est sélectionné, cliquez sur l'onglet "Properties" dans le cadre inférieur gauche (2). Cela fera apparaître la liste des propriétés du tag ainsi que leur valeur. Cliquez dans la zone de texte en face d'une propriété pour lui ajouter une valeur ou modifier celle-ci (3). Pour valider cette valeur, cliquez sur "Apply to selected" en bas du cadre (4) ou tapez "Entrée". Lorsque la valeur est bien enregistrée, celle-ci s'affiche dans la colonne "Properties" dans la liste "Tags of current Transcript". Si rien ne s'affiche, c'est que la valeur entrée n'a pas été prise en compte par Transkribus. Cela arrive, il suffit de recommencer. Il est parfois nécessaire de rafraîchir la liste en cliquant sur l'icône (6).
Faire un commentaire
Tags du projet Time Us
Tableau récapitulatif
Tag | Propriété | Usage |
---|---|---|
TU_adresse | Mot ou groupe de mots désignant une adresse postale | |
date | Date explicite en chiffres ou en lettres | |
TU_document | type | Titre de document de différents types |
TU_duree | Mot ou groupe de mots désignant une durée pour une travail ou un événement | |
TU_heure | Mot ou groupe de mots désignant un horaire | |
TU_incertitude | Mot ou groupe de mots problématique pour l'annotation | |
TU_montant | type | Montant exprimé en lettres et/ou en chiffres |
TU_occupation | normal | Mot ou groupe de mots désignant un métier ou une occupation en rapport avec l'industrie du textile. |
organization | Mot ou groupe de mots désignant un établissement ou une organisation | |
TU_personne | sex | Nom(s) d'une personne |
place | Nom de lieu | |
TU_produit | Mot ou groupe de mots désignant | |
TU_remuneration | Groupe de mots désignant une rémunération | |
TU_statutMatrimonial | Mot ou groupe de mots désignant le statut matrimonial d'une personne | |
TU_tache | Mot, nom ou verbe, ou groupe de mots désignant une tâche salariale ou domestique | |
TU_typeRemuneration | type | Mot ou groupe de mots désignant la nature d'une rémunération |
TU_adresse
Règle
Le tag "TU_adresse" doit être utilisé pour annoter une adresse postale plus ou moins complète.
Une rue, avec ou sans numéro, peut être considérée comme une adresse postale.
Si une rue est accompagnée d'un numéro, on inclut toujours le numéro dans la sélection.
Si un nom de lieu est évoqué à proximité d'une adresse dans le texte, on n'inclut pas le nom du lieu dans la sélection pour le tag "TU_adresse".
Exemples
N° | Annotation correcte | Commentaires |
---|---|---|
1 | Maison Schutz, Salle Bichommier, Avenue des Tapis, 1 | L'annotation de l'adresse porte uniquement sur "Avenue des Tapis, 1" : on n'inclut pas le nom de la salle, ni le nom de l'organisation en lien avec cette adresse. |
2 | au siège du Syndicat ouvrier des tisseurs et similaires 8, rue d'Austerlitz | L'annotation de l'adresse porte uniquement sur "8, rue d'Austerlitz" : on n'inclut pas le nom du lieu en lien avec cette adresse. |
3 | quatre Maisons de fabriques, savoir les Maisons : Atuyer, place Tolozan, 20 et 23 ; Schulz, rue du Griffon, 8 ; Béraud, place Tolozan, 18 : Tresca, frères, rue du Griffon, 8. | La première adresse peut poser problème puisqu'elle inclut deux numéros, dans ce cas, dans la mesure où l'adresse est celle d'un seul établissement, on inclut les deux numéros dans la sélection : "place Tolozan, 20 et 23". |
date
Règle
Le tag "date" doit être utilisé pour annoter une date absolue exprimée en chiffres et/ou en lettres.
On annote une date lorsqu'elle est constituée d'une année seulement, ou bien d'un mois et une année, ou encore d'un jour, un mois et une année.
On n'identifie pas les expressions comme "hier", "aujourd'hui", qui sont des dates relatives au contexte.
Pour des intervalles de date, on annote les deux dates séparément.
Dans la mesure du possible, on n'annote pas les dates qui font partie d'un titre de document ou d'une expression désignant une organisation, un événement ou un lieu.
Exemples
N° | Annotation correcte | Commentaires |
---|---|---|
1 | la mon Bejui accepte la moité du tarif de 1885, à partir du 26 Décembre 1894. | Cas typique d'annotation de la date. |
2 | Les soussignés ont l'honneur de vous informer qu'ils organisent une réunion publique à la Brasserie Française, rue des Ecoles, le Mardi 18 décembre à 8 heures
du soir |
Faut-il annoter cette date, vu qu'il n'y a pas d'année ? |
3 | la réunion publique tenue le 20 courant à la Croix-Rousse | On n'annote pas cette date car sa résolution est dépendante du contexte |
TU_document
Règles
Le tag "TU_document" doit être utilisé pour identifier des références à des documents existants, comme par exemple un article de journal, une loi, un règlement, etc. La propriété type de ce tag doit être remplie afin de préciser de quel type de document il s'agit. En cas de doute, on préfère ne pas remplir la propriété type.
Liste des valeurs possibles pour la propriété type (cette liste sera complétée en fonction des cas rencontrés) :
presse | loi | tarif | règlement | ... |
Exemples
N° | Annotation correcte | Commentaires |
---|---|---|
1 | Phrase | Commentaire |
2 | Phrase | Commentaire |
- La Maison Chavent (art façonné) s'est rendue aux justes réclamations des tisseurs ; elle a accepté le tarif de 85, en son entier.
TU_duree
Règle
Le tag "TU_duree" doit être utilisé pour identifier des mots ou groupes de mots faisant référence à une durée soit pour une tâche précise, soit pour un événement précis.
Exemples
N° | Annotation correcte | Commentaires |
---|---|---|
1 | Phrase | Commentaire |
2 | Phrase | Commentaire |
- une durée : (à venir)...
TU_heure
Règles
Le tag "TU_heure" doit être utilisé pour identifier une référence à un horaire rythmant notamment la vie des ouvriers du textile.
Exemples
N° | Annotation correcte | Commentaires |
---|---|---|
1 | Phrase | Commentaire |
2 | Phrase | Commentaire |
- Il invite les grévistes à se réunir aujourd'hui à 2heures de l'après-midi
TU_incertitude
Règle
Le tag "TU_incertitude" permet à l'annotateur.ice de signaler un cas problématique dans l'annotation : une hésitation sur le tag à employer, sur la zone à sélectionner, sur la nécessité de tagger le passage. Une bonne pratique de signalement consiste à accompagner l'utilisation de ce tag d'un commentaire expliquant le problème rencontré.
Exemples
N° | Annotation correcte | Commentaires |
---|---|---|
1 | Phrase | Commentaire |
2 | Phrase | Commentaire |
- un problème d'annotation : (à venir)...
TU_montant
Règle
Le tag "TU_montant" doit être utilisé pour identifier la mention d'un montant dans le cadre d'une rémunération. Ce montant peut se référer ou non à une rémunération financière. On essaiera autant que possible de préciser si ce montant est exprimé de manière absolue ou relative en remplissant la propriété type. En cas de doute, on préfère ne pas remplir la propriété type
Liste des valeurs possibles pour la propriété type :
relatif | absolu |
Exemples
N° | Annotation correcte | Commentaires |
---|---|---|
1 | Phrase | Commentaire |
2 | Phrase | Commentaire |
- Moyenne du salaire journalier des 10 plus mauvaises ouvrières, 2fr. 26c. pendant le mois dernier.
- Leur salaire personnel varie de 1f50 à 2f50 par jour pour tous les articles courants
- La mon Ritton. Bardon, accepte le tarif fe 1885 avec réserves sur les beugalines et petits taffetas, articles qu'elle s'engage à payer 0f05 de plus que toutes ses concurentes
TU_occupation
Règle
Le tag "Tu_occupation" doit être utilisé pour identifier un métier ou une occupation. On veillera à sélectionner la totalité de l'expression désignant le métier ou l'occupation. On veillera cependant à ne pas annoter les fonctions comme "Commissaire général" ou encore "président" ou "secrétaire (général)". La propriété normal doit être remplie avec l'expression normalisée de ce métier ou de cette occupation dans le cas ou la tournure de la phrase rendrait impossible l'encodage de la totalité de la mention du métier.
Exemples
N° | Annotation correcte | Commentaires |
---|---|---|
1 | Phrase | Commentaire |
2 | Phrase | Commentaire |
- Une réunion privée des ouvriers et ouvrières du tissage mécanique a eu lieu hier,
organization
Règle
Le tag "organization" doit être utilisé pour identifier les établissement et organisations comme les usines, les chambres syndicales, etc. Ce tag peut être accompagné du tag "personne" ou du tag "occupation" lorsque l'organisation contient le nom d'une personne ou fait référence à un métier.
Exemples
N° | Annotation correcte | Commentaires |
---|---|---|
1 | Phrase | Commentaire |
2 | Phrase | Commentaire |
- Une gréviste de la Maison Gindre
- Une gréviste de la Maison Gindre
- La continuation de la mise à l'index des Maison Algoud, frères et Coté, Ducoté et Cie.
TU_personne
Règle
Le tag "TU_personne" doit être utilisé pour identifier des personnes généralement mentionnées par leur nom. Le tag porte sur la totalité de l'identité de la personne, pas uniquement sur son patronyme. La propriété sex peut être utilisée pour préciser le genre de la personne lorsque cela n'est pas explicite.
Exemples
N° | Annotation correcte | Commentaires |
---|---|---|
1 | Phrase | Commentaire |
2 | Phrase | Commentaire |
- M. Gindre lui aurait répondu qu'elle pouvait reprendre le travail si ça lui faisait plaisir
- Monsieur le Préfet du Rhône
Place
Règle
Le tag "place" doit être utilisé pour identifier un lieu. Le tag porte sur la totalité des mots qui désignent le lieu annoté. Il ne sert pas à identifier les adresses, car c'est le rôle du tag "adresse". Dans certains cas, un établissement peut également être considéré comme un lieu : on laisse à l'annotateur le soin de trancher ce qui fait le plus sens dans la phrase ; il est cependant possible de combiner les tags "place" et "organization" sur une même sélection.
Exemples
N° | Annotation correcte | Commentaires |
---|---|---|
1 | Phrase | Commentaire |
2 | Phrase | Commentaire |
- Place de la Croix-Rousse. 4 dans une des salles du café Verdior.
TU_produit
Règle
Le tag "TU_produit" doit être utilisé pour identifier un produit, qu'il s'agisse d'un produit fini ou dans un état intermédiaire, le plus souvent dans le cadre d'une rémunération.
Exemples
N° | Annotation correcte | Commentaires |
---|---|---|
1 | Phrase | Commentaire |
2 | Phrase | Commentaire |
- Les chefs d'atelier de cette Maison ont fait tout ce qu'il était possible de faire et ils sont arrivés à lui faire accepter le tarif de 1885, en ce qui concerne les façonnés.
- La mon Ritton. Bardon, accepte le tarif fe 1885 avec réserves sur les beugalines et petits taffetas, articles qu'elle s'engage à payer 0f05 de plus que toutes ses concurentes
TU_remuneration
Règle
Le tag "TU_remuneration" doit être utilisé pour identifier une partie d'une phrase contenant des informations sur une rémunération. Les rémunérations étant exprimées d'une manière très diverse en fonction des documents, ce tag est un tag général qui permet de localiser un ensemble d'information qui peuvent par ailleurs être difficile à annoter. En complément du tag "TU_remuneration", on utilisera autant que possible le tag "TU_typeRemuneration", et les tags "Tu_duree", "TU_montant", "TU_produit" et "TU_tache", car ils permettent de préciser les différents éléments qui compose la rémunération.
Exemples
N° | Annotation correcte | Commentaires |
---|---|---|
1 | Phrase | Commentaire |
2 | Phrase | Commentaire |
- si les ouvrières [...] avaient su toucher 1f50 par jour
TU_statutMatrimonial
Règle
Le tag "TU_statutMatrimonal" doit être utilisé pour identifier les titres et expressions qui permettent d'identifier le statut matrimonial des personnes, en particulier des femmes.
Exemples
N° | Annotation correcte | Commentaires |
---|---|---|
1 | Phrase | Commentaire |
2 | Phrase | Commentaire |
- Le Sieur Simon, rédacteur, au Journal "Le Peuple" a également annoncé à l'assemblée qu'une somme de 500 francs serait fournie par son journal aux grévistes.
TU_tache
Règle
Le tag "TU_tache" doit être utilisé pour identifier un mot ou un groupe de mots évoquant une action ou une tâche se rapportant au textile dans un contexte domestique ou salarial.
Exemples
N° | Annotation correcte | Commentaires |
---|---|---|
1 | Phrase | Commentaire |
2 | Phrase | Commentaire |
- une tache : (à venir)...
TU_typeRemuneration
Règle
Le tag "TU_typeRemuneration" doit être utilisé pour identifier une expression précisant le type d'une rémunération. La propriété type permet de classer le type de rémunération en fonction d'une liste pré-établie.
Liste des valeurs possibles de la propriété type (cette liste sera complétée en fonction des cas rencontrés) :
avance | solde | total | indemnité_judiciaire | indemnité_syndicale | solidarité |
Exemples
N° | Annotation correcte | Commentaires |
---|---|---|
1 | Phrase | Commentaire |
2 | Phrase | Commentaire |
- Les fabricants se sont montrés favorables à une augmentation immédiate des prix de façon
- elle ne veut accorder qu'une augmentation de 15% sur les pièces en cours et ne donne le tarif de 1885, qu'après l'achèvement de ces pièces.