Guide d'annotation : Différence entre versions

De TimeUsage
Aller à : navigation, rechercher
(TU_personne)
 
(32 révisions intermédiaires par le même utilisateur non affichées)
Ligne 1 : Ligne 1 :
Cette page rassemble des éléments pour guider l'annotation des sources dans Transkribus ainsi qu'un certain nombre de questions méthodologiques.
+
== [[Guide d'annotation : remarques générales]] ==
 
+
== [[Guide d'annotation : tags du projet Time Us]] ==
== Remarques générales ==
 
=== Sélectionner le texte ===
 
 
 
=== Appliquer un tag ===
 
 
 
=== Faire un commentaire ===
 
 
 
 
 
 
 
 
 
== Tags du projet Time Us ==
 
 
 
=== Tableau récapitulatif ===
 
{| class="wikitable" border="1"
 
!scope="col"| Tag
 
!scope="col"| Propriété
 
!scope="col"| Usage
 
|-
 
|width="20%"| TU_adresse 
 
|width="20%"|
 
|width="60%"| Mot ou groupe de mots désignant une adresse postale
 
|-
 
|width="20%"| date
 
|width="20%"|
 
|width="60%"| Date explicite en chiffres ou en lettres
 
|-
 
|width="20%"| TU_document
 
|width="20%"| ''type''
 
|width="60%"| Titre de document de différents types
 
|-
 
|width="20%"| TU_duree
 
|width="20%"|
 
|width="60%"| Mot ou groupe de mots désignant une durée pour une travail ou un événement
 
|-
 
|width="20%"| TU_heure
 
|width="20%"|
 
|width="60%"| Mot ou groupe de mots désignant un horaire
 
|-
 
|width="20%"| TU_incertitude
 
|width="20%"|
 
|width="60%"| Mot ou groupe de mots problématique pour l'annotation
 
|-
 
|width="20%"| TU_montant
 
|width="20%"| ''type''
 
|width="60%"| Montant exprimé en lettres et/ou en chiffres
 
|-
 
|width="20%"| TU_occupation
 
|width="20%"| ''normal''
 
|width="60%"| Mot ou groupe de mots désignant un métier ou une occupation en rapport avec l'industrie du textile.
 
|-
 
|width="20%"| organization
 
|width="20%"|
 
|width="60%"| Mot ou groupe de mots désignant un établissement ou une organisation
 
|-
 
|width="20%"| TU_personne
 
|width="20%"| ''sex''
 
|width="60%"| Nom(s) d'une personne
 
|-
 
|width="20%"| place
 
|width="20%"|
 
|width="60%"| Nom de lieu
 
|-
 
|width="20%"| TU_produit
 
|width="20%"|
 
|width="60%"| Mot ou groupe de mots désignant
 
|-
 
|width="20%"| TU_remuneration
 
|width="20%"|
 
|width="60%"| Groupe de mots désignant une rémunération
 
|-
 
|width="20%"| TU_statutMatrimonial
 
|width="20%"|
 
|width="60%"| Mot ou groupe de mots désignant le statut matrimonial d'une personne
 
|-
 
|width="20%"| TU_tache
 
|width="20%"|
 
|width="60%"| Mot, nom ou verbe, ou groupe de mots désignant une tâche salariale ou domestique
 
|-
 
|width="20%"| TU_typeRemuneration
 
|width="20%"| ''type''
 
|width="60%"| Mot ou groupe de mots désignant la nature d'une rémunération
 
|}
 
 
 
=== TU_adresse ===
 
 
 
==== Règle ====
 
Le tag "TU_adresse" doit être utilisé pour annoter une adresse postale plus ou moins complète.
 
 
 
Une rue, avec ou sans numéro, peut être considérée comme une adresse postale.
 
 
 
Si une rue est accompagnée d'un numéro, on inclut toujours le numéro dans la sélection.
 
 
 
Si un nom de lieu est évoqué à proximité d'une adresse dans le texte, on n'inclut pas le nom du lieu dans la sélection pour le tag "TU_adresse".
 
 
 
==== Exemples ====
 
{| class="wikitable" border="1"
 
!scope="col"| N°
 
!scope="col"| Annotation correcte
 
!scope="col"| Commentaires
 
|-
 
| width="10%" | 1
 
| width="45%" | Maison Schutz, Salle Bichommier, <TU_adresse>Avenue des Tapis, 1</TU_adresse>
 
| width="45%" | L'annotation de l'adresse porte uniquement sur  "Avenue des Tapis, 1" : on n'inclut pas le nom de la salle, ni le nom de l'organisation en lien avec cette adresse.
 
|-
 
| width="10%" | 2
 
| width="45%" | au siège du Syndicat ouvrier des tisseurs et similaires <TU_adresse>8, rue d'Austerlitz</TU_adresse>
 
| width="45%" | L'annotation de l'adresse porte uniquement sur "8, rue d'Austerlitz" : on n'inclut pas le nom du lieu en lien avec cette adresse.
 
|-
 
| width="10%" | 3
 
| width="45%" | quatre Maisons de fabriques, savoir les Maisons : Atuyer, <TU_adresse>place Tolozan, 20 et 23</TU_adresse> ; Schulz, <TU_adresse>rue du Griffon, 8</TU_adresse> ; Béraud, <TU_adresse>place Tolozan, 18</TU_adresse> : Tresca, frères, <TU_adresse>rue du Griffon, 8</TU_adresse>.
 
| width="45%" | La première adresse peut poser problème puisqu'elle inclut deux numéros, dans ce cas, dans la mesure où l'adresse est celle d'un seul établissement, on inclut les deux numéros dans la sélection : "place Tolozan, 20 et 23".
 
|}
 
 
 
=== date ===
 
==== Règle ====
 
Le tag "date" doit être utilisé pour annoter une date absolue exprimée en chiffres et/ou en lettres.
 
 
 
On annote une date lorsqu'elle est constituée d'une année seulement, ou bien d'un mois et une année, ou encore d'un jour, un mois et une année.
 
 
 
On n'identifie pas les expressions comme "hier", "aujourd'hui", qui sont des dates relatives au contexte.
 
 
 
Pour des intervalles de date, on annote les deux dates séparément.
 
 
 
Dans la mesure du possible, on n'annote pas les dates qui font partie d'un titre de document ou d'une expression désignant une organisation, un événement ou un lieu.
 
 
 
==== Exemples ====
 
{| class="wikitable" border="1"
 
!scope="col"| N°
 
!scope="col"| Annotation correcte
 
!scope="col"| Commentaires
 
|-
 
| width="10%" | 1
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|-
 
| width="10%" | 2
 
| width="45%" | la réunion publique tenue le 20 courant à la Croix-Rousse
 
| width="45%" | On n'annote pas cette date car sa résolution est dépendante du contexte
 
|}
 
 
 
* <TU_date>une date</TU_date> : (à venir)...
 
 
 
=== TU_document ===
 
 
 
==== Règles ====
 
Le tag "TU_document" doit être utilisé pour identifier des références à des documents existants, comme par exemple un article de journal, une loi, un règlement, etc. La propriété '''type''' de ce tag doit être remplie afin de préciser de quel type de document il s'agit. En cas de doute, on préfère ne pas remplir la propriété '''type'''.
 
 
 
Liste des valeurs possibles pour la propriété '''type''' ''(cette liste sera complétée en fonction des cas rencontrés)'' :
 
{| class="wikitable" border="1"
 
|-
 
|width="20%"| presse
 
|width="20%"| loi
 
|width="20%"| tarif
 
|width="20%"| règlement
 
|width="20%"| ...
 
|}
 
 
 
==== Exemples ====
 
{| class="wikitable" border="1"
 
!scope="col"| N°
 
!scope="col"| Annotation correcte
 
!scope="col"| Commentaires
 
|-
 
| width="10%" | 1
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|-
 
| width="10%" | 2
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|}
 
 
* La Maison Chavent (art façonné) s'est rendue aux justes réclamations des tisseurs ; elle a accepté <TU_document>le tarif de 85</TU_document>, en son entier.
 
 
 
=== TU_duree ===
 
 
 
==== Règle ====
 
Le tag "TU_duree" doit être utilisé pour identifier des mots ou groupes de mots faisant référence à une durée soit pour une tâche précise, soit pour un événement précis.
 
 
 
==== Exemples ====
 
{| class="wikitable" border="1"
 
!scope="col"| N°
 
!scope="col"| Annotation correcte
 
!scope="col"| Commentaires
 
|-
 
| width="10%" | 1
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|-
 
| width="10%" | 2
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|}
 
 
 
* <TU_duree>une durée</TU_duree> : (à venir)...
 
 
 
=== TU_heure ===
 
 
 
==== Règles ====
 
Le tag "TU_heure" doit être utilisé pour identifier une référence à un horaire rythmant notamment la vie des ouvriers du textile.
 
 
 
 
 
==== Exemples ====
 
{| class="wikitable" border="1"
 
!scope="col"| N°
 
!scope="col"| Annotation correcte
 
!scope="col"| Commentaires
 
|-
 
| width="10%" | 1
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|-
 
| width="10%" | 2
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|}
 
 
 
* Il invite les grévistes à se réunir aujourd'hui à <TU_heure>2heures de l'après-midi</TU_heure>
 
 
 
=== TU_incertitude ===
 
==== Règle ====
 
Le tag "TU_incertitude" permet à l'annotateur.ice de signaler un cas problématique dans l'annotation : une hésitation sur le tag à employer, sur la zone à sélectionner, sur la nécessité de tagger le passage. Une bonne pratique de signalement consiste à accompagner l'utilisation de ce tag d'un commentaire expliquant le problème rencontré.
 
 
 
==== Exemples ====
 
{| class="wikitable" border="1"
 
!scope="col"| N°
 
!scope="col"| Annotation correcte
 
!scope="col"| Commentaires
 
|-
 
| width="10%" | 1
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|-
 
| width="10%" | 2
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|}
 
 
 
* <TU_incertitude>un problème d'annotation</TU_incertitude> : (à venir)...
 
 
 
=== TU_montant ===
 
==== Règle ====
 
Le tag "TU_montant" doit être utilisé pour identifier la mention d'un montant dans le cadre d'une rémunération. Ce montant peut se référer ou non à une rémunération financière. On essaiera autant que possible de préciser si ce montant est exprimé de manière absolue ou relative en remplissant la propriété '''type'''. En cas de doute, on préfère ne pas remplir la propriété '''type'''
 
 
 
Liste des valeurs possibles pour la propriété '''type''' : 
 
{| class="wikitable" border="1"
 
|-
 
|width="50%"| relatif
 
|width="50%"| absolu
 
|}
 
==== Exemples ====
 
{| class="wikitable" border="1"
 
!scope="col"| N°
 
!scope="col"| Annotation correcte
 
!scope="col"| Commentaires
 
|-
 
| width="10%" | 1
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|-
 
| width="10%" | 2
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|}
 
 
 
* Moyenne du salaire journalier des 10 plus mauvaises ouvrières, <TU_montant>2fr. 26c</TU_montant>. pendant le mois dernier.
 
* Leur salaire personnel varie de 1f50 à 2f50 par jour pour tous les articles courants
 
 
 
=== TU_occupation ===
 
==== Règle ====
 
Le tag "Tu_occupation" doit être utilisé pour identifier un métier ou une occupation. On veillera à sélectionner la totalité de l'expression désignant le métier ou l'occupation. On veillera cependant à ne pas annoter les fonctions comme "Commissaire général" ou encore "président" ou "secrétaire (général)". La propriété '''normal''' doit être remplie avec l'expression normalisée de ce métier ou de cette occupation dans le cas ou la tournure de la phrase rendrait impossible l'encodage de la totalité de la mention du métier.
 
 
 
==== Exemples ====
 
{| class="wikitable" border="1"
 
!scope="col"| N°
 
!scope="col"| Annotation correcte
 
!scope="col"| Commentaires
 
|-
 
| width="10%" | 1
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|-
 
| width="10%" | 2
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|}
 
 
 
* Une réunion privée des <TU_occupation>ouvriers et ouvrières du tissage mécanique</TU_occupation> a eu lieu hier,
 
 
 
=== organization ===
 
==== Règle ====
 
Le tag "organization" doit être utilisé pour identifier les établissement et organisations comme les usines, les chambres syndicales, etc. Ce tag peut être accompagné du tag "personne" ou du tag "occupation" lorsque l'organisation contient le nom d'une personne ou fait référence à un métier.
 
 
 
==== Exemples ====
 
{| class="wikitable" border="1"
 
!scope="col"| N°
 
!scope="col"| Annotation correcte
 
!scope="col"| Commentaires
 
|-
 
| width="10%" | 1
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|-
 
| width="10%" | 2
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|}
 
 
 
* Une gréviste de la <TU_organization>Maison Gindre</TU_organization>
 
* Une gréviste de la <TU_organization>Maison <TU_personne>Gindre</TU_personne></TU_organization>
 
* La continuation de la mise à l'index des <TU_organization>Maison <TU_personne>Algoud</TU_personne>, frères</TU_organization> et <TU_organization>Coté, Ducoté et Cie</TU_organization>.
 
 
 
=== TU_personne ===
 
==== Règle ====
 
Le tag "TU_personne" doit être utilisé pour identifier des personnes généralement mentionnées par leur nom. Le tag porte sur la totalité de l'identité de la personne, pas uniquement sur son patronyme. La propriété '''sex''' peut être utilisée pour préciser le genre de la personne lorsque cela n'est pas explicite.
 
 
 
==== Exemples ====
 
{| class="wikitable" border="1"
 
!scope="col"| N°
 
!scope="col"| Annotation correcte
 
!scope="col"| Commentaires
 
|-
 
| width="10%" | 1
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|-
 
| width="10%" | 2
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|}
 
 
 
* <TU_personne>M. Gindre</TU_personne> lui aurait répondu qu'elle pouvait reprendre le travail si ça lui faisait plaisir
 
* Monsieur le Préfet du Rhône
 
 
 
=== Place ===
 
==== Règle ====
 
Le tag "place" doit être utilisé pour identifier un lieu. Le tag porte sur la totalité des mots qui désignent le lieu annoté. Il ne sert pas à identifier les adresses, car c'est le rôle du tag "adresse". Dans certains cas, un établissement peut également être considéré comme un lieu : on laisse à l'annotateur le soin de trancher ce qui fait le plus sens dans la phrase ; il est cependant possible de combiner les tags "place" et "organization" sur une même sélection.
 
 
 
==== Exemples ====
 
{| class="wikitable" border="1"
 
!scope="col"| N°
 
!scope="col"| Annotation correcte
 
!scope="col"| Commentaires
 
|-
 
| width="10%" | 1
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|-
 
| width="10%" | 2
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|}
 
 
* Place de la Croix-Rousse. 4 dans une des salles du <TU_place>café Verdior</TU_place>.
 
 
 
=== TU_produit ===
 
==== Règle ====
 
Le tag "TU_produit" doit être utilisé pour identifier un produit, qu'il s'agisse d'un produit fini ou dans un état intermédiaire, le plus souvent dans le cadre d'une rémunération.
 
 
 
==== Exemples ====
 
{| class="wikitable" border="1"
 
!scope="col"| N°
 
!scope="col"| Annotation correcte
 
!scope="col"| Commentaires
 
|-
 
| width="10%" | 1
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|-
 
| width="10%" | 2
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|}
 
 
 
* Les chefs d'atelier de cette Maison ont fait tout ce qu'il était possible de faire et ils sont arrivés à lui faire accepter le tarif de 1885, en ce qui concerne les <TU_produit>façonnés</TU_produit>.
 
 
 
=== TU_remuneration ===
 
==== Règle ====
 
Le tag "TU_remuneration" doit être utilisé pour identifier une partie d'une phrase contenant des informations sur une rémunération. Les rémunérations étant exprimées d'une manière très diverse en fonction des documents, ce tag est un tag général qui permet de localiser un ensemble d'information qui peuvent par ailleurs être difficile à annoter. En complément du tag "TU_remuneration", on utilisera autant que possible le tag "TU_typeRemuneration", et les tags "Tu_duree", "TU_montant", "TU_produit" et "TU_tache", car ils permettent de préciser les différents éléments qui compose la rémunération.
 
 
 
==== Exemples ====
 
{| class="wikitable" border="1"
 
!scope="col"| N°
 
!scope="col"| Annotation correcte
 
!scope="col"| Commentaires
 
|-
 
| width="10%" | 1
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|-
 
| width="10%" | 2
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|}
 
 
 
* si les ouvrières [...] avaient su <TU_remuneration>toucher <TU_montant>1f50</TU_montant> <TU_duree>par jour</TU_duree></TU_remuneration>
 
 
 
=== TU_statutMatrimonial ===
 
==== Règle ====
 
Le tag "TU_statutMatrimonal" doit être utilisé pour identifier les titres et expressions qui permettent d'identifier le statut matrimonial des personnes, en particulier des femmes.
 
 
 
==== Exemples ====
 
{| class="wikitable" border="1"
 
!scope="col"| N°
 
!scope="col"| Annotation correcte
 
!scope="col"| Commentaires
 
|-
 
| width="10%" | 1
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|-
 
| width="10%" | 2
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|}
 
 
 
* Le <TU_statutMatrimonial>Sieur</TU_statutMatrimonial> Simon, rédacteur, au Journal "Le Peuple" a également annoncé à l'assemblée qu'une somme de 500 francs serait fournie par son journal aux grévistes.
 
 
 
=== TU_tache ===
 
==== Règle ====
 
Le tag "TU_tache" doit être utilisé pour identifier un mot ou un groupe de mots évoquant une action ou une tâche se rapportant au textile dans un contexte domestique ou salarial.
 
 
 
==== Exemples ====
 
{| class="wikitable" border="1"
 
!scope="col"| N°
 
!scope="col"| Annotation correcte
 
!scope="col"| Commentaires
 
|-
 
| width="10%" | 1
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|-
 
| width="10%" | 2
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|}
 
 
 
* <TU_tache>une tache</TU_tache> : (à venir)...
 
 
 
=== TU_typeRemuneration ===
 
==== Règle ====
 
Le tag "TU_typeRemuneration" doit être utilisé pour identifier une expression précisant le type d'une rémunération. La propriété '''type''' permet de classer le type de rémunération en fonction d'une liste pré-établie.
 
 
 
Liste des valeurs possibles de la propriété '''type''' ''(cette liste sera complétée en fonction des cas rencontrés)'' :
 
{| class="wikitable" border="1"
 
|-
 
|width="15%"| avance
 
|width="15%"| solde
 
|width="15%"| total
 
|width="15%"| indemnité_judiciaire
 
|width="15%"| indemnité_syndicale
 
|width="15%"| solidarité
 
|}
 
 
 
==== Exemples ====
 
{| class="wikitable" border="1"
 
!scope="col"| N°
 
!scope="col"| Annotation correcte
 
!scope="col"| Commentaires
 
|-
 
| width="10%" | 1
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|-
 
| width="10%" | 2
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|}
 
 
 
* Les fabricants se sont montrés favorables à une augmentation immédiate des <TU_typeRemuneration>prix de façon</TU_typeRemuneration>
 
* elle ne veut accorder qu'<TU_remuneration>une augmentation de 15% <TU_typeRemuneration>sur les pièces en cours</TU_typeRemuneration></TU_remuneration> et <TU_remuneration>ne donne le tarif de 1885, qu'<TU_typeRemuneration>après l'achèvement de ces pièces</TU_typeRemuneration></TU_remuneration>.
 

Version actuelle datée du 3 mai 2018 à 15:46

Guide d'annotation : remarques générales

Guide d'annotation : tags du projet Time Us