Guide d'annotation : Différence entre versions

De TimeUsage
Aller à : navigation, rechercher
(TU_incertitude)
 
(50 révisions intermédiaires par le même utilisateur non affichées)
Ligne 1 : Ligne 1 :
Cette page rassemble des éléments pour guider l'annotation des sources dans Transkribus ainsi qu'un certain nombre de questions méthodologiques.
+
== [[Guide d'annotation : remarques générales]] ==
 
+
== [[Guide d'annotation : tags du projet Time Us]] ==
== Remarques générales ==
 
=== Sélectionner le texte ===
 
 
 
=== Appliquer un tag ===
 
 
 
=== Faire un commentaire ===
 
 
 
 
 
 
 
 
 
== Tags du projet Time Us ==
 
 
 
=== Tableau récapitulatif ===
 
{| class="wikitable" border="1"
 
!scope="col"| Tag
 
!scope="col"| Propriété
 
!scope="col"| Usage
 
|-
 
|width="20%"| TU_adresse 
 
|width="20%"|
 
|width="60%"| Mot ou groupe de mots désignant une adresse postale
 
|-
 
|width="20%"| date
 
|width="20%"|
 
|width="60%"| Date explicite en chiffres ou en lettres
 
|-
 
|width="20%"| TU_document
 
|width="20%"| ''type''
 
|width="60%"| Titre de document de différents types
 
|-
 
|width="20%"| TU_duree
 
|width="20%"|
 
|width="60%"| Mot ou groupe de mots désignant une durée pour une travail ou un événement
 
|-
 
|width="20%"| TU_heure
 
|width="20%"|
 
|width="60%"| Mot ou groupe de mots désignant un horaire
 
|-
 
|width="20%"| TU_incertitude
 
|width="20%"|
 
|width="60%"| Mot ou groupe de mots problématique pour l'annotation
 
|-
 
|width="20%"| TU_montant
 
|width="20%"| ''type''
 
|width="60%"| Montant exprimé en lettres et/ou en chiffres
 
|-
 
|width="20%"| TU_occupation
 
|width="20%"| ''normal''
 
|width="60%"| Mot ou groupe de mots désignant un métier ou une occupation en rapport avec l'industrie du textile.
 
|-
 
|width="20%"| organization
 
|width="20%"|
 
|width="60%"| Mot ou groupe de mots désignant un établissement ou une organisation
 
|-
 
|width="20%"| TU_personne
 
|width="20%"| ''sex''
 
|width="60%"| Nom(s) d'une personne
 
|-
 
|width="20%"| place
 
|width="20%"|
 
|width="60%"| Nom de lieu
 
|-
 
|width="20%"| TU_produit
 
|width="20%"|
 
|width="60%"| Mot ou groupe de mots désignant
 
|-
 
|width="20%"| TU_remuneration
 
|width="20%"|
 
|width="60%"| Groupe de mots désignant une rémunération
 
|-
 
|width="20%"| TU_statutMatrimonial
 
|width="20%"|
 
|width="60%"| Mot ou groupe de mots désignant le statut matrimonial d'une personne
 
|-
 
|width="20%"| TU_tache
 
|width="20%"|
 
|width="60%"| Mot, nom ou verbe, ou groupe de mots désignant une tâche salariale ou domestique
 
|-
 
|width="20%"| TU_typeRemuneration
 
|width="20%"| ''type''
 
|width="60%"| Mot ou groupe de mots désignant la nature d'une rémunération
 
|}
 
 
 
=== TU_adresse ===
 
 
 
==== Règle ====
 
Le tag "TU_adresse" doit être utilisé pour identifier les informations de type adresse en particulier les adresses postales. On n'utilisera pas ce tag mais le tag "Place" (voir plus bas) pour identifier les noms de lieux.
 
 
 
==== Exemples ====
 
{| class="wikitable" border="1"
 
!scope="col"| N°
 
!scope="col"| Annotation correcte
 
!scope="col"| Commentaires
 
|-
 
| width="10%" | 1
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|-
 
| width="10%" | 2
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|}
 
 
 
* Maison Schutz, Salle Bichommier, <TU_adresse>Avenue des Tapis, 1</TU_adresse>
 
 
 
=== date ===
 
==== Règle ====
 
Le tag "date" doit être utilisé pour identifier des dates exprimées en chiffres ou en lettres. On n'identifie pas les éléments de datation de type "hier", "aujourd'hui", etc.
 
 
 
==== Exemples ====
 
{| class="wikitable" border="1"
 
!scope="col"| N°
 
!scope="col"| Annotation correcte
 
!scope="col"| Commentaires
 
|-
 
| width="10%" | 1
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|-
 
| width="10%" | 2
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|}
 
 
 
* <TU_date>une date</TU_date> : (à venir)...
 
 
 
=== TU_document ===
 
 
 
==== Règles ====
 
Le tag "TU_document" doit être utilisé pour identifier des références à des documents existants, comme par exemple un article de journal, une loi, un règlement, etc. La propriété '''type''' de ce tag doit être remplie afin de préciser de quel type de document il s'agit. En cas de doute, on préfère ne pas remplir la propriété '''type'''.
 
 
 
Liste des valeurs possibles pour la propriété '''type''' ''(cette liste sera complétée en fonction des cas rencontrés)'' :
 
{| class="wikitable" border="1"
 
|-
 
|width="20%"| presse
 
|width="20%"| loi
 
|width="20%"| tarif
 
|width="20%"| règlement
 
|width="20%"| ...
 
|}
 
 
 
==== Exemples ====
 
{| class="wikitable" border="1"
 
!scope="col"| N°
 
!scope="col"| Annotation correcte
 
!scope="col"| Commentaires
 
|-
 
| width="10%" | 1
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|-
 
| width="10%" | 2
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|}
 
 
* La Maison Chavent (art façonné) s'est rendue aux justes réclamations des tisseurs ; elle a accepté <TU_document>le tarif de 85</TU_document>, en son entier.
 
 
 
=== TU_duree ===
 
 
 
==== Règle ====
 
Le tag "TU_duree" doit être utilisé pour identifier des mots ou groupes de mots faisant référence à une durée soit pour une tâche précise, soit pour un événement précis.
 
 
 
==== Exemples ====
 
{| class="wikitable" border="1"
 
!scope="col"| N°
 
!scope="col"| Annotation correcte
 
!scope="col"| Commentaires
 
|-
 
| width="10%" | 1
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|-
 
| width="10%" | 2
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|}
 
 
 
* <TU_duree>une durée</TU_duree> : (à venir)...
 
 
 
=== TU_heure ===
 
 
 
==== Règles ====
 
Le tag "TU_heure" doit être utilisé pour identifier une référence à un horaire rythmant notamment la vie des ouvriers du textile.
 
 
 
 
 
==== Exemples ====
 
{| class="wikitable" border="1"
 
!scope="col"| N°
 
!scope="col"| Annotation correcte
 
!scope="col"| Commentaires
 
|-
 
| width="10%" | 1
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|-
 
| width="10%" | 2
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|}
 
 
 
* Il invite les grévistes à se réunir aujourd'hui à <TU_heure>2heures de l'après-midi</TU_heure>
 
 
 
=== TU_incertitude ===
 
==== Règle ====
 
Le tag "TU_incertitude" permet à l'annotateur.ice de signaler un cas problématique dans l'annotation : une hésitation sur le tag à employer, sur la zone à sélectionner, sur la nécessité de tagger le passage. Une bonne pratique de signalement consiste à accompagner l'utilisation de ce tag d'un commentaire expliquant le problème rencontré.
 
 
 
==== Exemples ====
 
{| class="wikitable" border="1"
 
!scope="col"| N°
 
!scope="col"| Annotation correcte
 
!scope="col"| Commentaires
 
|-
 
| width="10%" | 1
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|-
 
| width="10%" | 2
 
| width="45%" | Phrase
 
| width="45%" | Commentaire
 
|}
 
 
 
* <TU_incertitude>un problème d'annotation</TU_incertitude> : (à venir)...
 
 
 
=== TU_montant ===
 
Le tag "TU_montant" doit être utilisé pour identifier la mention d'un montant dans le cadre d'une rémunération. Ce montant peut se référer ou non à une rémunération financière. On essaiera autant que possible de préciser si ce montant est exprimé de manière absolue ou relative en remplissant la propriété '''type'''. En cas de doute, on préfère ne pas remplir la propriété '''type'''
 
 
 
Liste des valeurs possibles pour la propriété '''type''' : 
 
{| class="wikitable" border="1"
 
|-
 
|width="50%"| relatif
 
|width="50%"| absolu
 
|}
 
 
 
''Exemples :'' 
 
* Moyenne du salaire journalier des 10 plus mauvaises ouvrières, <TU_montant>2fr. 26c</TU_montant>. pendant le mois dernier.
 
 
 
=== TU_occupation ===
 
Le tag "Tu_occupation" doit être utilisé pour identifier un métier ou une occupation. On veillera à sélectionner la totalité de l'expression désignant le métier ou l'occupation. On veillera cependant à ne pas annoter les fonctions comme "Commissaire général" ou encore "président" ou "secrétaire (général)". La propriété '''normal''' doit être remplie avec l'expression normalisée de ce métier ou de cette occupation dans le cas ou la tournure de la phrase rendrait impossible l'encodage de la totalité de la mention du métier.
 
 
 
''Exemples :'' 
 
* Une réunion privée des <TU_occupation>ouvriers et ouvrières du tissage mécanique</TU_occupation> a eu lieu hier,
 
 
 
=== organization ===
 
Le tag "organization" doit être utilisé pour identifier les établissement et organisations comme les usines, les chambres syndicales, etc. Ce tag peut être accompagné du tag "personne" ou du tag "occupation" lorsque l'organisation contient le nom d'une personne ou fait référence à un métier.
 
 
 
''Exemples :'' 
 
* Une gréviste de la <TU_organization>Maison Gindre</TU_organization>
 
* Une gréviste de la <TU_organization>Maison <TU_personne>Gindre</TU_personne></TU_organization>
 
* La continuation de la mise à l'index des <TU_organization>Maison <TU_personne>Algoud</TU_personne>, frères</TU_organization> et <TU_organization>Coté, Ducoté et Cie</TU_organization>.
 
 
 
=== TU_personne ===
 
Le tag "TU_personne" doit être utilisé pour identifier des personnes généralement mentionnées par leur nom. Le tag porte sur la totalité de l'identité de la personne, pas uniquement sur son patronyme. La propriété '''sex''' peut être utilisée pour préciser le genre de la personne lorsque cela n'est pas explicite.
 
 
 
''Exemples :'' 
 
* <TU_personne>M. Gindre</TU_personne> lui aurait répondu qu'elle pouvait reprendre le travail si ça lui faisait plaisir
 
 
 
=== Place ===
 
Le tag "place" doit être utilisé pour identifier un lieu. Le tag porte sur la totalité des mots qui désignent le lieu annoté. Il ne sert pas à identifier les adresses, car c'est le rôle du tag "adresse". Dans certains cas, un établissement peut également être considéré comme un lieu : on laisse à l'annotateur le soin de trancher ce qui fait le plus sens dans la phrase ; il est cependant possible de combiner les tags "place" et "organization" sur une même sélection.
 
 
 
''Exemples :'' 
 
* Place de la Croix-Rousse. 4 dans une des salles du <TU_place>café Verdior</TU_place>.
 
 
 
=== TU_produit ===
 
Le tag "TU_produit" doit être utilisé pour identifier un produit, qu'il s'agisse d'un produit fini ou dans un état intermédiaire, le plus souvent dans le cadre d'une rémunération.
 
 
 
''Exemples :'' 
 
* Les chefs d'atelier de cette Maison ont fait tout ce qu'il était possible de faire et ils sont arrivés à lui faire accepter le tarif de 1885, en ce qui concerne les <TU_produit>façonnés</TU_produit>.
 
 
 
=== TU_remuneration ===
 
Le tag "TU_remuneration" doit être utilisé pour identifier une partie d'une phrase contenant des informations sur une rémunération. Les rémunérations étant exprimées d'une manière très diverse en fonction des documents, ce tag est un tag général qui permet de localiser un ensemble d'information qui peuvent par ailleurs être difficile à annoter. En complément du tag "TU_remuneration", on utilisera autant que possible le tag "TU_typeRemuneration", et les tags "Tu_duree", "TU_montant", "TU_produit" et "TU_tache", car ils permettent de préciser les différents éléments qui compose la rémunération.
 
 
 
''Exemples :''
 
* si les ouvrières [...] avaient su <TU_remuneration>toucher <TU_montant>1f50</TU_montant> <TU_duree>par jour</TU_duree></TU_remuneration>
 
 
 
=== TU_statutMatrimonial ===
 
Le tag "TU_statutMatrimonal" doit être utilisé pour identifier les titres et expressions qui permettent d'identifier le statut matrimonial des personnes, en particulier des femmes.
 
 
 
''Exemples :'' 
 
* Le <TU_statutMatrimonial>Sieur</TU_statutMatrimonial> Simon, rédacteur, au Journal "Le Peuple" a également annoncé à l'assemblée qu'une somme de 500 francs serait fournie par son journal aux grévistes.
 
 
 
=== TU_tache ===
 
Le tag "TU_tache" doit être utilisé pour identifier un mot ou un groupe de mots évoquant une action ou une tâche se rapportant au textile dans un contexte domestique ou salarial.
 
 
 
''Exemples :'' 
 
* <TU_tache>une tache</TU_tache> : (à venir)...
 
 
 
=== TU_typeRemuneration ===
 
Le tag "TU_typeRemuneration" doit être utilisé pour identifier une expression précisant le type d'une rémunération. La propriété '''type''' permet de classer le type de rémunération en fonction d'une liste pré-établie.
 
 
 
Liste des valeurs possibles de la propriété '''type''' ''(cette liste sera complétée en fonction des cas rencontrés)'' :
 
{| class="wikitable" border="1"
 
|-
 
|width="15%"| avance
 
|width="15%"| solde
 
|width="15%"| total
 
|width="15%"| indemnité_judiciaire
 
|width="15%"| indemnité_syndicale
 
|width="15%"| solidarité
 
|}
 
 
 
''Exemples :'' 
 
* Les fabricants se sont montrés favorables à une augmentation immédiate des <TU_typeRemuneration>prix de façon</TU_typeRemuneration>
 
* elle ne veut accorder qu'<TU_remuneration>une augmentation de 15% <TU_typeRemuneration>sur les pièces en cours</TU_typeRemuneration></TU_remuneration> et <TU_remuneration>ne donne le tarif de 1885, qu'<TU_typeRemuneration>après l'achèvement de ces pièces</TU_typeRemuneration></TU_remuneration>.
 

Version actuelle datée du 3 mai 2018 à 15:46

Guide d'annotation : remarques générales

Guide d'annotation : tags du projet Time Us