Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Typologie des documents, TEXT ou WORDLIST: comment traiter les cas marginaux? #2

Open
buret opened this issue Dec 13, 2013 · 0 comments
Labels
Milestone

Comments

@buret
Copy link
Collaborator

buret commented Dec 13, 2013

Bonjour,

Je suis en train de préparer un document, en vérifiant les transcriptions et rédigeant une description linguistique. L'objet de l'enregistrement, c'est des expressions du type "cet animal", "cette maison", pour étudier les changements de tons.
Dans la typologie des documents, ça rentre clairement dans le type LISTE DE MOTS (WORDLIST).
MAIS au fil de l'enregistrement, la locutrice ajoute de temps en temps des commentaires, par exemple elle dit: ' "Une maison", oui, ça se dit, pas de problème.' Cette partie de l'enregistrement, ce n'est pas l'objectif principal de l'enregistrement. Mais pour la description de la langue, ça présente un intérêt. (En fait tout intéresse les linguistes! c'est Boyd qui avait remarqué ça.) Par exemple il y a plein de questions-appel de confirmation: "C'est bien ça?" et de confirmations affirmatives: "Oui c'est ça!" Or justement ces formes sont presque entièrement absentes des textes que j'ai enregistrés, qui sont des monologues (récits). Donc c'est intéressant d'annoter aussi ces passages-là: dans la typologie (un peu bizarre) des phonéticiens on dirait que ce sont des énoncés "spontanés".
Mais si je mets des balises S dans le document, ça marche plus, c'est ça? (WORDLIST: faite de mots?)

Une solution ce serait de créer 2 documents XML distincts: un au format WORDLIST pour la liste de mots proprement dite. Et un autre au format TEXT avec le reste: rogatons ou pépites, selon le regard qu'on porte dessus.

Moi ça me conviendrait de distinguer les deux. L'important est que le format soit correct, et que tout trouve sa place dans l'annotation.

Un changement qui serait alors indiqué, ce serait d'avoir des icônes différentes pour WORDLIST et pour TEXT.
Ca serait utile de toute façon, pour que les utilisateurs se familiarisent avec la structure de la base de données, et sachent quel type de document ils ouvrent.
Et ce serait particulièrement utile pour les documents possédant 2 fichiers d'annotation, un en WORDLIST et l'autre en TEXT.

Qu'en pensez-vous?

@buret buret added this to the Q2 2014 milestone Feb 18, 2014
@buret buret added the question label Feb 18, 2014
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

1 participant