9 Annoter un corpus

9.3 Limites de l’annotation simple et avancée

L’encodage de l’annotation dans le corpus consiste en l’ajout d’une structure autour de la séquence de mots. Cela a l’avantage de pouvoir être exploitable immédiatement par le moteur CQP et accessible aux commandes habituelles de TXM. Par contre, cette structure ne pouvant chevaucher une structure pré-existante du corpus, la séquence de mots annotée ne peut pas être à cheval sur deux structures pré-existantes du corpus. Par exemple une séquence de mots annotée ne peut pas commencer à la fin d’un paragraphe et continuer au début du paragraphe suivant. C’est une limite du modèle que n’a pas l’annotation de séquences de mots avec l’extension Analec.