Home > Bibliographic references

Bibliographic references

Year not specified

  • Kilgarriff, A. (1996). Corpus Similarity and Homogeneity Via Word Frequency. In Euralex Proceedings. Gothenburg, Sweden.
  • Kilgarriff, A. (1996). Which Words are Particularly Characteristic of Text : A Survey of Statistical Approaches. Brighton: Information Technology Research Institute, University of Brighton.
  • Kilgarriff, A. (1996). Using Word Frequency Lists to Measure Corpus Homogeneity and Similarity Between Corpora. Brighton: Information Technology Research Institute, University of Brighton.
  • Knuth, D. E. (1969). The Art of Computer Programming. Addison–Wesley.
  • Koch, P., & Osterreicher, W. (1985). Sprache der Nähe - Sprache der Distanz. Mündlichkeit und Schriftlichkeit im Spannungsfeld von Sprachtheorie und Sprachgeschichte. Romanistisches Jahrbuch, 36, 15-43.

  • Koch, P., & Osterreicher, W. (2001). Langage parlé et langage écrit. In Lexikon Der Romanistischen Linguistik (Vol. I/2, p. 584-627). Tübingen: Max Niemeyer.
  • Koch, P. (1993). Pour une typologie conceptionnelle et médiale des plus anciens documents/monuments des langues romanes. In Le Passage À L'écrit Des Langues Romanes (p. 39-82). Tübingen: Gunter Narr.
  • Koschwitz, E. (1920). Les plus anciens monuments de la langue française publiés pour les cours universitaires (Vol. 9). Leipzig: O.R. Reisland.
  • Kunstmann, P. (2000). Ancien et moyen français sur le web : textes et bases de données. Revue De Linguistique Romane, 64, 17-42.


  • Kurysheva, L., & Lavrentiev, A. (2019). “The Story of Labelle and the Beast”: a digital edition of a manuscript the first Russian translation of the “Beauty and the Beast” fairy-tale powered by the TXM demo portal. Sibirskij Filologičeskij Žurnal, (1), 54-61. doi:10.17223/18137083/66/4
    Tags: Digital editing, Digital humanities, Лепренс де Бомон, Leprince de Beaumont, Manuscript documents, рукописная литература, русская литература XVIII в, русско-французские литературные связи, сказка, цифровая гуманитаристика, электронное издание, Russian literature of the 18th century, Russian-French literary contacts, TXM, XML-TEI.
  • Labbé, D. (1990). Normes de Dépouillement et Procédures D'analyse Des Textes Politiques. Grenoble: CERAT.
  • Labbé, D., Thoiron, P., & Serant, D. (1988). Etudes sur la Richesse et la Structure Lexicales. (D. Serant, Eds.). Paris�Genève: Slatkine�Champion.
  • Labbé, D. (1990). Le Vocabulaire de François Mitterand. Paris: Presses de la Fondation Nationale des Sciences Politiques.
  • Lafon, P. (1981). Analyse Lexicométrique et Recherche Des Cooccurrences. Mots, (3), 95-148.
  • Lafon, P. (1984). Dépouillements et Statistiques En Lexicométrie. Paris: Slatkine-Champion.
  • Lafon, P., & Salem, A. (1983). L'Inventaire Des Segments Répétés D'un Texte. Mots, (6), 161�177.
  • Lafon, P., Salem, A., & Tournier, M. (1985). Lexicométrie et Associations Syntagmatiques (Analyse Des Segments Répétés et Des Cooccurrences Appliquée À un Corpus de Textes Syndicaux). In Colloque De L'allc (p. 59�72). Genève, Paris: Slatkine�Champion.

  • Lafon, P. (1980). Sur la variabilité de la fréquence des formes dans un corpus. Mots. Les Langages Du Politique, (1), 127-165. Retrieved from https://www.persee.fr/doc/mots_0243-6450_1980_num_1_1_1008
    Abstract: FORM FREQUENCY VARIABILITY IN A CORPUS P. L. is studying the distribution of the frequency of a word in a corpus divided into several fragments. Contrary to current work in this field, he proposes to use the formulae of the hypergeometric distribution, choosing the whole corpus as the norm of the fragments. These choices lead to the calculation of a probabilistic index valid for the whole range of frequencies. The calculation of this index for every form in the vocabulary enables us to define two complementary subsets of forms : that of specific forms and that of basic forms, and to attribute to each fragment its own lexical specifications.
  • Lafon, P., Lefevre, J., Salem, A., & Tournier, M. (1985). LE MACHINAL : Principes D'enregistrement Informatique Des Textes. Paris: Klincksieck.


  • Lagorgette, D. (2016). Jurons et blasphèmes dans quelques textes des XIVe et XVe siècles : représentations de l’oralité et transgression. Linx : Bulletin Du Centre De Recherches Linguistiques De Paris X Nanterre, (73). doi:10.4000/linx.1640
  • Laherrère, J. (1996). Distributions de Type "fractal Parabolique" Dans la Nature. Comptes Rendus De L'académie Des Sciences, 322(IIa, 7), 535–541.
    Abstract: Les distributions appartenant à un domaine naturel spécifique et répertoriées en un inventaire d'objets rangés par taille décroissante dans un diagramme log–log taille–rang, présentent souvent, contrairement à ce que laisseraient entendre les modèles classiques, un tracé, non pas rectiligne, mais courbe. De tels tracés, que nous appellerons de type fractal parabolique sont souvent ainsi obtenus, par exemple, pour les intensités des galaxies, les agglomérations urbaines définies morphologiquement et les gisements d'hydrocarbures dans un système pétrolier. Les paramètres de la parabole sont caractéristiques de la structure multifractale des objets concernés. Toutefois, on observe certaines similitudes remarquables entre des données issues de phénomènes en apparence trés éloignés. Par extrapolation des modèles ainsi obtenus, il est possible de prévoir les parties non observables des distributions concernés, et par exemple, les réserves ultimes pétrolières, aussi bien que d'évaluer le nombre d'espèces.

  • Lallot, J. (1998). La grammaire de Denys le Thrace (Vol. 2). Paris: CNRS éditions.

  • Landivar, D., Monnin, A., & Ramillien, E. (2016). Cartographier l’ontologie d’un territoire sur le web. Netcom : Réseaux, Communication Et Territoires, 29(3/4), 297-324. Retrieved from https://hal.archives-ouvertes.fr/hal-01327060/document
    Abstract: Quelle est l’identité d’un territoire sur le Web ? Dans cet article nous explorons les modes d’identification et d’objectivation d’entités (en l’occurrence, ici, un pays) ayant une existence géographique admise hors du Web. Il apparait que la Bolivie, en tant qu’objet identifié au moyen du Web, alimenté par des contenus participatifs (blogs, commentaires, tweets, articles Wikipédia, contenus structurées sur DBpedia, etc.), est une entité en devenir qui prolifère et non un référent stable aux bords nets. Grâce à cette hypothèse permettant de penser sérieusement l’existence à part entière d’une entité sur le Web, nous pouvons mener une enquête anthropologique à propos de ces deux modes d’existence (au sens d’Etienne Souriau) de l’entité Bolivie. La cartographie d’une entité territoriale sur le Web et sa cartographie géographique se recouvrent-elles ? Et selon quelles dimensions le cas échéant ? Nous verrons que la question à se poser sur le Web est avant tout une question d’échelles. Pour ce faire, nous repartirons des fondements de l’architecture du Web afin de déterminer comment faire varier les échelles sur le Web de manière à continuer à parler de la Bolivie (une entité une) tout en tenant compte de la prolifération des associations qu’elle tisse (une entité multiple) et ainsi enrichir notre appréhension de l’objet géographique Bolivie "hors" du Web (objet dont l’existence est néanmoins impactée par le Web selon des modalités à éclaircir).
    Attachment Full Text PDF 1.8 Mb (source)

  • Landragin, F., Poibeau, T., & Victorri, B. (2012). ANALEC: a New Tool for the Dynamic Annotation of Textual Data. In (p. 357-362). Presented at the International Conference on Language Resources and Evaluation (LREC 2012). Retrieved from https://halshs.archives-ouvertes.fr/halshs-00698971/document
    Abstract: We introduce ANALEC, a tool which aim is to bring together corpus annotation, visualization and query management. Our main idea is to provide a unified and dynamic way of annotating textual data. ANALEC allows researchers to dynamically build their own annotation scheme and use the possibilities of scheme revision, data querying and graphical visualization during the annotation process. Each query result can be visualized using a graphical representation that puts forward a set of annotations that can be directly corrected or completed. Text annotation is then considered as a cyclic process. We show that statistics like frequencies and correlations make it possible to verify annotated data on the fly during the annotation. In this paper we introduce the annotation functionalities of ANALEC, some of the annotated data visualization functionalities, and three statistical modules: frequency, correlation and geometrical representations. Some examples dealing with reference and coreference annotation illustrate the main contributions of ANALEC.


  • Landragin, F., Potier, J., & Bothua, M. (2017). Annotation manuelle d'expressions référentielles : expérimentations pour simplifier les prises de décisions et optimiser le processus. In . Presented at the 9èmes Journées Internationales de la Linguistique de corpus (JLC 2017). doi:https://halshs.archives-ouvertes.fr/halshs-01513810/document
    Abstract: Nous présentons une série d'expérimentations, dont les résultats ont permis de déterminer la procédure d’annotation du projet DEMOCRAT, à savoir l’annotation des expressions référentielles et des chaînes de référence de textes écrits. Le corpus est actuellement en cours d’annotation selon cette procédure. Parmi les aspects que nous mettons en avant se trouvent d’une part la sélection des expressions à annoter, d’autre part l’utilisation (ou non) d’un outil de TAL en tant que pré-annotateur. Nous discutons chacun de ces deux aspects en nous appuyant sur des sessions d’annotation (à deux ou trois annotateurs) chronométrées, et sur le calcul d’accords inter-annotateurs. Nous soulignons également le rôle de l’ergonomie de l’outil d’annotation utilisé, qui nous a d’ailleurs conduits à implémenter une fonctionnalité supplémentaire dans le logiciel ANALEC. Nous discutons enfin de l’aspect "robotique" de certaines facettes de la tâche d’annotation et concluons quant à la rédaction et le test du manuel d’annotation.
  • Lauer, P. (1926). Nithard. Histoire des fils de Louis le Pieux.


  • Lavrentev, A. (2019). Traitement de la ponctuation Normes, introductions, pratiques. In F. Duval, C. Guillot-Barbance, & F. Zinelli (Eds.), Les Introductions Linguistiques Aux Éditions De Textes (Vol. 1-5, p. 275-294). Paris: Classiques Garnier. Retrieved from https://classiques-garnier.com/les-introductions-linguistiques-aux-editions-de-textes-traitement-de-la-ponctuation.html
    Abstract: En prenant appui sur une définition de la ponctuation qui est avant tout fonctionnelle, l’article envisage la ponctuation à trois niveaux différents : le niveau des mots (la segmentation graphique), le niveau des unités syntaxiques et communicatives (la ponctuation au sens propre) et le niveau du texte (la structuration textuelle). Il s’arrête sur l’intérêt croissant des éditeurs pour les procédés graphiques, notamment dans leur travail de transcription et prend aussi en considération les apports du numérique.

  • Lavrentiev, A. (2008). A Tag For Punctuation. In Tei Members' Meeting 2008. London, Royaume-Uni. Retrieved from http://halshs.archives-ouvertes.fr/halshs-00620104

  • Lavrentiev, A. (2007). Systèmes graphiques de manuscrits médiévaux et incunables français : ponctuation, segmentation, graphies. Éditions de l'université de Savoie. Retrieved from http://halshs.archives-ouvertes.fr/halshs-00380023

  • Lavrentiev, A. Tendances de la ponctuation dans les manuscrits et incunables français en prose, du XIIIe au XVe siècle (THESE). Retrieved from http://tel.archives-ouvertes.fr/tel-00494914

  • Lavrentiev, A. (2009). Tendances de la ponctuation dans les manuscrits et incunables français en prose, du XIIIe au XVe siècle. Ecole Normale Supérieure Lettres et Sciences humaines, Lyon. Retrieved from http://tel.archives-ouvertes.fr/tel-00494914.
  • Lavrentiev, A. (2000). A propos de la ponctuation dans l'Image du monde. La Licorne, (52), 23-37.

  • Lavrentiev, A. (2008). Manuel d’encodage XML-TEI étendu des transcriptions de manuscrits dans le projet BFM-Manuscrits, v. 2.1. Lyon: Projet BFM. Retrieved from http://ccfm.ens-lsh.fr/IMG/pdf/BFM-Mss_Encodage-XML.pdf

  • Lavrentiev, A. (2008). A Tag for Punctuation? In . Londres: TEI. Retrieved from http://www.cch.kcl.ac.uk/cocoon/tei2008/programme/workingpapers/wp_002.html

  • Lavrentiev, A. (2007). Systèmes graphiques de manuscrits médiévaux et incunables français : ponctuation, segmentation, graphies (Vol. 3). Chambéry: Université de Savoie.
  • Lavrentiev, A. (1999). Analyse typologique de la catégorie des cas en langue russe. Institut de philologie, Branche Sibérienne de l'Académie des sciences de Russie, Novossibirsk.

  • Lavrentiev, A. (2004). Pour une méthodologie d’étude de la ponctuation médiévale basée sur une approche typologique. In Études Sur Le Changement Linguistique En Français, Communications Du Colloque « Diachro 2 » (Vol. Paris, p. 191-204). Nancy: Presses Universitaires de Nancy.

  • Lavrentiev, A. (2011). Les changements dans les pratiques de la ponctuation liés au développement de l'imprimerie à la fin du 15e siècle et au début du 16e siècle. In N. D. ;J. Dürrenmatt (Eds.), La Ponctuation À La Renaissance (p. 31-56). Classiques Garnier. Retrieved from http://halshs.archives-ouvertes.fr/halshs-00758560

  • Lavrentiev, A., & Debrenne, M. (2017). A Corpus of 19th Century Russian Francophone Diaries as Data for Research on Interaction of Languages and Cultures. In V. Zakharov (Eds.), Proceedings Of The International Conference "corpus Linguistics - 2017" (p. 168-171). Presented at the Corpus linguistics - 2017, Saint-Pétersbourg, Russia: Saint Petersburg University Press. Retrieved from https://halshs.archives-ouvertes.fr/halshs-01591119
    Tags: bilingualism, diary, билингвизм, дневник, платформа TXM, French language, разметка TEI, французский язык, TEI markup, TXM platform.

  • Lavrentiev, A., Guillot, C., Prévost, S., & Rainsford, T. (2012). La zone préverbale en ancien français : apport des corpus annotés. In F. N. ; V. M. T. ; P. B. ; T. K. ; P. L. ; S. P. ; S. Teston-Bonnard (Eds.), Actes Du 3E Congrès Mondial De Linguistique Française (Vol. 1, p. 159-176). Lyon, France. Retrieved from http://halshs.archives-ouvertes.fr/halshs-00758563

  • Lavrentiev, A., & Heiden, S. (2012). The TXM Portal Software giving access to Old French Manuscripts Online. In Proceedings Of The 1St Workshop On Adaptation Of Language Resources And Tools For Processing Cultural Heritage Objects, Seventh International Conference On Language Resources And Evaluation (p. 29-35). Istanbul, Turquie. Retrieved from http://halshs.archives-ouvertes.fr/halshs-00759361

  • Lavrentiev, A., & Heiden, S. (2012). Constructing Analytic Data Categories for Corpus Analysis from TEI encoded sources. In Text Encoding Initiative Conference 2012. College Station, TX, États-Unis. Retrieved from http://halshs.archives-ouvertes.fr/halshs-00808449

  • Lavrentiev, A., & Heiden, S. (2010). TEI P5 Manuscript Transcriptions as a Resource for Linguistic Research. In Tei Applied: Digital Texts And Language Resources. Zadar, Croatie. Retrieved from http://halshs.archives-ouvertes.fr/halshs-00620103

  • Lavrentiev, A., & Heiden, S. (2014). Exploration textométrique du corpus des dossiers de Bouvard et Pécuchet. Revue Flaubert, (13 - "Les dossiers documentaires de Bouvard et Pécuchet" : l'édition numérique du creuset flaubertie), 1-12. Retrieved from http://halshs.archives-ouvertes.fr/halshs-00678874
    Abstract: [http://flaubert.univ-rouen.fr/revue/article.php?id=113] Cet article présente une expérience d'exploitation du corpus des dossiers de Bouvard et Pécuchet dans le cadre méthodologique et technologique de la textométrie, qui est très éloigné du projet d'origine. Il montre les possibilités offertes par l'usage d'un système d'encodage de sources textuelles ouvert et interdisciplinaire tel que proposé par le format standard XML et les recommandations du consortium de la Text Encoding Initiative (TEI), mais aussi les limites que posent l'extrême variabilité des pratiques d'encodage en TEI et la difficulté de concilier la représentation documentaire très précise de la source primaire avec la constitution de structures sémantiques pertinentes pour l'analyse textométrique.
    Tags: édition électronique, Bouvard et Pécuchet, Flaubert, humanités numériques, textométrie.

  • Lavrentiev, A., & Heiden, S. (2012). The TXM Portal Software giving access to Old French Manuscripts Online. In Proceedings Of The 1St Workshop On Adaptation Of Language Resources And Tools For Processing Cultural Heritage Objects, Seventh International Conference On Language Resources And Evaluation (p. 29-35). Istanbul, Turquie. Retrieved from http://halshs.archives-ouvertes.fr/halshs-00759361
    Abstract: http://www.lrec-conf.org/proceedings/lrec2012/workshops/13.ProceedingsCultHeritage.pdf This paper presents the new TXM software platform giving online access to Old French Text Manuscripts images and tagged transcriptions for concordancing and text mining. This platform is able to import medieval sources encoded in XML according to the TEI Guidelines for linking manuscript images to transcriptions, encode several diplomatic levels of transcription including abbreviations and word level corrections. It includes a sophisticated tokenizer able to deal with TEI tags at different levels of linguistic hierarchy. Words are tagged on the fly during the import process using IMS TreeTagger tool with a specific language model. Synoptic editions displaying side by side manuscript images and text transcriptions are automatically produced during the import process. Texts are organized in a corpus with their own metadata (title, author, date, genre, etc.) and several word properties indexes are produced for the CQP search engine to allow efficient word patterns search to build different type of frequency lists or concordances. For syntactically annotated texts, special indexes are produced for the Tiger Search engine to allow efficient syntactic concordances building. The platform has also been tested on classical Latin, ancient Greek, Old Slavonic and Old Hieroglyphic Egyptian corpora (including various types of encoding and annotations).
    Tags: Old French, synoptic edition, TEI, textometry, tokenizer.

  • Lavrentiev, A., Heiden, S., & Decorde, M. (2013). Analyzing TEI encoded texts with the TXM platform. In The Linked Tei: Text Encoding In The Web. Tei Conference And Members Meeting 2013. Rome, Italy. Retrieved from https://halshs.archives-ouvertes.fr/halshs-01118120

  • Lavrentiev, A. (2007). Typologie textuelle pour l'étude linguistique de manuscrits français médiévaux. In Systèmes Graphiques De Manuscrits Médiévaux Et Incunables Français : Ponctuation, Segmentation, Graphies (p. 49-66). Chambéry: Université de Savoie.
  • Lavrentiev, A., & Markova, E. Codicological study of the medieval manuscript “Régime de santé” by Guido Parato. Nauchny Rezultat. Voprosy Teoreticheskoy I Prikladnoy Lingvistiki (Research Result. Theoretical And Applied Linguistics), 4(4), 123-129.

  • Lavrentiev, A. (2010). La 'phrase' en français médiéval : une réalité ou une reconstruction artificielle ? In P. S. Neveu F., Muni Toke V., Durand J., Klinger T., Mondada L. (Eds.), 2E Congrès Mondial De Linguistique Française (p. 277-289). La Nouvelle Orléans, États-Unis: EDP Sciences. Retrieved from http://halshs.archives-ouvertes.fr/halshs-00506075

  • Lavrentiev, A. (2010). La 'phrase' en français médiéval : une réalité ou une reconstruction artificielle ? In 2E Congrès Mondial De Linguistique Française (Vol. La Nouvelle Oréans, États-Unis, p. 277-289). Paris: EDP Sciences. Retrieved from http://halshs.archives-ouvertes.fr/halshs-00506075/en/; http://halshs.archives-ouvertes.fr/halshs-00506075/PDF/000125.pdf
    Tags: français médiéval, phrase, ponctuation, proposition.
    Note Note
    La notion de phrase joue un rôle important dans la syntaxe selon les grammaires traditionnelles. Le découpage du texte en phrases affecte par ailleurs d'une manière importante le fonctionnement des outils de traitement automatique de langue naturelle et des moteurs de recherche sur corpus. En ce qui concerne le français médiéval, des doutes sur la pertinence de cette notion pour la période en question ont été exprimés par plusieurs linguistes. Des "phrases" sont pourtant introduites grâce à la "modernisation" de la ponctuation dans les éditions scientifiques, et ce sont ces phrases qu'on retrouve dans la plupart des corpus de français médiéval. Pour résoudre ce problème, il convient de distinguer les unités résultant de la segmentation du texte écrit à l'aide de la ponctuation ("phrases graphiques" ou "unités de lecture") des "unités syntaxiques maximales", dont la définition doit être basée sur seuls les critères syntaxiques. L'analyse de la ponctuation dans les sources primaires de la langue médiévale (manuscrits et incunables) permet de vérifier si les unités définies sur des critères syntaxiques correspondent aux unités délimitées par les marques de ponctuation. Nous proposons de définir l'"unité syntaxique maximale" comme une proposition autonome ou un agencement de propositions qui entretiennent des liens syntaxiques forts (subordination ou partage de constituants). L'usage de la ponctuation dans les sources primaires et les pratiques de modernisation de la ponctuation dans les éditions scientifiques semblent confirmer cette hypothèse.

0 | ... | 100 | 150 | 200 | 250 | 300 | 350 | 400 | 450 | 500 | ... | 550

--- Export the selection using the format
SPIP | | Site Map | Follow site activity RSS 2.0