Home > Bibliographic references

Bibliographic references

Year not specified


  • PLUME | Promouvoir les Logiciels Utiles, Maitrisés et Economiques. (2007). PLUME | Promouvoir les Logiciels Utiles, Maitrisés et Economiques. text. Retrieved April 5, 2013, from https://www.projet-plume.org/
    Abstract: Fiches de logiciels (logiciels libres en majorité) utilisés ou développés dans la communauté de l'Enseignement Supérieur et la Recherche (universités, CNRS, INRA...) et documents associés

  • Projet Textométrie. (2007). Projet Textométrie. Projet TextomTrie. Retrieved May 28, 2013, from http://textometrie.ens-lyon.fr/
  • Introduction à la textométrie sur un corpus d’articles de recherche en sciences de l’éducation

  • Aide HAL Inria : 70. Insérer ses publications dans sa page web. Aide HAL Inria : 70. Insérer ses publications dans sa page web. Retrieved March 25, 2013, from http://seism.inria.fr/hal/aide/spip.php?article154

  • Category talk:Search engine optimization consultants. (2010, May 16). Category talk:Search engine optimization consultants. In Wikipedia, The Free Encyclopedia. Retrieved from http://en.wikipedia.org/w/index.php?title=Category_talk:Search_engine_optimization_consultants&oldid=362491697
    Abstract: The presence of a "Search engine optimization consultants" category seems like a good way for SEO consultants to exploit Wikipedia as a SEO tool or, in the best case, a vehicle for their vanity. I suggest the removal of the entire category (from Wikipedia, not from Planet Earth...). 12.129.71.235 18:13, 9 February 2007 (UTC) Claudio

  • Acreman, M. (2000). L'hydrologie des zones humides (Vol. 1-1). Arles: Tour du Valat.
    Tags: Écologie des zones humides, Écologie des zones humides -- Méditerranée (région), Conservation des ressources naturelles -- Méditerranée (région) -- Coopération internationale, Conservation des zones humides -- Méditerranée (région), Cycle hydrologique, Gestion des ressources en eau, Zones humides -- Aspect économique -- Méditerranée (région).
  • Alliance, O. S. G. (2003). Osgi service platform, release 3. IOS Press, Inc.


  • Alnassan, A. (2017). L'enseignement de l'arabe L2 entre l'héritage et la nouveauté en didactique des langues vivantes. Bellaterra Journal Of Teaching & Learning Language & Literature, 10(1), 20 - 41. doi:10.5565/rev/jtl3.665
    Abstract: Cet article a pour objet la problématique de la constitution du contenu lexical des manuels d’enseignement de l’arabe L2 de l’Institut supérieur des langues de l’Université de Damas (Syrie). Le contenu actuel représente l'approche classique du lexique, qui se focalise sur le sens des mots et des expressions alors que les fonctionnalités communicatives de ces éléments langagiers sont peu traitées. L’analyse proposée montre les points de faiblesse dans la présente constitution des manuels utilisés. Elle s’appuie sur les critères du Cadre européen commun de référence pour les langues (CECRL) et des référentiels des Niveaux pour le français, qui proposent une approche plus adaptée pour la préparation du lexique dans les manuels récents d’enseignement des langues vivantes. Cette analyse peut servir de modèle pour revaloriser les manuels d’autres institutions qui conservent encore l’ancienne tradition de la didactique des langues.

  • Armaselu, F. (2014). DIGITAL ENQUIRIES: NARRATIVISATION OF SOURCES IN EUROPEAN INTEGRATION HISTORY. In . Presented at the Narrative Matters 2014: Narrative Knowing/Récit et Savoir. Retrieved from https://hal.archives-ouvertes.fr/hal-01099478/document
    Abstract: The article deals with combined analysis methods related to White's concept of "narrativisation" and applied to a digital collection in European integration history. In the first part, the analysis implies the use of concepts like "narrativisation", "emplotment", "referential illusion" proposed by theorists like Hayden White, Paul Ricœur and Roland Barthes for the study of historical texts. In the second part, elements of computational processing (network text analysis, corpus analysis, named entity recognition) are performed to test the theoretical assumptions formulated in the previous sections.
    Attachment Full Text PDF 1.6 Mb (source)


  • Armaselu, F., Martins, V., & Jones, C. E. (2016). Materiality of TEI Encoding and Decoding: An Analysis of the Western European Union Archives on Armament Policy. Journal Of The Text Encoding Initiative, (Issue 9). doi:10.4000/jtei.1463
  • Arnold, K., Gosling, J., & Holmes, D. (2005). The Java programming language. Addison Wesley Professional.

  • Baider, F. (2014). ANALYSING JOURNALISTIC DISCOURSE AND FINDING OPINIONS SEMI-AUTOMATICALLY? Journal Of Data Mining And Digital Humanities, 2014. Retrieved from https://hal.archives-ouvertes.fr/hal-00919370/document
    Abstract: This research study tested three different NLP technologies to analyze representative journalistic discourse used in the 2007 and 2012 presidential campaigns in France. The analysis focused on the discourse in relation to the candidate's gender and/ or political party. Our findings suggest that using specific software to examine a journalistic corpus can reveal linguistic patterns and choices made on the basis of political affiliation and/or gender stereotypes. These conclusions are drawn from quantitative and qualitative analysis carried out with three different software programs: SEMY, which semi-automatically provides semantic profiles; ANTCONC, which provides useful Keywords in Context (KWIC) or abstracts of texts, as well as collocations; TERMOSTAT, which reveals discourse specificities, frequencies and the most common morpho-syntactic patterns. Analysis of our data point to convergent asymmetries between female and male candidates in journalistic discourse (however conditionally) for the 2007 and the 2012 French presidential campaigns. We conclude that social gender (i.e., stereotypical expectations of who will be a typical member of a given category) and / or political favoritism may affect the representation of leadership in discourse, which, in turn, may influence the readership, hence the electorate. Thus the study recommends the use of corpus linguistic tools for the semi-automatic investigation of political texts.

  • Baillot, A. (2017). Zahlenwahn oder Textliebe? Digitale Philologie als Disziplin und als Weltanschauung. In . Presented at the Machines / Maschinen Les 5O ans de l'AGES. Retrieved from https://halshs.archives-ouvertes.fr/halshs-01562486/document
    Abstract: Noch oft wird die digitale Philologie aus Unkenntnis ihrer wissenschaftlichen Praktiken falsch eingeschätzt. Im ersten Teil dieses Vortrags wird detailliert auf die unterschiedlichen Bereiche eingegangen, die diese ausmachen: Erschließung, Annotation, Edition, Analyse, Kritik. Für jeden dieser Bereiche wird erläutert, wo Interpretationsspielraum im Digitalen gegeben ist. Im zweiten Teil des Vortrags geht es darum, die Bedeutung solcher Praktiken für die heutige Germanistik auszuloten. Insbesondere gilt es zu zeigen, dass algorithmische Methoden nur einen Bruchteil der heutigen digitalen Philologie ausmachen. Der Bereich der Textetablierung soll hier in den Vordergrund rücken, denn Algorithmen taugen nur in dem Moment etwas, wo sie auf eine wissenschaftlich solide Textquelle angewendet werden. Fragen der Textetablierung sind an dieser Stelle eng mit Fragen der Zugänglichkeit zu einschlägigen Textkorpora verbunden - Fragen, für die kein Computer Lösungsansätze liefern kann, sondern die Fächer in ihrem Selbstverständnis. Mit dem Beweis, dass digitale Philologie in unseren Händen liegt, ist auch der Appell verbunden, sich der Verantwortung zu stellen, die mit diesem offenen Feld vor der Germanistik steht. Der Vortrag schließt mit konkreten Vorschlägen, wie digitale Philologie in germanistische Curricula eingebunden werden könnte.
    Attachment Full Text PDF 489.4 kb (source)

  • Barats, C., Dister, A., Gambette, P., Leblanc, J. - M., & Peres-Leblanc, M. (2016). Analyser des pétitions en ligne : potentialités et limites d'un dispositif d'étude pluridisciplinaire. In . Presented at the JADT 2016. Retrieved from https://hal-upec-upem.archives-ouvertes.fr/hal-01302218/document
    Abstract: Les pétitions en ligne constituent un objet d'investigation riche pour le chercheur, que ce soit du point de vue de la matérialité discursive ou du rapport au politique. Cet objet s'avère cependant difficile à saisir, compte tenu de la variété des données et des variables. L'analyse d'un site de pétitions en ligne souligne ainsi l'hétérogénéité des rubriques, des titres et textes d'appel des pétitions, du nombre de signataires ou de commentaires. Pour examiner ce dispositif, le chercheur se doit de faire des choix et d'avoir recours à différents outils de statistique textuelle afin de mettre au jour ce qui caractérise les pétitions, tout en rendant compte de leur variété.
    Attachment Full Text PDF 1.2 Mb (source)

  • Barbier, E. B., Acreman, M., & Knowler, D. (1997). Economic valuation of wetlands : a guide for policy makers and planners. Gland, Switzerland: Ramsar convention bureau.
    Tags: Écologie des zones humides -- Aspect économique, Conservation des zones humides -- Aspect économique, Ecologie des zones humides, Zones humides -- Aspect économique, Zones humides -- Conservation.
  • Barclay, K. A., & Savage, W. J. (2007). Groovy programming: an introduction for Java developers. Morgan Kaufmann Publishers.

  • Barreca, G., & Christodoulides, G. (2014). Un concordancier multi-niveaux et multimédia pour des corpus oraux. In . Presented at the 21e Conférence sur le Traitement automatique des Langues Naturelles (TALN 2014). Retrieved from https://halshs.archives-ouvertes.fr/halshs-01078133/document
    Abstract: Les concordanciers jouent depuis longtemps un rôle important dans l’analyse des corpus linguistiques, tout comme dans les domaines de la philologie, de la littérature, de la traduction et de l’enseignement des langues. Toutefois, il existe peu de concordanciers qui soient capables d’associer des annotations à plusieurs niveaux et synchronisées avec le signal sonore. L’essor des grands corpus de français parlé introduit une augmentation des exigences au niveau de la performance. Dans ce travail à caractère préliminaire, nous avons développé un prototype de concordancier multi-niveaux et multimédia, que nous avons testé sur le corpus de français parlé du projet Phonologie du Français Contemporain (PFC, 1,5 million de tokens de transcription alignée au niveau de l’énoncé). L’outil permet non seulement d’enrichir les résultats des concordances grâce aux données relevant de plusieurs couches d’annotation du corpus (annotation morphosyntaxique, lemme, codage de la liaison, codage du schwa etc.), mais aussi d’élargir les modalités d’accès au corpus.
  • Benzécri, J. P. (1977). Analyse Discriminante et Analyse Factorielle. Les Cahiers De L'analyse Des Données, II(4), 369�406.
  • Benzécri, J. P. (1979). L'analyse Des Données : La Taxinomie (3ièmerd ed., Vol. I). Paris: Dunod.
    Abstract: Introduction à la classification ; théorie sur la taxinomie ; applications aux sciences de la nature, à l'économie et à la psychologie ; programmes de calcul correspondants.
  • Benzécri, J. P. (1979). L'analyse Des Données : L'analyse Des Correspondances (3ièmerd ed., Vol. II). Paris: Dunod.
    Abstract: Introduction à l'analyse factorielle ; théorie de l'analyse factorielle ; applications diverses ; applications à l'analyse des questionnaires ; programmes de calcul correspondants.
  • Benzécri, J. - P., & al.,. (1973). L'analyse des correspondances (Vol. II). Paris: Dunod.

  • Beretta, F. (2015). Publishing and sharing historical data on the semantic web : the SyMoGIH project – symogih.org. In . Presented at the Workshop: Semantic Web Applications in the Humanities. Retrieved from https://halshs.archives-ouvertes.fr/halshs-01136533
    Abstract: La communication présente l'ontologie retenue pour publier les données du projet symogih.org —plate-forme collaborative de stockage de l'information historique au service de la recherche— en utilisant les technologies du web sémantique. Après avoir présenté les atouts et les limites de quelques ontologies comparables, il propose trois exemples de réécriture des données selon l'ontologie symogih.org et montre son utilité en vue de l'interopérabilité des données sur le web.
  • Biber, D., & Finegan, E. (1986). An Initial Typology of English Text Types. In J. Aarts & W. Meijs (Eds.), Corpus Linguistics Ii. Amsterdam: Rodopi.
  • Biber, D., & Finegan, E. (1994). Intra–Textual Variation Within Medical Research Articles. In N. Ooostdijk & P. de Haan (Eds.), Corpus–Based Research Into Language (p. 201–222). Amsterdam: Rodopi.

  • Bibié-Emerit, L. (2015, November 27). Description du discours numérique : étude des bouleversements linguistiques du web 2.0 au travers de l'exemple des souhaits d'anniversaire sur Facebook (phdthesis). Université Michel de Montaigne - Bordeaux III. Retrieved from https://tel.archives-ouvertes.fr/tel-01442467/document
    Abstract: Ce travail de recherche propose une description du discours numérique tel qu’il apparaît dans l’environnement numérique qu’est Facebook. Il s’appuie sur l’étude des souhaits d’anniversaire, en montrant comment leur forme finale peut être influencée par la préconstruction technolangagière du site. La première partie, donne un aperçu de l’évolution des recherches sur le discours numérique, en décrivant d’une part le contexte d’apparition du web 2.0 et des bouleversements épistémologiques et discursifs qu’il a pu provoquer. Et d’autre part les spécificités linguistiques connues du discours apparaissant dans les environnements numériques. La deuxième partie, montre que l’avènement du web social a changé les choses dans les recherches sur le discours numérique, demandant une approche pluridisciplinaire. Cette réflexion nécessite de décentrer le regard des énoncés pour s’intéresser à leur environnement de production et aux affordances qu’il offre aux locuteurs. Ce nouveau positionnement épistémologique permet de repenser la description de Facebook, non plus comme une plateforme communicationnelle mais comme un environnement discursif complexe mettant en question les notions d’identité, d’intimité et de liens socio-affectifs. Enfin, la troisième et dernière partie de cette thèse, présente les problématiques liées à l’étude d’un cas concret d’écriture nativement numérique. La description et l’analyse des souhaits d’anniversaire sur Facebook et des outils méthodologiques et théoriques adaptés aux environnements numériques utilisés à cette fin. La description et l’analyse des souhaits d’anniversaire sur Facebook permettent de dégager deux aspects technolangagiers dans ce type de discours. Le premier est l’action environnementale sur la production langagière, c’est le cas notamment de la préconstruction technolangagière mais aussi de la prise en compte de l’exposition du message par les locuteurs (redéfinition du lien socio-affectif). Le second est l’intégration de la technologie à l’intérieur même des formes discursives, générant de nouveaux technogenres comme le discours par bouton ou des énoncés augmentés comme les hashtags.


  • Blanchard, A., & Sabuncu, E. (2015). Les humanités numériques, une science "plug and play" ?. Maison des sciences de l'homme d'Aquitaine. Retrieved from https://halshs.archives-ouvertes.fr/halshs-01248081/document
    Abstract: La communauté des humanités numériques réinvente ses métiers non sans inventer de nouvelles contradictions. En particulier, la profusion d'outils qui invite au jeu et fait souffler un vent de liberté apporte avec elle son lot de prêt-à-penser. Nous avons voulu rejoindre cette grande "foire aux outils" en développant l'application web vocabulari.se. Action et réflexion se rejoignent dans un retour d'expérience qui vise à éclairer quelques uns des enjeux des humanités numériques.

  • Bodt, J. - M. (2014, October 2). La "cité écologique" dans l'espace public médiatique : trajectoires de controverses environnementales dans la presse généraliste française (phdthesis). Université Toulouse le Mirail - Toulouse II. Retrieved from https://tel.archives-ouvertes.fr/tel-01221196/document
    Abstract: Afin de participer aux décisions politiques, suivant des procédures institutionnalisées ou par le simple fait de se forger une opinion, les médias d’information jouent un rôle central. Avec les problématiques écologiques contemporaines, cette exigence de participation s'accroît. Comment, dans les discours médiatiques, les enjeux environnementaux sont-ils traduits et mis en forme ? Par l’étude de deux trajectoires de controverses sociotechniques (autour du gaz de schiste et de la centrale nucléaire de Fessenheim) dans la presse généraliste (Le Monde et 20minutes) et un éventail de journaux plus large, nous explorons comment celles-ci se fixent dans différents répertoires de « montée en généralité ». À l’aide d’une articulation entre méthodes quantitative (lexicométrie) et qualitative (analyse du discours), nous dévoilons un dialogue entre différents « mondes de justification » (Boltanski et Thévenot, 1991) et cherchons l’existence d’une « cité écologique » (Lafaye et Thévenot, 1993) dans l’espace public médiatique.

  • Bon, B. (2012). Le vocabulaire technique en latin médiéval, entre mythe et réalité. In (Vol. 71, p. 355-375). Presented at the Fünfte internationale mittellateinische Lexikographentagung. Retrieved from https://halshs.archives-ouvertes.fr/halshs-01117267/document
    Abstract: Pour tenter d’éclairer l’attitude du lexicographe, face à un mot qui relève d’un domaine qu’il ne maîtrise pas, nous nous sommes interrogés sur la notion de « spécialité » : qu’entend-on communément par « langue technique », et que cela représente-t-il en latin médiéval ? Trois principaux constats : la différence des langues s’exprimait dans les mêmes termes que la différence des langages ; les seuls groupes de locuteurs « techniques » nommés dans nos documents sont liés à l’enseignement ; notre pratique lexicographique, peu ordonnée, représente une source de difficultés croissantes avec l’informatisation des dictionnaires de latin médiéval.

  • Bonnet, B. (2005). Gestion intégrée des zones humides méditerranéennes : concepts, enseignements et démarches pour intégrer la conservation aux dynamiques des territoires (Vol. 1-1). Arles (France): Tour du Valat.
    Tags: Écologie des zones humides -- Méditerranée (région), Conservation des ressources naturelles -- Méditerranée (région) -- Coopération internationale, Conservation des zones humides -- Méditerranée (région), Zones humides -- Aspect économique -- Méditerranée (région).

  • Bouchet-Valat, M., & Bastin, G. (2013). RcmdrPlugin.temis, a Graphical Integrated Text Mining Solution in R. The R Journal, 5(1), 188-196. Retrieved from http://hal.univ-grenoble-alpes.fr/hal-00939504/document
    Abstract: We present the package RcmdrPlugin.temis, a graphical user interface for user-friendlytext mining in R. Built as a plug-in to the R Commander provided by the Rcmdr package, it brings together several existing packages and provides new features streamlining the process of importing,managing and analyzing a corpus, in addition to saving results and plots to a report file. Beyond common file formats, automated import of corpora from the Dow Jones Factiva content provider and Twitter is supported. Featured analyses include vocabulary and dissimilarity tables, terms frequencies, terms specific of levels of a variable, term co-occurrences, time series, correspondence analysis and hierarchical clustering.
    Attachment Full Text PDF 290.1 kb (source)

  • Boukhaled, M. A. (2016, September 13). On Computational Stylistics: Mining Literary Texts for the Extraction of Characterizing Stylistic Patterns (phdthesis). Pierre et Marie Curie, Paris VI. Retrieved from http://hal.upmc.fr/tel-01493312/document
    Abstract: The present thesis locates itself in the interdisciplinary field of computational stylistics, namely the application of statistical and computational methods to the study of literary style. Historically, most of the work done in computational stylistics has been focused on lexical aspects especially in the early decades of the discipline. However, in this thesis, our focus is put on the syntactic aspect of style which is quite much harder to capture and to analyze given its abstract nature. As main contribution, we work on an approach to the computational stylistic study of classic French literary texts based on a hermeneutic point of view, in which discovering interesting linguistic patterns is done without any prior knowledge. More concretely, we focus on the development and the extraction of complex yet computationally feasible stylistic features that are linguistically motivated, namely morpho-syntactic patterns. Following the hermeneutic line of thought, we propose a knowledge discovery process for the stylistic characterization with an emphasis on the syntactic dimension of style by extracting relevant patterns from a given text. This knowledge discovery process consists of two main steps, a sequential pattern mining step followed by the application of some interestingness measures. In particular, the extraction of all possible syntactic patterns of a given length is proposed as a particularly useful way to extract interesting features in an exploratory scenario. We propose, carry out an experimental evaluation and report results on three proposed interestingness measures, each of which is based on a different theoretical linguistic and statistical backgrounds.

  • Braillon-Chantraine, C., Davignon, A., Lahoche, N., Idmhand, F., & Martini, C. (2014). Le programme de recherche sur les archives du Fonds Alcides Giraldi : un exemple de production de données en humanités numériques. Revue Des Nouvelles Technologies De L'information, p.169-184. Retrieved from https://halshs.archives-ouvertes.fr/halshs-01132614/document
    Abstract: Parmi les patrimoines écrits que les institutions publiques ou privées sont susceptibles de recevoir, les archives des écrivains contemporains représentent, par leur originalité, leur diversité et leur amplitude, un défi pour celles qui acceptent d’assumer leur conservation, leur préservation et de faciliter leur consultation. Du point de vue de la recherche, au sein des humanités numériques en particulier, ces archives constituent une importante réserve de données à condition, bien sûr, que celles-ci soient exploitables. Cet article propose d’expliquer comment, depuis 2003, nous nous sommes engagés dans la constitution d'une telle réserve à travers le projet de recherches et de valorisation du fonds « Alcides Giraldi ». Ce fonds, actuellement hébergé à Lille, comporte de nombreux inédits susceptibles de documenter la recherche inter-nationale sur la circulation des idées entre l’Europe et les Amériques durant les principaux conflits du XXème siècle.
  • Bray, T., Paoli, J., Sperberg-McQueen, C. M., Maler, E., & Yergeau, F. (2008). Extensible markup language (XML) 1.0 (Fifth Edition). W3C.
  • Brill, E. (1995). Transformation–Based Error–Driven Learning and Natural Language Processing : A Case Study in Part–of–Speech Tagging. Computational Linguistics, 4(21), 543–565.
  • Bronckart, J. –P., Bain, D., Schneuwly, B., Davaud, C., & Pasquier, A. (1985). Le Fonctionnement Des Discours : Un Modèle Psychologique et Une Méthode D'analyse. Lausanne: Delachaux & Niestlé.
  • Brunet, E. (1981). Le Vocabulaire Français de 1789 À Nos Jours, D'après Les Données Du Trésor de la Langue Fran\c caise. Génève–Paris: Slatkine–Champion.

  • Buhler, T., Bendinelli, M., & Lethier, V. (2017). Les PDU des années 2000/2010 et leurs discours. In . Presented at the Treizièmes Rencontres de Théo Quant. Retrieved from https://hal.archives-ouvertes.fr/hal-01530420/document
    Abstract: De nombreuses disciplines cherchent à comprendre les raisons profondes qui motivent la mise en place de politiques urbaines et les discours les accompagnant 1. Cela dit, ces travaux de recherche se heurtent souvent à des problèmes de méthodologie. En effet, les méthodes « classiques » que sont les entretiens avec les acteurs, le travail sur archives, la passation de questionnaires auprès d’acteurs ou encore les expérimentations présentent chacune de fortes limites par rapport à l’ambition scientifique d’une analyse distanciée et systématisée de l’action publique urbaine et de ses discours
  • Burnard, L. (1995). Text Encoding for Information Interchange—- An Introduction to the Text Encoding Initiative. Oxford.
  • Burnard, L. (1995). What is SGML and How Does It Help Us. Computers And The Humanities, (29), 41–50.
  • Burnard, L., & Sperberg–McQueen, C. M. (1996). La TEI Simplifiée : Une Introduction Au Codage Des Textes Électroniques En Vue de Leur Échange. Cahiers Gutenberg, (24), 23–151.

  • Camps, J. - B. (2017). Où va la philologie numérique ? Retrieved from https://halshs.archives-ouvertes.fr/halshs-01674953/document
    Abstract: Si, pour les premiers philologues à l'utiliser dès les années 1950, l'ordinateur était avant tout un outil auquel déléguer des tâches répétitives ou très vastes d'un point de vue quantitatif, je défends dans cet article l'idée que les méthodes computationnelles, ou, pour mieux dire, la philologie tournée vers les données peut être un vecteur puis-sant de transformation pour nos disciplines, au sein du cadre fourni par le quatrième paradigme, émergent, d'une méthode scientifique unifiée. En effet, si la publication électronique d'éditions de texte a souvent, jusqu'à présent, retenu l'attention des cher-cheurs en sciences du texte, le coeur des transformations potentielles réside plutôt dans une approche qui mette les données au centre : en amont, cela signifie tirer profit des méthodes computationnelles pour produire des données dans des quantités ou granula-rités jusque là inenvisageables ; en aval, cette approche est à même de renverser la ma-nière même dont nous formulons nos énoncés ou construisons la connaissance, en pas-sant d'une approche fondée sur des hypothèses préexistantes à un processus dans le-quel on fasse émerger une formalisation à partir des données elles-mêmes, nous éman-cipant ainsi un peu plus de nos postulats les plus ancrés ou des présupposés du sens commun. Tandis que nous enregistrons de nouveaux ensembles de faits sélectionnés dans nos sources, de nouvelles enquêtes ou analyses deviennent possible, pour autant que nous ne restions pas prisonniers des interfaces, limitées par nature et dont la pé-rennité est douteuse. Si « les données sont le résultat important sur le long terme », elles devraient être partagées sans restrictions, tant pour permettre le progrès cumulatif des connaissances, que pour se conformer aux exigences de la recherche scientifique : reproductibilité, réfutabilité. Pour que ce type de science ouverte soit réalisée, nous devrions être moins indulgents envers les revendications abusives de droits patrimo-niaux ou de propriété des textes anciens.

  • Camps, J. - B. (2016, December 3). La Chanson d’Otinel : édition complète du corpus manuscrit et prolégomènes à l’édition critique (phdthesis). Université Paris-Sorbonne - Paris IV. Retrieved from https://halshs.archives-ouvertes.fr/tel-01664932/document
    Abstract: Se rattachant à la geste du roi, la Chanson d'Otinel n'avait pas été rééditée depuis le travail pionnier de F. Guessard et H. Michelant en 1858. Partant des objets tangibles que sont les manuscrits pour aller vers l'étude de la tradition et de l'œuvre, ce travail se propose de réexaminer l'ensemble des données disponibles, en vue de permettre la restauration d'une œuvre qui a connu une diffusion importante dans l'Europe médiévale, mais que nous ne conservons qu'en l'état de vestiges épars. La thèse prend un parti résolument méthodologique, en cherchant à faire bénéficier l'édition des progrès épistémologiques engendrés tant par les contributions les plus récentes aux débats propres à l'ecdotique et à la critique textuelle que par ce qu'il est convenu d'appeler les « humanités numériques ». L'édition tente ainsi de dépasser l'opposition entre philologie « nouvelle » et traditionnelle, de la méthode des fautes communes ou d'inspiration bédiériste, pour se placer dans la perspective d'une « quatrième voie » et d'une édition « tournée vers la tradition ». Les techniques de l'édition électronique et de la philologie numérique sont sollicitées afin de fournir une édition complète du corpus manuscrit, qui, par des transcriptions « à couches », donne accès à différentes représentations et au système graphique des différents témoins. L'édition vise également à la description et l'analyse des liens que ces témoins entretiennent entre eux, en mettant en place une méthode de représentation de la variance textuelle et en cherchant à appuyer l'analyse généalogique sur une prise en compte globale de la tradition, incluant les traductions médiévales (galloises, norroises, anglaises) et les versions dérivées. Le travail de modélisation et de description des manuscrits et de leurs textes, formalisé par un modèle xml/tei conçu pour les besoins de cette édition mais se voulant de portée plus générale, est très nettement tourné vers l'exploitation des données, dans une perspective d'analyse quantitative doublée d'une approche plus traditionnelle (paléographie, scriptométrie, stemmatologie). Des méthodes relevant de la modélisation mathématique, de la statistique, de l'algorithmique et de l'intelligence artificielle sont mises en œuvre, ainsi que des traitements visant à permettre l'interopérabilité, la montée en masse et la systématisation du travail éditorial (reconnaissance optique de caractères, annotation linguistique, collation), au sein d'une chaîne éditoriale faisant la part belle à l'analyse. Les développements effectués sont principalement en xml (tei, xslt), r et Python.
    Attachment Full Text PDF 35.5 Mb (source)
  • Cehessat, R. Exercices Commentés de Statistique et Informatique Appliquées. Paris: Dunod.
    Abstract: Probabilités sur un ensemble discret : 21 ex.–cor. ; Variable aléatoire sur un ensemble discret : 15 ex. stat. et 3 ex. info. ; Varaibles aléatoires générales : 13 ex. stat. et 3 ex. info. ; Test classiques : 14 ex. stat. et 6 ex. info. ; Méthodes non–paramétriques : 14 ex. stat. et 1 ex. info. ; Analyse des données : 20 ex. stat. et 11 ex. info. (complète [lebartmorineau90])
  • Chisholm, D., & Robey, D. (1995). Encoding Verse Texts. Computer And The Humanities, (29), 99–111.
  • Christ, O., Schulze, B. M., Hofmann, A., & Koenig, E. (1999). The IMS Corpus Workbench: Corpus Query Processor (CQP): User's Manual. University Of Stuttgart, 8.
  • Church, K. W., & Hanks, P. (1990). Word Association Norms, Mutual Information, and Lexicography. Computational Linguistics, 1(16), 22–29.

  • Clavert, F. (2015). Comprendre les Humanités numériques. In . Presented at the Journée d'études HumaN'Doc. Retrieved from https://halshs.archives-ouvertes.fr/halshs-01230260
    Abstract: Comment mener une recherche historique dans un monde de données?

  • Colditz, G. (1994). Auen, Moore, Feuchtwiesen : Gefährdung und Schutz von Feuchtgebieten (Vol. 1-1). Basel: Birkhäuser.
    Tags: Animaux des zones humides, Écologie des zones humides, Conservation des zones humides, Nature conservation, Plantes des zones humides, Wetland animals, Wetland plants, Wetlands.


  • Comby, É., & Lay, Y. - F. L. (2014). Communiquer sur le patrimoine naturel. Discours de presse locale dans les Ramières de la Drôme, Rhône-Alpes (1981-2008). Développement Durable Et Territoires, (Vol. 5, n°2). doi:10.4000/developpementdurable.10254


  • Corpus de textes : composer, mesurer, interpréter. (2016). Corpus de textes : composer, mesurer, interpréter. (É. Comby, Y. Mosset, & S. de Carrara, Eds.). ENS Éditions. Retrieved from http://books.openedition.org/enseditions/7328

0 | 50 | 100 | 150 | 200

--- Export the selection using the format
SPIP | | Site Map | Follow site activity RSS 2.0