Parmi celles-ci, la textométrie (mesure du texte) fait partie d’une discipline qu’on appelle l’analyse de données textuelles (ADT). La lexicométrie (mesure du lexique) en fait également partie et la logométrie s’ajoute à ces deux disciplines, complétant ainsi l’ADT. S’attachant d’abord à évaluer la richesse du vocabulaire d’un texte, la textométrie s’est ensuite spécialisée dans différentes procédures telles que le calcul des correspondances, la classification et d’autres procédures.
Quant à la logométrie (logos = discours ; métron = mesure). Cette discipline se développe au 21ème siècle dans le cadre des humanités numériques. Elle se présente comme un prolongement naturel de la lexicométrie (mesure du lexique) et de la textométrie (mesure du texte). Seulement, c’est le discours ou logos (c’est-à-dire le discours politique, littéraire, médiatique, scientifique…) dans ses dimensions linguistiques et sociales qui est son objet. Il s’agit d’une méthode d’analyse et d’interprétation des discours utilisée dans les Sciences Humaines et Sociales qui est assistée par ordinateur, elle combine ainsi lecture qualitative et lecture quantitative des corpus numériques. Elle articule également lecture globale (le discours entier) et lecture locale (les unités du discours) pour construire l’interprétation.
Rappelons ici deux définitions du concept de “texte” : d’abord, “un texte est une série orale ou écrite de mots perçus comme constituant un ensemble cohérent, porteur de sens et utilisant les structures propres à une langue (conjugaisons, construction et association des phrases…).” Ensuite, “un texte peut représenter un entretien, un article, un livre ou tout autre type de documents. Un corpus peut contenir un ou plusieurs textes (mais au minimum un).” Nous pouvons, à partir de ces deux définitions complémentaires, éclaircir le lien entretenu entre la notion de texte et celle du discours dans le domaine de la logométrie. En effet, si le concept de discours est entendu comme un type de texte d’ordre personnel selon Emile Benveniste, le concept de texte est quant à lui perçu comme une série orale ou écrite de mots cohérents entre eux. Ce dernier est donc à appréhender dans sa forme générique.
Pour résumer les notions auxquelles la démarche de traitement de la donnée textuelle répond, voici les différents éléments qui la constituent :
- Les propositions sont des séries écrites de mots.
- Dans un corpus textuel sont rassemblés un ou plusieurs textes (de type “discours”) correspondant aux propositions de la consultation. Il s’agit de l’unité établie et constituée manuellement, sur laquelle nous travaillons et qui servira au traitement avec le logiciel IRaMuTeQ.
- “Le texte” est un hyperonyme ; il regroupe plusieurs mots plus spécifiques : discours, entretien, article, livre, ou autres.
- Une consultation rassemble plusieurs types de discours : “argumentatif”, “explicatif”, “descriptif” par exemple.
- Le discours engage systématiquement celui qui le prononce, et est donc envisagé comme étant “personnel”.
De fait, la logométrie qui s’applique au discours est donc naturellement adaptée aux jeux de données des différentes consultations réalisées avec les plateformes déployées par Open Source Politics.
Le logiciel au service de l’analyste
Commentaires récents