Plaidoyer en faveur de l'Analyse de Données co(n)Textuelles. Parcours cooccurrentiels dans le discours présidentiel français (1958-2014)
Abstract
International audience ; This paper recalls the double constraint of text mining: tokenizing and co(n)textualizing. It also treats co-occurrences as (complex) text units. For this reason-as they are textual molecules and moreover also semantic molecules-text mining tools can be applied to them: such as for example the historic calculation of Specifics, especially in a contrastive approach to corpora. Because a co-occurring pair, unlike a single word, is rarely semantically ambiguous, constituting as it does the minimal form of co(n)text, it allows a better characterization of texts and their contents. ; Cette contribution rappelle la double contrainte de l'ADT : segmenter et co(n)textualiser. Elle pose par ailleurs les cooccurrences comme des unités (complexes) du texte. A ce titre – comme molécules textuelles et plus loin comme molécules sémantiques – les outils de l'ADT peuvent leur être appliqués comme par exemple l'historique calcul des spécificités, notamment dans une approche contrastive des corpus. Parce que la paire cooccurrentielle est sémantiquement rarement ambiguë et qu'elle constitue la forme minimale du co(n)texte, elle permet une meilleure caractérisation des textes et de leurs contenus.
Themen
Sprachen
Französisch
Verlag
HAL CCSD
Problem melden