Open Access BASE2014

Plaidoyer en faveur de l'Analyse de Données co(n)Textuelles. Parcours cooccurrentiels dans le discours présidentiel français (1958-2014)

Abstract

International audience ; This paper recalls the double constraint of text mining: tokenizing and co(n)textualizing. It also treats co-occurrences as (complex) text units. For this reason-as they are textual molecules and moreover also semantic molecules-text mining tools can be applied to them: such as for example the historic calculation of Specifics, especially in a contrastive approach to corpora. Because a co-occurring pair, unlike a single word, is rarely semantically ambiguous, constituting as it does the minimal form of co(n)text, it allows a better characterization of texts and their contents. ; Cette contribution rappelle la double contrainte de l'ADT : segmenter et co(n)textualiser. Elle pose par ailleurs les cooccurrences comme des unités (complexes) du texte. A ce titre – comme molécules textuelles et plus loin comme molécules sémantiques – les outils de l'ADT peuvent leur être appliqués comme par exemple l'historique calcul des spécificités, notamment dans une approche contrastive des corpus. Parce que la paire cooccurrentielle est sémantiquement rarement ambiguë et qu'elle constitue la forme minimale du co(n)texte, elle permet une meilleure caractérisation des textes et de leurs contenus.

Problem melden

Wenn Sie Probleme mit dem Zugriff auf einen gefundenen Titel haben, können Sie sich über dieses Formular gern an uns wenden. Schreiben Sie uns hierüber auch gern, wenn Ihnen Fehler in der Titelanzeige aufgefallen sind.