National audience ; Dans nos séminaires, colloques et enquêtes, nous sommes régulièrement interpellés sur ce point : « Pour commencer, pourriez-vous définir ce que veut dire 'données de la recherche' ? » Une bonne question : pouvons-nous les définir ? Que savons-nous de ces objets à la fois scientifiques, politiques et économiques que sont les données ? Souvent, nous répondons avec Borgman et al. (2012) que les données, c'est un concept difficile à définir à cause de leur grande variété, qu'elles fussent physiques ou numériques. Mais est-ce vraiment satisfaisant ?Selon Chignard (2012, p.10), « tout est donnée ». Dans l'introduction de son livre "Big data, little data, no data", C. Borgman (2015) constate qu'il est impossible de s'accorder sur une seule définition, en particulier en sciences humaines et sociales. Certains guides, manuels et présentations omettent tout simplement de définir leur objet, se limitant à énumérer quelques exemples pour délimiter le périmètre. Or, ce genre d'absence de consensus sur la définition de concepts-clés est caractéristique pour des domaines émergents (De Mauro et al. 2016) mais ne suffit pas ni pour la curation des données, ni pour la recherche, ni pour la mise en œuvre d'une politique raisonnée d'information scientifique et technique.
National audience ; Dans nos séminaires, colloques et enquêtes, nous sommes régulièrement interpellés sur ce point : « Pour commencer, pourriez-vous définir ce que veut dire 'données de la recherche' ? » Une bonne question : pouvons-nous les définir ? Que savons-nous de ces objets à la fois scientifiques, politiques et économiques que sont les données ? Souvent, nous répondons avec Borgman et al. (2012) que les données, c'est un concept difficile à définir à cause de leur grande variété, qu'elles fussent physiques ou numériques. Mais est-ce vraiment satisfaisant ?Selon Chignard (2012, p.10), « tout est donnée ». Dans l'introduction de son livre "Big data, little data, no data", C. Borgman (2015) constate qu'il est impossible de s'accorder sur une seule définition, en particulier en sciences humaines et sociales. Certains guides, manuels et présentations omettent tout simplement de définir leur objet, se limitant à énumérer quelques exemples pour délimiter le périmètre. Or, ce genre d'absence de consensus sur la définition de concepts-clés est caractéristique pour des domaines émergents (De Mauro et al. 2016) mais ne suffit pas ni pour la curation des données, ni pour la recherche, ni pour la mise en œuvre d'une politique raisonnée d'information scientifique et technique.
Résumé Pour relever en partie les défis lancés à la recherche canadienne sur les politiques publiques, un groupe de travail mixte réuni par le Conseil de recherches en sciences humaines ( crsh ) et Statistique Canada a proposé la création d'un réseau de Centres de données de recherche ( cdr ), qui est né officiellement en décembre 2000 avec l'ouverture du cdr de l'université McMaster, à Hamilton (Ontario). Les cdr se répartissant dans tout le pays, les chercheurs n'ont plus besoin d'aller à Ottawa pour consulter les fichiers de Statistique Canada. L'administration des cdr se conforme néanmoins à toutes les règles de confidentialité établies par la loi canadienne sur la statistique. Les cdr répondent, sur un même site, à une double nécessité : ils facilitent l'accès à des microdonnées détaillées indispensables pour mener certaines recherches essentielles en sciences sociales, tout en garantissant la sécurité et la confidentialité des informations fournies par les Canadiens.
Les données de la recherche deviennent l'un des nouveaux défis de la gestion scientifique. Produites dans le cadre des projets de recherche, ces données posent des questions inédites aux laboratoires, bibliothèques et services informatiques des universités : comment conserver ces données, comment les signaler et mettre à disposition d'autres chercheurs, comment faire le lien avec les publications, comment les intégrer dans une politique du libre accès à l'information scientifique ? Avant de se lancer dans un projet de données de la recherche, un établissement doit faire un état des lieux sur le terrain pour mieux connaître les producteurs de ces données, leurs pratiques et besoins dans la gestion des données et leurs outils, mais aussi la nature concrète de ces données. L'Université de Lille 3 a réalisé une étude sur les pratiques, besoins et attentes en matière de gestion des données de la recherche auprès de son personnel scientifique. L'étude est pilotée par le laboratoire GERiiCO et le SCD de Lille 3. Elle fait partie d'une démarche concertée en faveur de la gestion et du partage des données de la recherche mise en œuvre à partir de 2013, avec plusieurs analyses, séminaires et publications.L'enquête a été préparée avec l'Université Humboldt de Berlin. Le questionnaire contient 22 questions et a été mis en ligne en avril et mai 2015. Il a reçu 270 réponses (taux de réponse 15%). Toutes les disciplines sont représentées, ainsi que toutes les catégories des personnels scientifiques.Les personnes interrogées décrivent un large éventail de données sources. Les corpus (documents textuels) sont de loin la source la plus importante (64%), suivi par les enquêtes et entretiens (47%), observations (41%), expériences (36%) et archives (34%). Quant à la typologie des données produites par les chercheurs comme résultat de leur travail, les données textuelles occupent de loin le premier rang (75%), suivies des tableaux (49%), bases de données (37%), visualisations ou modèles multidimensionnels (32%) et données AV (photo, ...
Les données de la recherche deviennent l'un des nouveaux défis de la gestion scientifique. Produites dans le cadre des projets de recherche, ces données posent des questions inédites aux laboratoires, bibliothèques et services informatiques des universités : comment conserver ces données, comment les signaler et mettre à disposition d'autres chercheurs, comment faire le lien avec les publications, comment les intégrer dans une politique du libre accès à l'information scientifique ? Avant de se lancer dans un projet de données de la recherche, un établissement doit faire un état des lieux sur le terrain pour mieux connaître les producteurs de ces données, leurs pratiques et besoins dans la gestion des données et leurs outils, mais aussi la nature concrète de ces données. L'Université de Lille 3 a réalisé une étude sur les pratiques, besoins et attentes en matière de gestion des données de la recherche auprès de son personnel scientifique. L'étude est pilotée par le laboratoire GERiiCO et le SCD de Lille 3. Elle fait partie d'une démarche concertée en faveur de la gestion et du partage des données de la recherche mise en œuvre à partir de 2013, avec plusieurs analyses, séminaires et publications.L'enquête a été préparée avec l'Université Humboldt de Berlin. Le questionnaire contient 22 questions et a été mis en ligne en avril et mai 2015. Il a reçu 270 réponses (taux de réponse 15%). Toutes les disciplines sont représentées, ainsi que toutes les catégories des personnels scientifiques.Les personnes interrogées décrivent un large éventail de données sources. Les corpus (documents textuels) sont de loin la source la plus importante (64%), suivi par les enquêtes et entretiens (47%), observations (41%), expériences (36%) et archives (34%). Quant à la typologie des données produites par les chercheurs comme résultat de leur travail, les données textuelles occupent de loin le premier rang (75%), suivies des tableaux (49%), bases de données (37%), visualisations ou modèles multidimensionnels (32%) et données AV (photo, ...
Le PNER (1999-2001) mis en oeuvre par la Maison des Sciences de l'Homme et soutenu par le Ministère de l'Education Nationale, de la Recherche et de la Technologie, a analysé les évolutions des usages, proposé une réflexion sur les normes, travaillé la question juridique dans le domaine des TIC pour l'enseignement et la recherche. ; Les activités d'enseignement et de recherche sont à l'origine de la production de nombre de données publiques. Dans le cadre de ses missions, le ministère de l'Éducation nationale ou le ministère de la Recherche collectent et/ou traitent et/ou diffusent de nombreuses informations. Les informations ou données envisagées dans le cadre de la présente étude peuvent être qualifiées de publiques en ce sens qu'elles sont produites (collectées et/ou traitées et/ou diffusées) dans le cadre de l'activité du service public. Les données produites par les ministères s'insèrent plus largement dans la problématique de la diffusion des données publiques. Elles représentent aujourd'hui une richesse économique. Une richesse économique mais également sociale. C'est donc de cette confrontation entre ces valeurs, économiques, sociales, que naît tout l'intérêt de l'étude. Les conditions de la production déterminent véritablement la politique de la diffusion. C'est la raison pour laquelle nous envisagerons dans un premier chapitre une typologie des données de l'enseignement et de la recherche. Par la suite nous envisagerons la diffusion proprement dite.
Depuis les années 2010, de nouveaux formats de recherche tels que leshackathonset lesdata sprintsse sont développés dans le cadre d'expérimentations en sociologie numérique. Sur un temps très court, ces événements proposent d'analyser des données numériques ou numérisées et d'en présenter les premiers résultats. Or, on observe que ces « formats courts » relèguent souvent dans l'ombre la phase de préparation de ces données pour se concentrer sur l'exploration et la visualisation de jeux de données. En tant que coordonnatrices d'un hackathon recherche portant sur la consultation République numérique, nous avons observé les préparatifs à l'oeuvre dans l'organisation d'un tel événement. Des observations qui mettent en lumière un important travail de fabrication des données. De leur collecte à leur mise à disposition le jour de l'événement, ces étapes invisibilisées par ces « formats courts » révèlent un ensemble d'enjeux politiques autour de cesdataet de leur ouverture, qui se dessinent même dans les choix techniques opérés par les acteurs en présence.
Cet article présente quelques bases de données utiles pour les recherches sur la non-violence, ainsi que des pistes de travail pour les améliorer. Il ne vise pas à présenter un catalogue des projets existants, ni à établir un état de l'art en la matière, mais plutôt à présenter certaines lacunes et pistes d'amélioration illustrées par des initiatives innovantes, fructueuses ou prometteuses. L'argumentation s'appuie sur des exemples concrets, tirés de bases de données sur l'Intervention Civile de Paix, sur les Opérations de Maintien de la Paix, sur les actions non-violentes (notamment de protestation) et sur les sanctions internationales.
Cet article présente quelques bases de données utiles pour les recherches sur la non-violence, ainsi que des pistes de travail pour les améliorer. Il ne vise pas à présenter un catalogue des projets existants, ni à établir un état de l'art en la matière, mais plutôt à présenter certaines lacunes et pistes d'amélioration illustrées par des initiatives innovantes, fructueuses ou prometteuses. L'argumentation s'appuie sur des exemples concrets, tirés de bases de données sur l'Intervention Civile de Paix, sur les Opérations de Maintien de la Paix, sur les actions non-violentes (notamment de protestation) et sur les sanctions internationales.
The thesis investigates research data, as there is a growing demand for opening them. Research data are information that is collected by scientists in order to be used as evidence for theories. It is a complex, contextual notion. Since the 2000s, open access to scientific data has become a strategic axis of research policies. These policies has been relayed by third actors, who developed services dedicated to support researchers with data management and sharing.The thesis questions the relationship between the ideology of openness and the research practices. Which kinds of data management and sharing practices already exist in research communities? What drives them? Do scientists rely on research data services? Fifty-seven interviews were conducted with researchers from the University of Strasbourg in many disciplines. The survey identifies a myriad of different data management and sharing practices. It appears that data sharing is embedded in the researcher's strategy: his main goal is to protect his professional interests. Thus, research data are part of a credibility cycle, in which they get both use value (for new publications) and exchange value (as they are traded for other valuable resources). The survey also shows that researchers rarely use the services developed in a context of openness. Two explanations can be put forward. (1) The service offer comes too early to reach researchers' needs. Currently, data management and sharing are not within researchers' priorities. The priority is publishing, which is defined as source of reward and recognition of the scientific activities. (2) Data management services are offered by actors outside the research communities. But scientists seem to be more influenced by internal networks, close to their research topics (like journals, infrastructures…). These results prompt us to reconsider the mediation between scientific communities and open research data policies. ; Cette thèse s'intéresse aux données de la recherche, dans un contexte d'incitation croissante à leur ouverture. Les données de la recherche sont des informations collectées par les scientifiques dans la perspective d'être utilisées comme preuves d'une théorie scientifique. Il s'agit d'une notion complexe à définir, car contextuelle. Depuis les années 2000, le libre accès aux données occupe une place de plus en plus stratégique dans les politiques de recherche. Ces enjeux ont été relayés par des professions intermédiaires, qui ont développé des services dédiés, destinés à accompagner les chercheurs dans l'application des recommandations de gestion et d'ouverture. La thèse interroge le lien entre idéologie de l'ouverture et pratiques de recherche. Quelles formes de gestion et de partage des données existent dans les communautés de recherche et par quoi sont-elles motivées ? Quelle place les chercheurs accordent-ils à l'offre de services issue des politiques de gestion et d'ouverture des données ? Pour tenter d'y répondre, 57 entretiens ont été réalisés avec des chercheurs de l'Université de Strasbourg dans différentes disciplines. L'enquête révèle une très grande variété de pratiques de gestion et de partage de données. Un des points mis en évidence est que, dans la logique scientifique, le partage des données répond un besoin. Il fait partie intégrante de la stratégie du chercheur, dont l'objectif est avant tout de préserver ses intérêts professionnels. Les données s'inscrivent donc dans un cycle de crédibilité, qui leur confère à la fois une valeur d'usage (pour la production de nouvelles publications) et une valeur d'échange (en tant que monnaie d'échange dans le cadre de collaborations avec des partenaires). L'enquête montre également que les services développés dans un contexte d'ouverture des données correspondent pour une faible partie à ceux qu'utilisent les chercheurs. L'une des hypothèses émises est que l'offre de services arrive trop tôt pour rencontrer les besoins des chercheurs. L'évaluation et la reconnaissance des activités scientifiques étant principalement fondées sur la publication d'articles et d'ouvrages, la gestion et l'ouverture des données ne sont pas considérées comme prioritaires par les chercheurs. La seconde hypothèse avancée est que les services d'ouverture des données sont proposés par des acteurs relativement éloignés des communautés de recherche. Les chercheurs sont davantage influencés par des réseaux spécifiques à leurs champs de recherche (revues, infrastructures…). Ces résultats invitent finalement à reconsidérer la question de la médiation dans l'ouverture des données scientifiques.
The thesis investigates research data, as there is a growing demand for opening them. Research data are information that is collected by scientists in order to be used as evidence for theories. It is a complex, contextual notion. Since the 2000s, open access to scientific data has become a strategic axis of research policies. These policies has been relayed by third actors, who developed services dedicated to support researchers with data management and sharing.The thesis questions the relationship between the ideology of openness and the research practices. Which kinds of data management and sharing practices already exist in research communities? What drives them? Do scientists rely on research data services? Fifty-seven interviews were conducted with researchers from the University of Strasbourg in many disciplines. The survey identifies a myriad of different data management and sharing practices. It appears that data sharing is embedded in the researcher's strategy: his main goal is to protect his professional interests. Thus, research data are part of a credibility cycle, in which they get both use value (for new publications) and exchange value (as they are traded for other valuable resources). The survey also shows that researchers rarely use the services developed in a context of openness. Two explanations can be put forward. (1) The service offer comes too early to reach researchers' needs. Currently, data management and sharing are not within researchers' priorities. The priority is publishing, which is defined as source of reward and recognition of the scientific activities. (2) Data management services are offered by actors outside the research communities. But scientists seem to be more influenced by internal networks, close to their research topics (like journals, infrastructures…). These results prompt us to reconsider the mediation between scientific communities and open research data policies. ; Cette thèse s'intéresse aux données de la recherche, dans un contexte d'incitation croissante à leur ouverture. Les données de la recherche sont des informations collectées par les scientifiques dans la perspective d'être utilisées comme preuves d'une théorie scientifique. Il s'agit d'une notion complexe à définir, car contextuelle. Depuis les années 2000, le libre accès aux données occupe une place de plus en plus stratégique dans les politiques de recherche. Ces enjeux ont été relayés par des professions intermédiaires, qui ont développé des services dédiés, destinés à accompagner les chercheurs dans l'application des recommandations de gestion et d'ouverture. La thèse interroge le lien entre idéologie de l'ouverture et pratiques de recherche. Quelles formes de gestion et de partage des données existent dans les communautés de recherche et par quoi sont-elles motivées ? Quelle place les chercheurs accordent-ils à l'offre de services issue des politiques de gestion et d'ouverture des données ? Pour tenter d'y répondre, 57 entretiens ont été réalisés avec des chercheurs de l'Université de Strasbourg dans différentes disciplines. L'enquête révèle une très grande variété de pratiques de gestion et de partage de données. Un des points mis en évidence est que, dans la logique scientifique, le partage des données répond un besoin. Il fait partie intégrante de la stratégie du chercheur, dont l'objectif est avant tout de préserver ses intérêts professionnels. Les données s'inscrivent donc dans un cycle de crédibilité, qui leur confère à la fois une valeur d'usage (pour la production de nouvelles publications) et une valeur d'échange (en tant que monnaie d'échange dans le cadre de collaborations avec des partenaires). L'enquête montre également que les services développés dans un contexte d'ouverture des données correspondent pour une faible partie à ceux qu'utilisent les chercheurs. L'une des hypothèses émises est que l'offre de services arrive trop tôt pour rencontrer les besoins des chercheurs. L'évaluation et la reconnaissance des activités scientifiques étant principalement fondées sur la publication d'articles et d'ouvrages, la gestion et l'ouverture des données ne sont pas considérées comme prioritaires par les chercheurs. La seconde hypothèse avancée est que les services d'ouverture des données sont proposés par des acteurs relativement éloignés des communautés de recherche. Les chercheurs sont davantage influencés par des réseaux spécifiques à leurs champs de recherche (revues, infrastructures…). Ces résultats invitent finalement à reconsidérer la question de la médiation dans l'ouverture des données scientifiques.
The thesis investigates research data, as there is a growing demand for opening them. Research data are information that is collected by scientists in order to be used as evidence for theories. It is a complex, contextual notion. Since the 2000s, open access to scientific data has become a strategic axis of research policies. These policies has been relayed by third actors, who developed services dedicated to support researchers with data management and sharing.The thesis questions the relationship between the ideology of openness and the research practices. Which kinds of data management and sharing practices already exist in research communities? What drives them? Do scientists rely on research data services? Fifty-seven interviews were conducted with researchers from the University of Strasbourg in many disciplines. The survey identifies a myriad of different data management and sharing practices. It appears that data sharing is embedded in the researcher's strategy: his main goal is to protect his professional interests. Thus, research data are part of a credibility cycle, in which they get both use value (for new publications) and exchange value (as they are traded for other valuable resources). The survey also shows that researchers rarely use the services developed in a context of openness. Two explanations can be put forward. (1) The service offer comes too early to reach researchers' needs. Currently, data management and sharing are not within researchers' priorities. The priority is publishing, which is defined as source of reward and recognition of the scientific activities. (2) Data management services are offered by actors outside the research communities. But scientists seem to be more influenced by internal networks, close to their research topics (like journals, infrastructures…). These results prompt us to reconsider the mediation between scientific communities and open research data policies. ; Cette thèse s'intéresse aux données de la recherche, dans un contexte d'incitation croissante à leur ouverture. Les données de la recherche sont des informations collectées par les scientifiques dans la perspective d'être utilisées comme preuves d'une théorie scientifique. Il s'agit d'une notion complexe à définir, car contextuelle. Depuis les années 2000, le libre accès aux données occupe une place de plus en plus stratégique dans les politiques de recherche. Ces enjeux ont été relayés par des professions intermédiaires, qui ont développé des services dédiés, destinés à accompagner les chercheurs dans l'application des recommandations de gestion et d'ouverture. La thèse interroge le lien entre idéologie de l'ouverture et pratiques de recherche. Quelles formes de gestion et de partage des données existent dans les communautés de recherche et par quoi sont-elles motivées ? Quelle place les chercheurs accordent-ils à l'offre de services issue des politiques de gestion et d'ouverture des données ? Pour tenter d'y répondre, 57 entretiens ont été réalisés avec des chercheurs de l'Université de Strasbourg dans différentes disciplines. L'enquête révèle une très grande variété de pratiques de gestion et de partage de données. Un des points mis en évidence est que, dans la logique scientifique, le partage des données répond un besoin. Il fait partie intégrante de la stratégie du chercheur, dont l'objectif est avant tout de préserver ses intérêts professionnels. Les données s'inscrivent donc dans un cycle de crédibilité, qui leur confère à la fois une valeur d'usage (pour la production de nouvelles publications) et une valeur d'échange (en tant que monnaie d'échange dans le cadre de collaborations avec des partenaires). L'enquête montre également que les services développés dans un contexte d'ouverture des données correspondent pour une faible partie à ceux qu'utilisent les chercheurs. L'une des hypothèses émises est que l'offre de services arrive trop tôt pour rencontrer les besoins des chercheurs. L'évaluation et la reconnaissance des activités scientifiques étant principalement fondées sur la publication d'articles et d'ouvrages, la gestion et l'ouverture des données ne sont pas considérées comme prioritaires par les chercheurs. La seconde hypothèse avancée est que les services d'ouverture des données sont proposés par des acteurs relativement éloignés des communautés de recherche. Les chercheurs sont davantage influencés par des réseaux spécifiques à leurs champs de recherche (revues, infrastructures…). Ces résultats invitent finalement à reconsidérer la question de la médiation dans l'ouverture des données scientifiques.