Big Data in den Sozialwissenschaften
The project assesses the use of Big Data in teaching in the social sciences.
37 Ergebnisse
Sortierung:
The project assesses the use of Big Data in teaching in the social sciences.
Internet services are often free of charge, but ask for customers' personal data in exchange for usage. We experimentally study whether the provision of information-based public goods is susceptible to restraint when contributions not only make contributors better off, but also enable a non-contributing "big player" to acquire substantial profits. We show that the presence of the big player crowds out the willingness to provide money, but no such effect is observed for information. Hence, collecting anonymized personal data instead of monetary fees can be more profitable to service providers and create greater benefits for customers.
GESIS
Bei dem aufbereiteten Längsschnitt-Datensatzes 2014 bis 2016 handelt es sich um "Big-Data", weshalb der Gesamtdatensatz nur in Form einer Datenbank (MySQL) verfügbar sein wird. In dieser Datenbank liegt die Information verschiedener Variablen eines Befragten untereinander. Die vorliegende Publikation umfasst eine SQL-Datenbank mit den Meta-Daten des Sample des Gesamtdatensatzes, das einen Ausschnitt der verfügbaren Variablen des Gesamtdatensatzes darstellt und die Struktur der aufbereiteten Daten darlegen soll, und eine Datendokumentation des Samples. Für diesen Zweck beinhaltet das Sample alle Variablen der Soziodemographie, dem Freizeitverhalten, der Zusatzinformation zu einem Befragten und dessen Haushalt sowie den interviewspezifischen Variablen und Gewichte. Lediglich bei den Variablen bezüglich der Mediennutzung des Befragten, handelt es sich um eine kleine Auswahl: Für die Onlinemediennutzung wurden die Variablen aller Gesamtangebote sowie der Einzelangebote der Genre Politik und Digital aufgenommen. Die Mediennutzung von Radio, Print und TV wurde im Sample nicht berücksichtigt, da deren Struktur anhand der veröffentlichten Längsschnittdaten der Media-Analyse MA Radio, MA Pressemedien und MA Intermedia nachvollzogen werden kann.
Die Datenbank mit den tatsächlichen Befragungsdaten wäre auf Grund der Größe des Datenmaterials bereits im kritischen Bereich der Dateigröße für den normalen Up- und Download. Die tatsächlichen Befragungsergebnisse, die zur Analyse nötig sind, werden dann 2021 in Form des Gesamtdatensatzes der Media-Analyse-Daten: IntermediaPlus (2014-2016) im DBK bei GESIS veröffentlicht werden.
Die Daten sowie deren Datenaufbereitung sind ein Vorschlag eines Best-Practice Cases für Big-Data Management bzw. den Umgang mit Big-Data in den Sozialwissenschaften und mit sozialwissenschaftlichen Daten. Unter Verwendung der GESIS Software CharmStats, die im Rahmen dieses Projektes um Big-Data Features erweitert wurde, erfolgt die Dokumentation und Herstellung der Transparenz der Harmonisierungsarbeit. Durch ein Python-Skript sowie ein html-Template wurde der Arbeitsprozess um und mit CharmStats zudem stärker automatisiert.
Der aufbereitete Längsschnitt des Gesamtdatensatzes der MA IntermediaPlus für 2014 bis 2016 wird 2021 in Kooperation mit GESIS herausgegeben werden und den FAIR-Prinzipien (Wilkinson et al. 2016) entsprechend verfügbar gemacht werden. Ziel ist es durch die Harmonisierung der einzelnen Querschnitte die Datenquelle der Media-Analyse, die im Rahmen des Dissertationsprojektes "Angebots- und Publikumsfragmentierung online" durch Inga Brentel und Céline Fabienne Kampes erfolgt, für Forschung zum sozialen und medialen Wandel in der Bundesrepublik Deutschland zugänglich zu machen.
Künftige Studiennummer des Gesamtdatensatzes der IndermediaPlus im DBK der GESIS: ZA5769 (Version 1-0-0) und der doi: https://dx.doi.org/10.4232/1.13530
****************English Version****************
The prepared Longitudinal IntermediaPlus dataset 2014 to 2016 is a "big data", which is why the entire dataset will only be available in the form of a database (MySQL). In this database, the information of different variables of a respondent is organized in one column, one below the other. The present publication includes a SQL-Database with the meta data of a sample of the full database, which represents a section of the available variables of the total data set and is intended to show the structure of the prepared data and the data-documentation (codebook) of the sample. For this purpose, the sample contains all variables of sociodemography, free-time activities, additional information on a respondent and his household as well as the interview-specific variables and weights. Only the variables concerning the respondent's media use are a small selection: For online media use, the variables of all overall offerings as well as the individual offerings of the genres politics and digital were included. The media use of radio, print and TV was not included in the sample because its structure can be traced using the published longitudinal data of the media analysis MA Radio, MA Pressemedien and MA Intermedia.
Due to the size of the datafile, the database with the actual survey data would already be in the critical range of the file size for the common upload and download. The actual survey results required for analysis will be published in 2021 in the form of the total dataset of the Longitudinal IntermediaPlus (2014-2016) dataset at the GESIS DBK.
The data as well as their data preparation are a proposal for a best practice case for big-data management and/or the handling of big data in the social sciences and with social science data. Using the GESIS software CharmStats, which was extended by big-data features within this project, the documentation and creation of transparency of the harmonization work is carried out. A Python script and an html template have been used to automate the workflow with and within CharmStats.
The full dataset of the Longitudinal IntermediaPlus for 2014 to 2016 will be published in 2021 in cooperation with GESIS and made available in accordance with the FAIR principles (Wilkinson et al. 2016). By harmonizing and pooling the cross-sectional datasets to one longitudinal dataset – which is being carried out by Inga Brentel and Céline Fabienne Kampes as part of the dissertation project "Audience and Market Fragmentation online" –, the aim is to make the data source of the media analysis, accessible for research on social and media change in the Federal Republic of Germany.
The future study number of full the Longitudinal IntermediaPlus (2014-2016) dataset at the GESIS DBK will be: ZA5769 (Version 1.0.0) and doi: https://dx.doi.org/10.4232/1.13530
GESIS
Meinungen zur Digitalisierung. Umgang mit resistenten Keimen in der Gesundheitspolitik.
1. Digitalisierung: eher Hoffnungen oder Befürchtungen hinsichtlich Digitalisierung; eher Risiken oder Chancen für die Wirtschaft und Gesellschaft; Beurteilung des Nutzens der Digitalisierung in verschiedenen Bereichen (Verkehr und Transport, Medizin, Schulen und Universitäten, Kampf gegen Kriminalität, private Kommunikation, Zugang zu Informationen aus Politik und Wirtschaft, Kommunikation mit Behörden sowie beim Kauf von Produkten und Dienstleistungen); Stärke der Veränderungen im Berufsleben durch Digitalisierung; Beurteilung der Veränderungen im Berufsleben; Auswirkungen auf die Anzahl an Arbeitsplätzen; gewünschter Einfluss der Politik zum Thema Digitalisierung; Beurteilung der Aufgaben der Politik im Rahmen der Digitalisierung (Neugründung von Internetfirmen, Förderung der digitalen Bildung an Schulen und für Senioren, Stärkung des Datenschutzes, Ausbau des schnellen Internets, einheitliche Regelung für die Nutzung von Musik- und Videodateien in ganz Europa sowie Schutz vor Internetkriminalität); Bekanntheit des Begriffs Big Data (spontan und nach Erläuterung); eher Vorteile oder Nachteile in Verbindung mit Big Data; Beurteilung der Vorteile bzw. der Nachteile von Big Data in ausgewählten Bereichen (Aufklärung von Verbrechen, Vorbeugung und Verhinderung von Verbrechen, Verkehr und Transport, Sicherheit persönlicher Daten, Kauf von Produkten im Internet, Nutzung sozialer Netzwerke sowie Nutzung von Suchmaschinen); Interesse an digitaler Technik.
2. Resistente Keime: Bekanntheit resistenter Keime; Definition des Begriffs resistente Keime (offene Nennung); Meinung zu resistenten Keimen (Ausbreitung in Deutschland gut im Griff, Ausbreitung als zunehmende Bedrohung, dringender Handlungsbedarf gegen die Verbreitung, Angst vor Krankenhauseinweisung durch die Keimsituation); jemanden im Krankenhaus besucht; Umgang mit resistenten Keimen: Händedesinfektion vor Betreten der Station oder des Krankenzimmers, Hinweise des Krankenhauspersonals zur Händedesinfektion; selbst Patient im Krankenhaus in der Vergangenheit; erfolgter Hinweis durch Krankenhauspersonal auf Händedesinfektion von eigenen Besuchern; Beurteilung der verschärften Meldepflicht für Krankenhäuser als angemessene Maßnahme oder eher übertrieben; Meinung zur Untersuchung von Patienten auf resistente Keime bei der Aufnahme in ein deutsches Krankenhaus.
Demographie: Alter; Geschlecht; Schulbildung; Berufstätigkeit; berufliche Stellung; Familienstand; Konfession; Haushaltsnettoeinkommen gruppiert); Parteipräferenz (Sonntagsfrage Bundestagswahl).
Zusätzlich verkodet wurde: Befragten-ID; Ortsgröße; Bundesland; Gewichtungsfaktor.
GESIS
Das Sozio-oekonomische Panel (SOEP) ist eine jährliche repräsentative Wiederholungsbefragung, die bereits seit 1984 läuft. Im Auftrag des DIW Berlin wurden im Jahr 2018 über 33.000 Personen aus fast 20.000 Haushalten von Kantar Public befragt. Die Daten geben Auskunft zu Fragen über Einkommen, Erwerbstätigkeit, Bildung oder Gesundheit. Weil jedes Jahr die gleichen Personen befragt werden, können langfristige soziale und gesellschaftliche Trends besonders gut verfolgt werden. Bereits im Juni 1990, also noch vor der Währungs-, Wirtschafts- und Sozialunion, wurde die Studie auf das Gebiet der ehemaligen DDR ausgeweitet. Zur adäquaten Erfassung des gesellschaftlichen Wandels in den Jahren 1994/95, 2013 und 2015 wurden Migrations-Stichproben sowie 2016 und 2017 zwei bzw. eine Flüchtlings-Stichprobe implementiert. Weitere zusätzliche Stichproben wurden in den Jahren 1998, 2000, 2002, 2006, 2009, 2010, 2011, 2012, 2017 und 2018 in die laufende Erhebung integriert. Das Erhebungsprogramm wird ständig an neue Entwicklungen in der Gesellschaft angepasst. Die internationale Version enthält 95% des Stichprobenumfangs (siehe 10.5684/soep.v35i).
Das Sozio-oekonomische Panel (SOEP) ist eine jährliche repräsentative Wiederholungsbefragung, die bereits seit 1984 läuft. Im Auftrag des DIW Berlin wurden im jahr 2017 über 33.000 Personen aus rund 15.000 Haushalten von Kantar Public befragt. Die Daten geben Auskunft zu Fragen über Einkommen, Erwerbstätigkeit, Bildung oder Gesundheit. Weil jedes Jahr die gleichen Personen befragt werden, können langfristige soziale und gesellschaftliche Trends besonders gut verfolgt werden. Bereits im Juni 1990, also noch vor der Währungs-, Wirtschafts- und Sozialunion, wurde die Studie auf das Gebiet der ehemaligen DDR ausgeweitet. Zur adäquaten Erfassung des gesellschaftlichen Wandels in den Jahren 1994/95, 2013 und 2015 wurden Migrations-Stichproben sowie 2016 und 2017 zwei bzw. eine Flüchtlings-Stichprobe implementiert. Weitere zusätzliche Stichproben wurden in den Jahren 1998, 2000, 2002, 2006, 2009, 2010, 2011, 2012 und 2017 in die laufende Erhebung integriert. Das Erhebungsprogramm wird ständig an neue Entwicklungen in der Gesellschaft angepasst. Die internationale Version enthält 95% des Stichprobenumfangs (siehe 10.5684/soep.v34i).
Das Sozio-oekonomische Panel (SOEP) ist eine repräsentative Wiederholungsbefragung, die bereits seit 1984 läuft. Im Auftrag des DIW Berlin werden jedes Jahr in Deutschland über 25.000 Personen aus rund 15.000 Haushalten von TNS Infratest Sozialforschung befragt. Die Daten geben Auskunft zu Fragen über Einkommen, Erwerbstätigkeit, Bildung oder Gesundheit. Weil jedes Jahr die gleichen Personen befragt werden, können langfristige soziale und gesellschaftliche Trends besonders gut verfolgt werden. Bereits im Juni 1990, also noch vor der Währungs-, Wirtschafts- und Sozialunion, wurde die Studie auf das Gebiet der ehemaligen DDR ausgeweitet. Zur adäquaten Erfassung des gesellschaftlichen Wandels in den Jahren 1994/95, 2013 und 2015 wurden Migrations-Stichproben sowie 2016 zwei Flüchtlings-Stichproben implementiert. Weitere zusätzliche Stichproben wurden in den Jahren 1998, 2000, 2002, 2006, 2009, 2010, 2011 und 2012 in die laufende Erhebung integriert. Das Erhebungsprogramm wird ständig an neue Entwicklungen in der Gesellschaft angepasst. Die internationale Version enthält 95% des Stichprobenumfangs (siehe 10.5684/soep.v33i.1).
Das Sozio-oekonomische Panel (SOEP) ist eine repräsentative Wiederholungsbefragung, die bereits seit 1984 läuft. Im Auftrag des DIW Berlin werden jedes Jahr in Deutschland über 25.000 Personen aus rund 15.000 Haushalten von TNS Infratest Sozialforschung befragt. Die Daten geben Auskunft zu Fragen über Einkommen, Erwerbstätigkeit, Bildung oder Gesundheit. Weil jedes Jahr die gleichen Personen befragt werden, können langfristige soziale und gesellschaftliche Trends besonders gut verfolgt werden. Bereits im Juni 1990, also noch vor der Währungs-, Wirtschafts- und Sozialunion, wurde die Studie auf das Gebiet der ehemaligen DDR ausgeweitet. Zur adäquaten Erfassung des gesellschaftlichen Wandels in den Jahren 1994/95, 2013 und 2015 wurden Migrations-Stichproben sowie 2016 zwei Flüchtlings-Stichproben implementiert. Weitere zusätzliche Stichproben wurden in den Jahren 1998, 2000, 2002, 2006, 2009, 2010, 2011 und 2012 in die laufende Erhebung integriert. Das Erhebungsprogramm wird ständig an neue Entwicklungen in der Gesellschaft angepasst. Die internationale Version enthält 95% des Stichprobenumfangs (siehe 10.5684/soep.v33i).
Das Sozio-oekonomische Panel (SOEP) ist eine repräsentative Wiederholungsbefragung, die bereits seit 1984 läuft. Im Auftrag des DIW Berlin werden jedes Jahr in Deutschland über 25.000 Personen aus rund 15.000 Haushalten von TNS Infratest Sozialforschung befragt. Die Daten geben Auskunft zu Fragen über Einkommen, Erwerbstätigkeit, Bildung oder Gesundheit. Weil jedes Jahr die gleichen Personen befragt werden, können langfristige soziale und gesellschaftliche Trends besonders gut verfolgt werden. Bereits im Juni 1990, also noch vor der Währungs-, Wirtschafts- und Sozialunion, wurde die Studie auf das Gebiet der ehemaligen DDR ausgeweitet. Zur adäquaten Erfassung des gesellschaftlichen Wandels in den Jahren 1994/95 sowie 2013 und 2015 wurden Migrations-Stichproben implementiert. Weitere zusätzliche Stichproben wurden in den Jahren 1998, 2000, 2002, 2006, 2009, 2010, 2011 und 2012 in die laufende Erhebung integriert. Seit Version 31 (10.5684/soep.v31) sind die Stichproben der Studie "Familien in Deutschland" (FiD) vollständig integriert, inklusive der seit 2010 bereits erhobenen Daten im Rahmen von FiD. Das Erhebungsprogramm wird ständig an neue Entwicklungen in der Gesellschaft angepasst. Die internationale Version enthält 95% des Stichprobenumfangs (siehe 10.5684/soep.v32i).
Das Sozio-oekonomische Panel (SOEP) ist eine repräsentative Wiederholungsbefragung, die bereits seit 1984 läuft. Im Auftrag des DIW Berlin werden jedes Jahr in Deutschland über 25.000 Personen aus rund 15.000 Haushalten von TNS Infratest Sozialforschung befragt. Die Daten geben Auskunft zu Fragen über Einkommen, Erwerbstätigkeit, Bildung oder Gesundheit. Weil jedes Jahr die gleichen Personen befragt werden, können langfristige soziale und gesellschaftliche Trends besonders gut verfolgt werden. Bereits im Juni 1990, also noch vor der Währungs-, Wirtschafts- und Sozialunion, wurde die Studie auf das Gebiet der ehemaligen DDR ausgeweitet. Zur adäquaten Erfassung des gesellschaftlichen Wandels in den Jahren 1994/95 sowie 2013 und 2015 wurden Migrations-Stichproben implementiert. Weitere zusätzliche Stichproben wurden in den Jahren 1998, 2000, 2002, 2006, 2009, 2010, 2011 und 2012 in die laufende Erhebung integriert. Seit Version 31 (10.5684/soep.v31) sind die Stichproben der Studie "Familien in Deutschland" (FiD) vollständig integriert, inklusive der seit 2010 bereits erhobenen Daten im Rahmen von FiD. Das Erhebungsprogramm wird ständig an neue Entwicklungen in der Gesellschaft angepasst. Die internationale Version enthält 95% des Stichprobenumfangs (siehe 10.5684/soep.v32i).
Das Sozio-oekonomische Panel (SOEP) ist eine repräsentative Wiederholungsbefragung, die bereits seit 1984 läuft. Im Auftrag des DIW Berlin werden jedes Jahr in Deutschland über 20.000 Personen aus rund 11.000 Haushalten von TNS Infratest Sozialforschung befragt. Die Daten geben Auskunft zu Fragen über Einkommen, Erwerbstätigkeit, Bildung oder Gesundheit. Weil jedes Jahr die gleichen Personen befragt werden, können langfristige soziale und gesellschaftliche Trends besonders gut verfolgt werden. Bereits im Juni 1990, also noch vor der Währungs-, Wirtschafts- und Sozialunion, wurde die Studie auf das Gebiet der ehemaligen DDR ausgeweitet. Zur adäquaten Erfassung des gesellschaftlichen Wandels in den Jahren 1994/95 wurde die »Zuwanderer-Stichprobe« eingeführt. Weitere zusätzliche Stichproben wurden in den Jahren 1998, 2000, 2002, 2006, 2009, 2011, 2012 und zuletzt 2013 in die laufende Erhebung integriert. Mit der Datenerhebung 2014 wurde die Stichprobe der Studie "Familien in Deutschland" (FiD) vollständig integriert, inklusive der seit 2010 bereits erhobenen Daten im Rahmen von FiD. Das Erhebungsprogramm wird ständig an neue Entwicklungen in der Gesellschaft angepasst. Die internationale Version enthält 95% des Stichprobenumfangs (10.5684/soep.v31.1).
Das Sozio-oekonomische Panel (SOEP) ist eine repräsentative Wiederholungsbefragung, die bereits seit 1984 läuft. Im Auftrag des DIW Berlin werden jedes Jahr in Deutschland über 20.000 Personen aus rund 11.000 Haushalten von TNS Infratest Sozialforschung befragt. Die Daten geben Auskunft zu Fragen über Einkommen, Erwerbstätigkeit, Bildung oder Gesundheit. Weil jedes Jahr die gleichen Personen befragt werden, können langfristige soziale und gesellschaftliche Trends besonders gut verfolgt werden. Bereits im Juni 1990, also noch vor der Währungs-, Wirtschafts- und Sozialunion, wurde die Studie auf das Gebiet der ehemaligen DDR ausgeweitet. Zur adäquaten Erfassung des gesellschaftlichen Wandels in den Jahren 1994/95 wurde die »Zuwanderer-Stichprobe« eingeführt. Weitere zusätzliche Stichproben wurden in den Jahren 1998, 2000, 2002, 2006, 2009, 2011, 2012 und zuletzt 2013 in die laufende Erhebung integriert. Mit der Datenerhebung 2014 wurde die Stichprobe der Studie "Familien in Deutschland" (FiD) vollständig integriert, inklusive der seit 2010 bereits erhobenen Daten im Rahmen von FiD. Das Erhebungsprogramm wird ständig an neue Entwicklungen in der Gesellschaft angepasst. Die internationale Version enthält 95% des Stichprobenumfangs.
Das Sozio-oekonomische Panel (SOEP) ist eine repräsentative Wiederholungsbefragung, die bereits seit 1984 läuft. Im Auftrag des DIW Berlin werden jedes Jahr in Deutschland über 20.000 Personen aus rund 11.000 Haushalten von TNS Infratest Sozialforschung befragt. Die Daten geben Auskunft zu Fragen über Einkommen, Erwerbstätigkeit, Bildung oder Gesundheit. Weil jedes Jahr die gleichen Personen befragt werden, können langfristige soziale und gesellschaftliche Trends besonders gut verfolgt werden. Bereits im Juni 1990, also noch vor der Währungs-, Wirtschafts- und Sozialunion, wurde die Studie auf das Gebiet der ehemaligen DDR ausgeweitet. Zur adäquaten Erfassung des gesellschaftlichen Wandels in den Jahren 1994/95 wurde die »Zuwanderer-Stichprobe« eingeführt. Weitere zusätzliche Stichproben wurden in den Jahren 1998, 2000, 2002, 2006, 2009, 2011, 2012 und zuletzt 2013 in die laufende Erhebung integriert. Das Erhebungsprogramm wird ständig an neue Entwicklungen in der Gesellschaft angepasst. Die internationale Version enthält 95% des Stichprobenumfangs.
Das Sozio-oekonomische Panel (SOEP) ist eine repräsentative Wiederholungsbefragung, die bereits seit 1984 läuft. Im Auftrag des DIW Berlin werden jedes Jahr in Deutschland über 20.000 Personen aus rund 11.000 Haushalten von TNS Infratest Sozialforschung befragt. Die Daten geben Auskunft zu Fragen über Einkommen, Erwerbstätigkeit, Bildung oder Gesundheit. Weil jedes Jahr die gleichen Personen befragt werden, können langfristige soziale und gesellschaftliche Trends besonders gut verfolgt werden. Bereits im Juni 1990, also noch vor der Währungs-, Wirtschafts- und Sozialunion, wurde die Studie auf das Gebiet der ehemaligen DDR ausgeweitet. Zur adäquaten Erfassung des gesellschaftlichen Wandels in den Jahren 1994/95 wurde die »Zuwanderer-Stichprobe« eingeführt. Weitere zusätzliche Stichproben wurden in den Jahren 1998, 2000, 2002, 2006, 2009, 2011, 2012 und zuletzt 2013 in die laufende Erhebung integriert. Das Erhebungsprogramm wird ständig an neue Entwicklungen in der Gesellschaft angepasst. Die internationale Version enthält 95% des Stichprobenumfangs.
Update des Originaldatensatzes http://dx.doi.org/10.5684/soep.v28. In einigen Fällen wurden die Meldungen von einer zurückliegenden Scheidung nicht bei der Datengenerierung berücksichtigt. Darüber hinaus ist versehentlich zum Teil das angegebene Todesjahr eines ehemaligen Partners mit dem jeweils aktuellen Interviewjahr überschrieben worden. Dies beeinflusst nicht nur die Start- und Enddaten einiger Spells, sondern auch fehlende Informationen und Konsistenzprüfungen in den Datensätzen BIOCOUPLM, BIOCOUPLY, BIOMARSM, BIOMARSY. Das fehlerhafte Überschreiben von Daten bei der Generierung von BIOCOUPL$ beeinflusst die Konsistenzprüfungen im Datensatz $FAMSTD. Die Mehrzahl der zuvor fehlenden Informationen ist jetzt vorhanden. Allerdings ist stattdessen die Zahl der unplausiblen Antworten angewachsen.