The dataset is part of a project to investigate justifications of repression in North African autocracies. It was set up to answer the question to what extent and how repressive incidents were communicated and justified in Morocco and Tunisia from 2000 to 2010, before the beginning of the Arab uprising protests.
The event dataset is the first to disaggregate data on repressive incidents in two countries over the course of a decade, providing information about the forms of repression, its targets, the actors involved in repression and its justification, and the communication of state violence. All variables are available in textual form, although the forms of repression and repressive actors are all also listed in binary form to facilitate software-supported analysis. The dataset contains in total 439 repressive incidents: namely, 280 for Tunisia and 159 for Morocco. The data was collected from publicly available reports by Amnesty International, Human Rights Watch, the U.S. State Department, and organizations and news outlets that covered repressive events and their respective justifications. We complemented these English-language sources with further information from French and Arabic sources and provide all data in English. This systematic collection enables us to assess the extent of justification, as opposed to denial or cover-up, and also to dig into the substantial arguments that were brought forward here. It includes not only cases of protest repression, but also more mundane everyday restrictions on dissidents, and other human rights violations. This gives insight into the political communication of autocracies and their strategies to mitigate the risk of backlash that usually comes with the use of state violence.
Wohnungssituation von Brautpaaren vor und nach der Hochzeit.
Themen:
1.) Wohnverhältnisse vor der Trauung: Wohndauer, Wohnungsausstattung und Miete; Wohnungsgröße; Hausgröße sowie Anzahl der Personen in der Wohnung.
2.) Wohnverhältnisse nach der Heirat: Miete; Zimmerzahl; Wohnungsgröße; Hausgröße; Alter, Lage und Ausstattung der Wohnung; Dauer der Wohnungssuche; Einfluß der Konjunktur und der Wohnungssuche auf die Festlegung des Heiratstermins.
Bei noch nicht zur Verfügung stehender gemeinsamer Wohnung: Wohnungssuche und Wohnungswunsch.
Lebens- und Wohnsituation der Bewohner unterschiedlicher Stadtgebiete und ihr Interesse am lokalen Geschehen.
Themen: Wohnungsgröße und Wohnungsausstattung; Wohnzufriedenheit; Bauschäden am Haus; Gartenbesitz; Heizungsart und Heizkosten; gewerbliche Nutzung der Wohnung; Wohnungswechsel und Wohndauer; Motive bei der Wohnungssuche; Nachbarschaft und Freizeit; sportliche Aktivitäten und Besuch kultureller Veranstaltungen; Besuch von Stammlokalen; Freizeitverhalten an Wochenenden; Zufriedenheit mit dem Wohngebiet; Beurteilung der Störungen durch Betriebe im Wohngebiet; Störungen durch Verkehrslärm; Kindergartenbesuch; Nutzung von Spielplätzen und Grünanlagen; Informiertheit und Informationsquellen über städtebauliche Vorhaben; Interesse am Stadtgeschehen; Einstellung zur Bürgerbeteiligung bei der Stadtplanung und Prioritäten in der städtischen Bauplanung; Stolz auf die Stadt; politisches Interesse; kommunalpolitische Präferenzen; Verkehrsmittelbesitz und Verkehrsmittelnutzung; Parkmöglichkeiten; Entfernungen zum Arbeitsplatz und zur Schule; ausführliche Beschreibung der Mitglieder des Haushalts; Selbsteinschätzung der Schichtzugehörigkeit.
Die Daten des Fragebogens sind durch folgende Regionaldaten bzw. Aggregatdaten der Stadtteile ergänzt worden: Anteil der öffentlich geförderten Wohnungen; Miete pro Quadratmeter; Wohnfläche pro Person; Anteil der Rentner und Sozialhilfeempfänger; Ausbildungsniveau; Einpersonenhaushalte; Erwerbstätige; Erwerbsquote; Ausländeranteil; Haushalte mit Kindern; Anteil der Personen über 65 Jahre; Zu- oder Abnahme der Wohnbevölkerung von 1961 bis 1970; Anteil der Eigentumswohnungen; Fruchtbarkeitsrate; Religionszugehörigkeit.
Demographie: Alter (klassiert); Geschlecht; Familienstand; Schulbildung; Beruf; Berufstätigkeit; Einkommen; Haushaltsgröße; Haushaltszusammensetzung; Haushaltungsvorstand; Selbsteinschätzung der Schichtzugehörigkeit.
Wohnzufriedenheit, Wohnsituation, Freizeitaktivitäten und Beschreibung des sozialen Umfelds in ausgesuchten Neubaugebieten.
Themen: Entfernungen im sozialen Umfeld; Qualität, Verwendung und Benutzung von Funktionen des sozialen Umfelds; Bewertung der Siedlung; Nachbarschaft; Zufriedenheit mit der Wohnung und Wohnsituation; Ausstattung der Wohnung und Heizsystem Aufwendungen für Wohnung und Nebenkosten; Teilnahme an kulturellen Veranstaltungen; Teilnahme an Volkshochschul- bzw. Fortbildungskursen; benutzte Verkehrsmittel; Tierhaltung; Freizeitaktivitäten und -kontakte; Wochenendausflüge; empfundene Störungen durch Lärm; Einkaufsgewohnheiten; Religiosität; politisches Interesse.
Demographie: Alter; Geschlecht; Familienstand; Familienzusammensetzung; Kinderzahl; Alter der Kinder (klassiert); Konfession; Schulbildung; Berufsausbildung; Beruf; Berufstätigkeit; Haushaltsgröße.
Using 19 waves from the German Socio-Economic Panel (1997–2015), we first focus on how pre- and post-governmental equivalence incomes of sin- gle and married mothers with children have changed between 1997 and 2015 along with major policy reforms. Second, we apply detailed effect decompo- sitions to trace changes in equivalence income of single and married mothers to changes in mothers's resources and changes in how these resources affect maternal income. Our analysis shows rising income inequalities between sin- gle and married mothers. The growing inequalities mainly are the result of growing differences in education and employment. Married mothers increa- singly hold higher educational degrees and are increasingly attached to the labor market, while single mothers had to fall back on public transfers to maintain their income.
Mandated by the Federal Office for Professional Education and Technology (BBT), a representative study was launched at the beginning of 2007 on the use of computers and internet in Swiss schools by the SFIB (Swiss Agency for Information Technologies in Education), the IMS (Institute for Media and School of PHZ Schwyz) and the FSO (Federal Statistical Office). For this purpose, 712 persons in charge of ICT in their school and 1322 teachers from German-speaking Switzerland and French-speaking Switzerland were interviewd. The study covers all levels of education, from primary to secondary II (high school, FMS / DMS, vocational training). It provides information on the developments since the last survey in 2001, recording the development since the launch of the "Public Private Partnership – School and Internet(PPP-SiN)" initiative. More than 200 million Swiss francs have been invested in technical infrastructure and teacher training. The inventory also serves to evaluate this initiative.
Mandated by the Federal Office for Professional Education and Technology (BBT), a representative study was launched at the beginning of 2007 on the use of computers and internet in Swiss schools by the SFIB (Swiss Agency for Information Technologies in Education), the IMS (Institute for Media and School of PHZ Schwyz) and the FSO (Federal Statistical Office). For this purpose, 712 persons in charge of ICT in their school and 1322 teachers from German-speaking Switzerland and French-speaking Switzerland were interviewd. The study covers all levels of education, from primary to secondary II (high school, FMS / DMS, vocational training). It provides information on the developments since the last survey in 2001, recording the development since the launch of the "Public Private Partnership – School and Internet(PPP-SiN)" initiative. More than 200 million Swiss francs have been invested in technical infrastructure and teacher training. The inventory also serves to evaluate this initiative.
The Swiss PILOT ISSP 2017 SOCIAL NETWORKS survey is the pretest survey of the 2017 version of the International Social Survey Program (ISSP; http://www.issp.org) about 'Social Networks' realized in Switzerland. The survey focuses on social resources and support, contact frequency with family and friends and diversity and hierarchy of personal network. Issues such as access and mobilization of social relations, perception and justification of social inequalities, perceived integration, norms of obligation and reciprocity and social strain are also covered. This pilot has been realized in Switzerland, Germany, China, Venezuela, Taiwan, Turkey and the Unites States of America with the scope to pretest and finalize the questionnaire for the main survey in 2017. In Switzerland, the pilot has surveyed just over a thousand residents, between the end of 2015 and the beginning of 2016 through a paper questionnaire. The main ISSP survey is conducted every year in more than 40 countries over the world. Every edition of the ISSP covers a specific theme, which is repeated at a regular interval. In Switzerland, the ISSP modules are included in the MOSAiCH survey (Measurement and Observation of Social Attitudes in Switzerland; http://forscenter.ch/en/our-surveys/international-surveys/mosaich-issp-2/). The "ISSP 2017 Social Networks III" module will be integrated in the MOSAiCH 2017 survey along with the ISSP 2016 module 'Role of Government' to be fielded in spring/summer 2017 with a representative sample of the resident Swiss population. Most questions of the present pilot survey will be fielded identically or slightly amended in the main survey in 2017 in all ISSP countries.
Data from standardized online survey of more than 700 German farmers (and non-farmers) on their preferences for government regulation to protect local farmers from competition through non-local or non-farm competitors when purchasing land in agricultural land markets. Find more detailed description on the survey and and dataset in metadata document Jauernig_LandmarketRegulation_DSDescriptionEN.pdf and the survey instrument Jauernig_LandmarketRegulation_SurveyInstrument.pdf. with English translation in Jauernig_LandmarketRegulation_SurveyInstrumentEN.pdf
Data generation
Recruitment for participation in online survey with standardized questionnaire by e-mail to farmers via several address lists (agricultural research institutions, associations, churches), mainly in North-Rhine Westphalia and Brandenburg. After evaluation of a pretest and feedback from farmers and other experts, the final questionnaire was created.
Survey period: February to May 2019
Survey instrument structure and content
The survey instrument is composed of four parts:
1) Attitude survey based on scenarios (vignette study): Scenario descriptions depict competitive situations between local farmers and out-of-town or non-agricultural competitors for the purchase of agricultural land: Participants are asked about their preferences for variants of government regulation with varying degrees of protection of local farmers over competitors. They had to choose from a scale of 13 response options ranging from unregulated transaction to various surcharge requirements to strict prohibition of sales to the respective competitors. Questionnaire variants with differences in the description of the competitor and the role of the respondent (observer or seller of the land) were randomly assigned. (2 items) 2) General (i.e., not scenario-specific) closed-ended items about attitudes toward current as well as desired regulation of agricultural land transactions. (10 items) 3) Closed-ended items about the role of agriculture in society and the economy, the appropriateness and justification, if any, for preferential treatment of the agricultural sector. (7 items) 4) Structural data on the agricultural enterprise and the respondent's person.
Data set description
The total dataset contains 717 observations (674 farmers, 43 non-farmers) and 73 variables. Variable B702 (county) was removed for anonymization purposes. For more information on data density and data quality, see the document "Jauernig_LandmarketRegulation_DSDescriptionEN.pdf" and the codebook with variable-level distribution information (Jauernig_LandmarketRegulation_CodebookEN.pdf).
Data are available in four formats: Stata (w bilingual labels), three versions of CSV with factor variable values represented as a) numerical codes, b) German labels, and c) Enlish labels.
GERMAN VERSION
Überblick
Daten aus standardisierter Online-Befragung unter über 700 deutschen Landwirten (und Nichtlandwirten) zu ihren Präferenzen für staatliche Regulierung zum Schutz ortsansässiger Landwirte gegenüber Konkurrenz durch ortsfremde bzw. landwirtschaftsfremde Konkurrenten beim Landkauf auf landwirtschaftlichen Bodenmärkten. Detailliertere Beschreibung von Datengewinnung und Datensatz im Metadatendokument "Jauernig_LandmarketRegulation_DSDescriptionDE.pdf" sowie im Befragungsinstrument "Jauernig_LandmarketRegulation_SurveyInstrument.pdf".
Datengewinnung
Rekrutierung zur Teilnahme an Online-Befragung mit standardisiertem Fragebogen durch E-Mail-Anschreiben von Landwirten über mehrere Adressenlisten (Agrarforschungseinrichtungen, Verbände, Kirchen), schwerpunktmäßig in NRW und Brandenburg. Nach Auswertung eines Pretests/Probebefragung und Rückmeldungen durch Landwirte und andere Fachleute wurde der endgültige Fragebogen erstellt.
Befragungzeitraum: Februar bis Mai 2019
Fragebogenstruktur und -inhalt
Fragebogen aus vier Teilen:
1) Einstellungsabfrage anhand von Szenarien: In Szenarienbeschreibungen werden Konkurrenzsituationen zwischen örtlichen Landwirten und auswärtigen bzw. außerlandwirtschaftlichen Konkurrenten um den Kauf landwirtschaftlicher Flächen dargestellt: TeilnehmerInnen werden nach ihren Präferenzen für Varianten staatlicher Regulierung mit unterschiedlich starker Protektion ortsansässiger Landwirte gegenüber den Konkurrenten befragt. Sie hatten aus einer Skala von 13 Antwortoptionen von unregulierter Transaktion über verschiedene Aufpreisforderungen bis hin zum strikten Verbot des Verkaufs an Konkurrenten auszuwählen. Fragebogenvarianten mit Unterschieden bzgl. der Beschreibung des Konkurrenten sowie der Rolle des Respondenten (Beobachter oder Verkäufer des Landes) wurden randomisiert zugewiesen. (2 Items)
2) Allgemeine (d.h. nicht szenarienspezifische) geschlossene Fragen über Haltungen zur derzeitigen sowie der gewünschten Regulierung des landwirtschaftlichen Grundstücksverkehrs. (10 Items)
3) Geschlossene Fragen über die Stellung der Landwirtschaft in der Gesellschaft und Volkswirtschaft, der Angemessenheit und ggf. Begründung einer bevorzugten Behandlung des Sektors. (7 Items)
4) Strukturdaten zum Landwirtschaftsbetrieb und zur Person des Respondenten.
Datensatzbeschreibung
Der Gesamtdatensatz enthält 717 Beobachtungen (674 Landwirte, 43 Nichtlandwirte) und 73 Variablen. Die Variable B702 (Landkreis) wurde aus Gründen der Anonymisierung entfernt. Weitere Informationen über Datendichte und Datenqualität sind dem Dokument "Jauernig_LandmarketRegulation_DSDescriptionDE.pdf" und dem Codebook mit Verteilungsangaben auf Variablenebene (Jauernig_LandmarketRegulation_CodebookDE.pdf) zu entnehmen.
Die Daten werden in vier Formaten angeboten: Stata (mit Labelsätzen in Deutsch u Englisch), drei Versionen CSV Dateien mit folgenden Repräsentationen der Faktorvariablen: a) numerische Codes, b) deutschsprachige Labels, and c) englischsprachige Labels.
Das "Occupational Panel on Tasks and Education (OPTE)" beschreibt für die Jahre von 1973 bis 2011 Tätigkeitsprofile, Bildungsinvestitionszeiten und das Ausbildungsverhalten differenziert nach 179 harmonisierten Berufsgruppen. Es wurde für das Dissertationsprojekt "Die Anwendbarkeit des Erlernten in den wandelnden Bildungs- und Arbeitslandschaften der 1970er bis 2000er Jahre" erstellt. Die Dissertationsschrift ist unter https://kops.uni-konstanz.de/handle/123456789/49897 frei zugänglich und beschreibt (im Anhang) ausführlich die Erstellung der mit diesem Panel veröffentlichten Variablen.
Die Datenbasis für das Panel auf Berufsebene bilden die Scientific Use Files (SUF) des deutschen Mikrozensus. Diese erfassen den ausgeübten Beruf bis zum Jahr 1993 nach der Klassifikation der Berufe des Jahres 1975 (KldB75). In den nachfolgenden Erhebungsjahren erfolgt die Erfassung nach der Klassifikation der Berufe des Jahres 1992 (KldB92). Beide Berufsklassifikationen wurden nach dem Prinzip des kleinsten gemeinsamen Nenners so aggregiert, dass über den gesamten Zeitraum von 1973 bis 2011 eine homogene Messung von Berufsordnungen erfolgt. Zudem wurden die Daten auch auf die Klassifikation der Berufe des Jahres 1988 (KldB88) umgeschlüsselt, um ein Zuspielen der Berufsinformationen zu anderen Datensätzen zu ermöglichen, welche den Beruf nach der KldB75, KldB88 oder KldB92 erfassen. Das Excel-Dokument "Transition_key_occupational_groups_KldB75_88_92.xlsx" gibt die Zuordnung der Berufscodes der KldB75, KldB88 oder KldB92 zur harmonisierten KldB88h wieder.
Auf der Ebene der 179 harmonisierten Berufsordnungen werden Veränderungen im Tätigkeitsprofil, in den Bildungsinvestitionen und im Ausbildungsverhalten über die Zeit beschrieben. Diese werden aus folgenden Informationen der Mikrozensus-SUF's erhalten:
Tätigkeitsprofile: In den Jahren 1973, 1976, 1978, 1980, 1982, 1985, 1987, 1989, 1991, 1993, 1995, 1996, 2000, 2004, 2007, 2011 wird jeweils die Frage nach der "überwiegend ausgeübten Tätigkeit" in der Haupterwerbstätigkeit gestellt. Die möglichen Antwortvorgaben unterscheiden sich in den einzelnen Erhebungsjahren. Grob gesagt kann zwischen drei Perioden (1973 bis 1980, 1982 bis 1995 und 1996 bis 2011) der Tätigkeitsmessung unterschieden werden. Die erfassten Haupttätigkeitsschwerpunkte können jedoch harmonisiert werden, so dass für jede harmonisierte Berufsgruppe über die Zeit nachvollziehbar ist, wie hoch der Anteil an Personen in einem Beruf ist, die in einem Jahr folgende elf Haupttätigkeitsschwerpunkte ausgeübt haben:
Das Vorgehen zur Harmonisierung wird in der Dissertation ab Seite 299 (Anhang A) und in doi.org/10.1007/s11135-021-01158-y beschrieben. Die Tätigkeitsprofile in den "Zwischenjahren", in welchen keine SUFs des Mikrozensus zur Verfügung stehen, wurden interpoliert. Anschließend wurden die Tätigkeitsanteile mit einem Moving-Average (t-3, t, t+3) geglättet. Die mit diesem Panel veröffentlichten Tätigkeitsanteile unterscheiden sich von der in der Dissertation verwendeten Tätigkeitsanteilen, indem auch Nichtdeutsche und Erwerbstätige mit weniger als zehn Wochenstunden Arbeit berücksichtigt werden. Zudem werden die Tätigkeitsanteile nach den Arbeitsstunden der Erwerbstätigen gewichtet und anonymisiert.
Anonymisierung der Tätigkeitsprofile: Die Fallzahl "N" gibt die hochgerechneten, interpolierten und mit Moving-Average (t-3, t, t+3) geglättete Anzahl an Erwerbstätigen in der Berufsordnung wieder. Wird eine Aggregation der Berufsordnungen angestrebt, kann "N" genutzt werden, um z.B. gewichtete Durchschnitte zu berechnen. Multipliziert man "N" mit den jeweiligen Tätigkeitsanteilen "taskshare_..." erhält man eine "fiktive" Zahl an Erwerbstätigen, die diese Haupttätigkeit im Beruf ausüben. Die Zahl ist fiktiv, weil es sich aufgrund der Harmonisierung um geschätzte Tätigkeitsanteile handelt, die zudem mit der jeweiligen Stundenanzahl der Erwerbstätigen gewichtet sind. Einzelfälle können deshalb sowieso nicht zweifelsfrei identifiziert werden. Um eine mögliche Deanonymisierung faktisch weiter zu erschweren, wurden des Weiteren sichergestellt, dass hinter jeder genannten Tätigkeit mindestens drei "fiktive Personen" stehen. Haupttätigkeiten in einem Beruf wurden deshalb mit ein oder zwei weiteren Haupttätigkeiten zusammengefasst, bis in Summe über drei "fiktive Personen" diese Haupttätigkeiten ausübten. Die ursprüngliche "fiktive Personenanzahl" in diesen Haupttätigkeiten wurden anschließend mit der durchschnittlichen Anzahl der "fiktiven Personen" aus diesen Haupttätigkeiten ersetzt. War eine Zusammenfassung im Querschnitt nicht sinnvoll, weil sich der nächstgrößte Tätigkeitsanteil stärker vom kleinsten Tätigkeitsanteil unterschied (weil dieser mehr als 10 "fiktive Personen" enthielt) wurde eine Aggregation über die Erhebungsjahre gewählt. In diesem Fall wurden die Erhebungsjahre solange zusammengefasst, bis in jeder Tätigkeit des Berufs mindestens drei "fiktive Personen" enthalten waren. Die Tätigkeitsanteile des Berufs wurden anschließend mit den durchschnittlichen Tätigkeitsanteilen der zusammengefassten Erhebungsjahre ersetzt. Zuletzt wurden alle Tätigkeitsanteile gerundet. Aufgrund dieser Rundung ergibt die Summe aller Tätigkeitsanteilen einer Berufsgruppe nicht immer den Wert 1. Ist dies für die weiteren Analysen notwendig, sollten die Tätigkeitsanteile so skaliert werden, dass sie in Summe 1 ergeben.
Die Variable "N_soc" gibt die Anzahl der hochgerechneten, interpolierten und mit einem Moving-Average (t-3, t, t+3) geglätteten abhängig Beschäftigten "Angestellte, Arbeiter, Heimarbeiter" (ohne Auszubildende) aus dem Mikrozensus wieder. Die Variable "taskshare_socsec_..." gibt die dazugehörigen Tätigkeitsanteile der abhängig Beschäftigten wieder. Die Anonymisierung erfolgte in derselben Weise wie bei den Tätigkeitsanteilen "taskshare_..." mit allen Erwerbstätigen. Um Einzelfallidentifikationen durch die Subtraktion von "N_socsec" von "N" zu vermeiden, wurden die Tätigkeitsanteile "taskshare_socsec_..." mit den Tätigkeitsanteilen "taskshare_..." aller Erwerbstätigen ersetzt, sofern N-N_socsecEnglish version ================================================================================
The "Occupational Panel on Tasks and Education (OPTE)" describes task profiles, education investment periods and training behavior differentiated by 179 harmonized occupational groups for the years from 1973 to 2011. It was prepared for the dissertation project "The Applicability of the Learned in the Changing Educational and Labor Landscapes of the 1970s to 2000s." The dissertation paper (in German) is freely available at https://kops.uni-konstanz.de/handle/123456789/49897 and describes in detail (in the appendix) the creation of the variables published with this panel. The creation of the task variables is also decribed in English in doi.org/10.1007/s11135-021-01158-y
The data basis for the occupation-level panel are the Scientific Use Files (SUF) of the German Microcensus. These record the occupation up to 1993 according to the 1975 classification of occupations (KldB75). In subsequent survey years, the occupation is recorded according to the 1992 classification of occupations (KldB92). Both occupational classifications were aggregated according to the principle of the lowest common denominator in such a way that there is a homogeneous measurement of occupational classifications over the entire period from 1973 to 2011. In addition, the data were also recoded to the 1988 Classification of Occupations (KldB88) to allow matching of occupational information to other datasets that record the occupation according to KldB75, KldB88, or KldB92. The Excel document "Transition_key_occupational_groups_KldB75_88_92.xlsx" shows the mapping of the occupation codes of KldB75, KldB88 or KldB92 to the harmonized KldB88h.
At the level of the 179 harmonized occupational codes, changes in task profile, educational investments and educational behavior over time are described. These are obtained from the following information from the Microcensus SUF's:
Task profiles: In each of the years 1973, 1976, 1978, 1980, 1982, 1985, 1987, 1989, 1991, 1993, 1995, 1996, 2000, 2004, 2007, 2011, the question about the "predominantly performed activity" in the main job is asked. The possible answer specifications differ in the individual survey years. Roughly speaking, a distinction can be made between three periods (1973 to 1980, 1982 to 1995, and 1996 to 2011) of task measurement. However, the main task recorded can be harmonized so that for each harmonized occupational group it is possible to track over time the proportion of people in an occupation who performed the following eleven main activity foci in a given year:
• taskshare 11: "nursing/treating medically or cosmetically."
The procedure for harmonization is described in doi.org/10.1007/s11135-021-01158-y .
Anonymization of task profiles: The case number "N" reflects the extrapolated, interpolated and moving-average (t-3, t, t+3) smoothed number of employed persons in the occupational group. If aggregation of occupational groups is desired, "N" can be used to calculate weighted averages, for example. Multiplying "N" by the respective activity shares "taskshare_..." yields a "fictitious" number of employed persons performing this main activity in the occupation. The number is fictitious because, due to harmonization, it is an estimated activity share, which is also weighted with the respective number of hours of the employed persons. Individual cases can therefore not be identified beyond doubt anyway. Furthermore, in order to make deanonymization even more difficult, it was ensured that at least three "fictitious" persons are behind each activity mentioned. Main activities in an occupation were therefore combined with one or two other main activities until a total of more than three "fictitious persons" performed these main activities. The original "notional number of persons" in these main activities were then replaced with the average number of "notional persons" from these main activities. If a cross-sectional aggregation did not make sense because the next largest activity share was more different from the smallest activity share (because the latter contained more than 10 "fictitious persons"), an aggregation over the survey years was chosen. In this case, survey years were aggregated until each activity in the occupation contained at least three "notional persons". The occupation's activity shares were then replaced with the average activity shares of the aggregated survey years. Finally, all task shares were rounded. Due to this rounding, the sum of all task shares of an occupational group does not always add up to 1. If this is necessary for further analyses, the activity shares should be scaled so that they add up to 1.
The variable "N_soc" reflects the number of extrapolated, interpolated and moving-average (t-3, t, t+3) smoothed dependent employees "white-collar workers, blue-collar workers, homeworkers" (without apprentices) from the microcensus. The variable "taskshare_socsec_..." reflects the corresponding activity shares of the dependent employees. Anonymization was carried out in the same way as for the activity shares "taskshare_..." with all employed persons. To avoid individual case identifications by subtracting "N_socsec" from "N", the activity shares "taskshare_socsec_..." were replaced with the activity shares "taskshare_..." of all employed persons, if N-N_socsec<5000. The corresponding cases are labeled with the variable "anonymous_socsec".
Educational investment: For the variable "educ_invest", the education time in months formally required to obtain the general education and last/highest vocational qualification was calculated from the Microcensus SUF's of 1973, 1976, 1978, 1980, 1982, 1985, 1987, 1989, 1991, 1993 and 1995 to 2011 for all employed persons. For example, a secondary general school certificate was measured as 108 months (9 years) and a "completion of apprenticeship training or equivalent vocational school qualification" as 36 months (3 years). A detailed list and justification of the education periods assigned to each by degree can be found in the dissertation beginning on page 308 (Appendix B). The "average formal education time" of an occupation was calculated using the average education time of all employed persons in the harmonized occupational group. The "intermediate years" in which no SUF was available were interpolated. Subsequently, the values were smoothed with a moving average (t-3, t, t+3).
Training behavior (supply-demand relation): The Federal Institute for Vocational Education and Training (BIBB) converted the major field of the highest vocational qualification in combination with the training institution into a learned occupation according to KldB92. The heuristic procedure for this is described in Maier and Helmrich (2012). To calculate the supply-demand relation ("sdr"), the microcensuses (on-site) from 2005 to 2012 are pooled and a relative distribution of vocational degrees according to the harmonized occupational classification KldB88h is calculated for all degree years from 1973 to 2012. This distribution is contrasted with the relative distribution of employment shares according to KldB88h for the respective years. The procedure is described in the dissertation on page 86 and 145-147 and plausibilized starting on page 328 (Appendix D). The variable "ln_sdr" corresponds to ln(sdr).