Zensus Die Geheimhaltung mit der Cell-Key-Methode
Sicherstellung der statistischen Geheimhaltung im Zensus 2022
Um das Grundrecht aller Bürgerinnen und Bürger auf informationelle Selbstbestimmung zu schützen und den Vorgaben des Bundesstatistikgesetzes Rechnung zu tragen, dürfen aus den Veröffentlichungen des Zensus keinerlei Rückschlüsse auf die Angaben von Einzelpersonen oder auf andere Einzelfälle möglich sein. Dies wird durch den Einsatz eines sogenannten Geheimhaltungsverfahrens gewährleistet.
Für den Zensus 2022 haben sich die Statistischen Ämter des Bundes und der Länder für die sogenannte Cell-Key-Methode entschieden.
Welche Auswirkungen hat die Cell-Key-Methode auf die Ergebnisse?
Die Cell-Key-Methode basiert darauf, dass einige Fallzahlen in den Tabellen gegenüber ihren Originalwerten leicht verändert ausgewiesen werden. Die maximale absolute Abweichung vom Originalwert ist bei dieser Methode gering. Falls ein Originalwert exakt Null beträgt, so wird dieser stets unverändert ausgewiesen.
Für welche Angaben wird die Cell-Key-Methode eingesetzt?
Die Cell-Key-Methode wird auf Auswertungen angewendet, die ausschließlich auf demografischen Daten, Gebäude- und Wohnungsdaten, Haushaltsdaten und Familiendaten basieren. Daten, die aus einer Stichprobenerhebung hochgerechnet werden, wie beispielsweise zu Erwerbstätigkeit sowie Schul- und Berufsbildung, müssen nicht geheim gehalten werden. Ein Rückschluss auf Einzelangaben wird hier durch die Hochrechnung und die anschließende Rundung auf ein Vielfaches von 10 unmittelbar verhindert.
Bitte beachten Sie: Die amtlichen Bevölkerungszahlen werden für alle administrativen Gebietseinheiten mit dem unveränderten Originalwert ausgewiesen.
Eine Besonderheit in der Darstellung
Bedingt durch die Anwendung der Cell-Key-Methode addieren sich die jeweiligen Einzelwerte einer Tabellenzeile oder -spalte nicht notwendigerweise zur ausgewiesenen Gesamtsumme.
Das folgende Beispiel veranschaulicht dies: Der in der ersten Tabellenspalte ausgewiesene Insgesamt-Wert über alle Altersklassen für die Ausprägung "Männlich" beträgt 175. Werden die zugehörigen Tabellenfelder der ersten Zeile jedoch separat addiert, ergibt deren Summe 173 (=20 + 31 + 32 + 40 + 50). Der Insgesamt-Wert über die komplette Tabelle ist mit 371 ausgewiesen. Werden die Werte für die Ausprägungen "Männlich" und "Weiblich" jedoch separat addiert, ergibt deren Summe 372 (= 175 + 197). Auch bei einer Addition über die Insgesamt-Werte aller Altersklassen (47 + 56 + 71 + 86 + 109 = 369) sowie bei einer Addition über alle Einzelwerte der Tabelle (20 + 31 + 32 + 40 + 50 + 25 + 25 + 40 + 45 + 60 = 368) ergibt sich jeweils eine leichte Abweichung zum ausgewiesenen Insgesamt-Wert.
Geschlecht | Insgesamt | Alter (5 Klassen) | ||||
---|---|---|---|---|---|---|
Unter 18 | 18 - 29 | 30 - 49 | 50 - 64 | 65 und älter | ||
Anzahl | Anzahl | Anzahl | Anzahl | Anzahl | Anzahl | |
Männlich | 175 | 20 | 31 | 32 | 40 | 50 |
Weiblich | 197 | 25 | 25 | 40 | 45 | 60 |
Insgesamt | 371 | 47 | 56 | 71 | 86 | 109 |
Beispieltabelle: Fallzahlen nach Geschlecht und Alter (5 Klassen)
Bitte beachten Sie: Dieser Effekt ist eine direkte Folge der Cell-Key-Methode und sichert zusätzlich zur Vertraulichkeit der Einzelangaben eine möglichst hohe Datenqualität. Wenn Sie bei Ihrer Recherche großen Wert auf die Genauigkeit der Ergebnisse im Detail legen bzw. auch kleine Diskrepanzen zu den amtlichen Ergebnissen vermeiden möchten, sollten Sie die Ergebnisse möglichst direkt über die Zensusdatenbank abrufen. Eine eigenständige Bearbeitung und Berechnung, zum Beispiel von Summen oder Differenzen von Einzelergebnissen, führt unter Umständen zu größeren Abweichungen von Originalergebnissen.
Welche Auswirkungen hat das Geheimhaltungsverfahren auf statistische Kennzahlen?
Viele interessante Kennzahlen zu einer Statistik basieren auf Fallzahlen. Dazu gehören Anteilswerte, Mittelwerte, Salden sowie Veränderungsraten, die die Ergebnisse des Zensus 2022 ins Verhältnis zu den Ergebnissen des Zensus 2011 setzen. Alle diese Kennzahlen werden mittels der gering veränderten Fallzahlen berechnet. Somit können die jeweiligen Ergebnisse vom entsprechenden Originalwert leicht abweichen. Die jeweils angewandte Vorgehensweise verhindert Rückschlüsse auf Einzelangaben und stellt gleichzeitig eine möglichst hohe Ergebnisqualität sicher. Auch hier gilt: Wenn Sie bei Ihrer Recherche kleinere Diskrepanzen zu den amtlichen Ergebnissen vermeiden möchten, sollten Sie die statistischen Kennzahlen möglichst direkt über die Zensusdatenbank abrufen. Eine eigenständige Bearbeitung und Berechnung führt unter Umständen zu größeren Abweichungen von Originalergebnissen.
Weshalb werden einige statistische Kennzahlen in Klammern oder ganze Tabellenteile gar nicht ausgewiesen?
Bei statistischen Kennzahlen (zum Beispiel Anteile, Mittelwerte oder Veränderungsraten) kann es insbesondere dann zu hohen prozentualen Abweichungen vom Originalwert kommen, wenn sehr kleine Fallzahlen der jeweiligen Maßzahl zugrunde liegen. In diesem Fall wird die entsprechende Kennzahl in Klammern ausgewiesen, um einen eingeschränkten Interpretationsgehalt zu kennzeichnen. Sehr schwach besetzte Tabellenteile mit besonders hohem Schutzbedarf werden aus Qualitätsgründen gar nicht ausgewiesen (dargestellt durch das Zeichen "."). Für stärker zusammengefasste Ebenen sind entsprechende Auswertungen verfügbar. Diese Qualitätsinformationen entgehen Ihnen, wenn Sie Kennzahlen selbstständig berechnen. Auch deshalb der Hinweis: Wenn Sie bei einer Recherche großen Wert auf Genauigkeit der Ergebnisse auch im Detail legen bzw. auch kleine Diskrepanzen zu den amtlichen Ergebnissen vermeiden möchten, sollten Sie die Ergebnisse möglichst direkt über die Zensusdatenbank abrufen.
Verfahrenswechsel: Weshalb?
Beim Zensus 2011 wurde die statistische Geheimhaltung durch das Verfahren "SAFE" ("Sichere Anonymisierung für Einzeldaten") sichergestellt.
Für den Zensus 2022 haben sich die Statistischen Ämter des Bundes und der Länder für einen Verfahrenswechsel entschieden. Das neue Verfahren, die sogenannte Cell-Key-Methode, ermöglicht eine noch höhere Flexibilität bei der Erstellung von Auswertungen. Im Zuge des Relaunchs der Zensusdatenbank 2011 wurde dieses Verfahren nachträglich auch auf die Ergebnisse des Zensus 2011 angewendet. Somit sind die Ergebnisse aus 2011 auch mit den Ergebnissen aus dem Zensus 2022 vergleichbar.
Einige der in der Zensusdatenbank verfügbaren Ergebnisse zum Zensus 2011 können aufgrund des Verfahrenswechsels von den bisherigen Veröffentlichungen zum Zensus 2011 leicht abweichen. Bitte beachten Sie: Weder die Qualität bisher verfügbarer Publikationen noch die Qualität der in dieser Datenbank abrufbaren Ergebnisse sind durch den Wechsel des Geheimhaltungsverfahrens beeinträchtigt.
Weiterführende Informationen zum Geheimhaltungsverfahren
Detaillierte Informationen zur Methodik des eingesetzten Geheimhaltungsverfahrens erhalten Sie hier.