Diese drei Dokumente kennt jeder, der schon mal eine Wohnung besichtigt hat: die Selbstauskunft, die Mietschuldenfreiheitsbescheinigung und, na klar, den Schufa-Nachweis. Daten von 67,5 Millionen Privatpersonen hat die Schutzgemeinschaft für allgemeine Kreditsicherung in Deutschland gespeichert. Das gibt ihr Macht: Ohne ihre Bonitätseinschätzung ist es schwieriger, einen Kredit aufzunehmen oder eine Wohnung zu mieten.

Fast jeder kennt deshalb die Schufa und manche haben schlechte Erfahrungen mit ihr gemacht. Doch nur die Wenigsten dürften bewusst in die Speicherung ihrer Daten eingewilligt haben. Geregelt wird sie meist versteckt in den AGB von Banken, Versicherungen und Mobilfunkanbietern. Und noch weniger Menschen wissen, wie die Schufa ihren Score für die Kreditwürdigkeit eigentlich berechnet: Wieso der eigene Score bei 89 Prozent, der von der Nachbarin aber bei 94 Prozent liegt, ist für viele nicht ersichtlich. Das will eine neue Kampagne nun ändern.

OpenSchufa heißt das Projekt der gemeinnützigen Organisationen Open Knowledge Foundation und AlgorithmWatch. Sie wollen die Formel hinter dem Schufa-Score offenlegen und haben deshalb eine Crowdfunding-Kampagne gestartet, die am Donnerstag zu Ende ging. 1.825 Unterstützer haben in den vergangenen vier Wochen 43.344 Euro gespendet. Die angepeilten 50.000 Euro haben die Initiatoren somit knapp verpasst, doch das Projekt wird trotzdem angeschoben: Für die Startfinanzierung waren nämlich nur 30.000 Euro notwendig.

OpenSchufa bittet zur Datenspende

Nun ruft die Initiative zu einer Datenspende auf: Die Menschen sollen von ihrem Recht auf Selbstauskunft Gebrauch machen und ihre Schufa-Auskunft an OpenSchufa weiterleiten. Die Schufa bietet nämlich jedem Bürger über ihre Website an, einmal im Jahr die gespeicherten Daten anzufordern. Gemeinsam mit Journalisten und Journalistinnen des Spiegel und dem Bayrischen Rundfunk will OpenSchufa die eingesandten Daten anschließend analysieren und die dem Score zugrunde liegende Formel knacken.

Wie soll das gehen? Zunächst ein Blick auf das Schufa-System: Aus Daten über Konten, Handyverträge und Internetbestellungen ermittelt die Auskunft eine Wahrscheinlichkeit, inwieweit Verbraucher einen Kredit zurückzahlen können oder nicht. Dafür wird jedes Merkmal, also etwa die Information, ob jemand seinen Handyvertrag immer rechtzeitig bezahlt, in einen Zahlenwert umgewandelt. Beispiel: Null für Ja, Eins für Nein, und dann mit einem Faktor multipliziert. Wie groß dieser Gewichtungsfaktor ist, hängt von den Daten ab. Wenn viele Leute, die ihre Handyverträge nicht rechtzeitig bezahlen, besonders oft Kredite nicht zurückgezahlt haben, ist das entsprechende Gewicht besonders hoch.

Anschließend wird die Summe der gewichteten Merkmale durch eine spezielle Funktion auf einen Wert zwischen Null und Eins gebracht. Das Verfahren heißt logistische Regression, es ist ein Standardverfahren aus der Statistik. Unbekannt sind in dieser Rechnung allerdings die genauen Merkmale, die in die Berechnung einfließen, und deren Gewichtung. Hier setzt OpenSchufa an.

Nicht abschaffen, aber transparenter machen

Das Projekt will eine Web-App entwickeln, mit der die eigene Schufa-Auskunft eingescannt, sicher und anonymisiert übertragen und anschließend maschinenlesbar gemacht werden kann. Da auch die Kampagne Zugang zu äußert sensiblen Daten haben wird, liegt der Fokus darauf, alle persönlichen Daten schon bei der Eingabe zu schwärzen. Diese App soll ab Mai nutzbar sein. Schon jetzt seien im Rahmen des Projektes mehr als 16.000 Selbstauskünfte beantragt worden, sagen die Verantwortlichen. Liegen erst einmal genug Daten vor, so sollen die Einflussfaktoren und ihre Gewichtungen rekonstruiert werden, wieder mit einer logistischen Regression.

Die Kampagne wolle nicht die Schufa und ihr Bewertungsverfahren abschaffen, sagt Arne Semsrott, Projektleiter von OpenSchufa, im Gespräch mit ZEIT ONLINE. Vielmehr setze man sich für einen transparenten Prozess und Überprüfungen der Berechnungen durch eine unabhängige Kommission ein.