Statlog (German Credit Data)
Der Statlog (German Credit Data) Datensatz ist ein bedeutsamer Datensatz im Bereich der Kreditrisikobewertung und wurde erstmals Ende der 1980er Jahre im Rahmen des Statlog-Projekts vorgestellt. Entwickelt, um Modelle für die Klassifizierung von Kreditanträgen zu unterstützen, wurde dieser Datensatz in Zusammenarbeit mit einer deutschen Bank erstellt. Seine Entstehung war ein Meilenstein in der Anwendung von maschinellem Lernen auf die Finanzwelt, da er als Grundlage für die Entwicklung und Evaluierung von Kreditrisikomodellen dient.
Dataset Übersicht
Der Datensatz umfasst 1.000 Datensätze von Kreditantragstellern und bietet eine vielfältige Palette von 20 Attributen. Diese Attribute reichen von persönlichen Informationen wie Alter, Geschlecht und Familienstand bis hin zu finanziellen Parametern wie Kreditlaufzeit, Kreditbetrag und Vermögenswerten. Ein entscheidendes Merkmal ist die Zielvariable "Kreditwürdigkeit", die angibt, ob ein Kreditnehmer als kreditwürdig oder nicht kreditwürdig eingestuft wurde. Die Herausforderung, Kreditrisiken anhand dieser Attribute zu klassifizieren, macht den Datensatz besonders relevant für die Entwicklung von prädiktiven Modellen im Bereich des Kreditwesens.
Zusätzlich zu den numerischen Attributen enthält der Datensatz qualitative Merkmale wie den Berufsstatus und den Verwendungszweck des Kredits. Diese vielfältige Mischung von Informationen ermöglicht eine tiefgehende Analyse und die Entwicklung von präzisen Modellen zur Vorhersage von Kreditwürdigkeit. Der Statlog (German Credit Data) Datensatz bleibt somit ein bedeutender Referenzpunkt für Forscher und Fachleute im Bereich der Kreditrisikobewertung und des maschinellen Lernens.