Datasets

Entdecke unsere Sammlung an Datensätzen

Wir möchten dir hier in Zukunft eine möglichst breite Auswahl an hochwertigen Datensätzen zur Verfügung stellen. Nutze diese, um Gelerntes in der Praxis anzuwenden oder deine eigenen Projekte zu verwirklichen. Wir werden diesen Katalog stetig vergrößern und um neue Themen erweitern.

Basic Automobile Information

Der Datensatz “Basic Automobile Information” bietet über 300 verschiedene Einträge von Automodellen und ihren Eigenschaften. Es handelt sich hierbei vorwiegend um amerikanische Modelle von 1970 bis 1982. Der Datensatz eignet sich insbesondere für einfache Auswertungen und Visualisierungen.

Lizenz

CC0 Universal

Mehr erfahren

Tic-Tac-Toe Endgame

Das Tic-Tac-Toe Endgame Dataset ist eine wertvolle Ressource für Forscher und Enthusiasten, die an der Entwicklung von Algorithmen zur Spielstrategieoptimierung interessiert sind. Der Datensatz wurde erstellt, um Modelle im Bereich des maschinellen Lernens und der künstlichen Intelligenz zu trainieren und zu testen.

Lizenz

CC BY 4.0 Deed

Mehr erfahren

Vergleich von Gesichtsausdrücken

Bei diesem Datensatz handelt es sich um einen groß angelegten Gesichtsausdrucksdatensatz, der aus Gesichtsbildtripletts zusammen mit menschlichen Anmerkungen besteht, die angeben, welche zwei Gesichter in jedem Triplett das ähnlichste Paar in Bezug auf den Gesichtsausdruck bilden.

Lizenz

CC0 Universal

Mehr erfahren

Netflix Filme und Fernsehshows

Netflix ist eine der beliebtesten Streaming-Plattformen weltweit. Auf der Plattform sind über 8000 Filme und Fernsehsendungen verfügbar, und Mitte 2021 hatte Netflix weltweit über 200 Millionen Abonnenten. Dieser tabellarische Datensatz besteht aus Auflistungen aller auf Netflix verfügbaren Filme und Fernsehsendungen, zusammen mit Details wie Besetzung, Regisseure, Bewertungen, Erscheinungsjahr, Dauer, usw.

Lizenz

CC0 Universal

Mehr erfahren

Iris Flower Data Set

Das Iris Flower Data Set ist ein bekannter Datensatz in der Welt der maschinellen Lern- und Statistikforschung. Aufgrund seiner klaren Struktur und der gut definierten Klassifikationsaufgabe wird der Datensatz oft als Einstiegspunkt für Anfänger in maschinellem Lernen verwendet.

Lizenz

CC BY 4.0 Deed

Mehr erfahren

AI4I 2020 Predictive Maintenance Dataset

Das AI4I 2020 Predictive Maintenance Dataset ist eine bedeutende Datensammlung, die sich auf das Feld der vorbeugenden Instandhaltung (Predictive Maintenance) im industriellen Kontext konzentriert. Die Daten stammen aus realen industriellen Prozessen und bieten eine wertvolle Grundlage für die Entwicklung von prädiktiven Modellen zur Verbesserung der Anlagenverfügbarkeit und Reduzierung von ungeplanten Stillstandzeiten.

Lizenz

CC BY 4.0 Deed

Mehr erfahren

Statlog (German Credit Data)

Der Statlog (German Credit Data) Datensatz ist ein bedeutsamer Datensatz im Bereich der Kreditrisikobewertung und wurde erstmals Ende der 1980er Jahre im Rahmen des Statlog-Projekts vorgestellt. Seine Entstehung war ein Meilenstein in der Anwendung von maschinellem Lernen auf die Finanzwelt, da er als Grundlage für die Entwicklung und Evaluierung von Kreditrisikomodellen dient.

Lizenz

CC BY 4.0 Deed

Mehr erfahren

Energy Efficiency

Das Energy Efficiency Dataset ist eine umfassende Datensammlung, die sich auf die Bewertung der Energieeffizienz von Gebäuden konzentriert. Dieser Datensatz wurde entwickelt, um Einblicke in die Faktoren zu gewinnen, die den Energieverbrauch von Gebäuden beeinflussen, und um prädiktive Modelle zur Verbesserung der Energieeffizienz zu ermöglichen.

Lizenz

CC BY 4.0 Deed

Mehr erfahren

Seoul Bike Sharing Demand

Das Seoul Bike Sharing Demand Dataset bietet einen detaillierten Einblick in die Nutzung von Fahrradverleihsystemen in der südkoreanischen Metropole Seoul. Neben Informationen, welche direkt mit der Ausleihe in Verbindung stehen umfasst dieses Dataset auch Daten zu Wetterbedingungen wie Temperatur, Luftfeuchtigkeit und Windgeschwindigkeit.

Lizenz

CC BY 4.0 Deed

Mehr erfahren