Resource title

Data Mining auf Unfalldaten

Resource image

image for OpenScout resource :: Data Mining auf Unfalldaten

Resource description

Aufgabe war die Untersuchung von Unfalldaten, insbesondere die Vorhersage eines Unfallscores mittels Data-Mining-Methoden. Dazu wurde das inkrementelle Modell des Data Mining dreimal durchlaufen. Jeder Ansatz brachte neue Erkenntnisse. Somit war der letzte am aufschlussreichsten. Eine Übersicht mit den besten Ergebnissen zeigt Tab. 14, die Erkennungsraten sollten dabei möglichst hoch und die Kosten möglichst niedrig sein. Kosten sind nur relativ innerhalb des gleichen Ansatzes vergleichbar. Für vergleichbare Zahlen beziehen sich die Daten von Ansatz 1 und 3 auf Crossvalidation, Ansatz 2 auf die Gesamtmenge. Ansatz 3 benutzt den neu gebildeten ScoreB mit 6 statt 9 Klassen. Deutlich sind die in jedem Ansatz ansteigenden Erkennungsraten und sinkenden Kosten erkennbar. Trotz der zuletzt hohen Erkennungsraten darf nicht übersehen werden, was diese eigentlich bedeuten. Hier können nur in verschiedenen Abstufungen schwere von leichten Unfällen unterschieden werden. Die hohe Anzahl leichter Unfälle sorgt bei deren guter Erkennung für eine hohe Gesamterkennungsrate. Wichtiger sind jedoch die schweren Unfälle mit Gefahr für Leib und Leben, welche deutlich schwieriger vorherzusagen sind. Je weniger Abstufungen im Score gemacht wurden, desto besser war die Vorhersage der hohen Scores. Bei nur zwei Unterscheidungen in Sachschaden und auch Personenschaden lag die Erkennungsrate für schwere Unfälle im besten Fall bei 59,4% mit einer Ungenauigkeit (Fehlalarm) von 21,4%. Dieses Ergebnis wurde mit einer Kombination aus Random Forest, ID3 und DecisionStump erreicht. Als bester einzelner Klassifikations-Algorithmus hat sich hier Random Forest herausgestellt.

Resource author

Christian Andersch, Jürgen Cleve

Resource publisher

Resource publish date

Resource language

deu

Resource content type

text/html

Resource resource URL

http://hdl.handle.net/10419/23333

Resource license

Adapt according to the presented license agreement and reference the original author.