Maschinelles Lernen im Kaggle-Wettbewerb

Kaggle – Ein Erfahrungsbericht. The Home of Data Science. So der selbstgewählte Titel der sich immer größerer Beliebtheit erfreuenden Website. Was sich dahinter verbirgt, sind ausgesuchte Herausforderungen auf dem Gebiet des maschinellen Lernens und der statistischen Datenanalyse, ein intellektuelles Kräftemessen mit Datenanalysten aus der gesamten Welt und, schafft man es unter die Besten drei, auch…

Die ROC curve oder „Wann ist ein Modell besser als Würfeln?“

Getreu dem Motto „Wir bringen Licht ins Dunkel“, sollen Data-Mining-Methoden Wissen sichtbar machen, welches derzeit noch irgendwo in den Untiefen einer Datenbank schlummert und nur darauf wartet entdeckt zu werden. Um uns dabei nicht selber im Dschungel aus Entscheidungsbäumen und linearen Regressionen zu verlaufen oder uns möglicherweise in einem künstlichen neuronalen Netz zu verfangen, atmen…

Dem Wohlstand auf der Spur, Statistik sei Dank

Am letzten Wochenende ist mir ein Artikel des Hamburger Abendblatts (29./30. November, Seite 12, “Der Wohlstand lebt im Norden”) in die Hände gefallen. Kurzum, es wurden die durchschnittlichen Pro-Kopf-Einkommen in 2010 der Stadtteile Hamburgs in einer Kartengrafik sehr anschaulich dargestellt. Dennoch ließ es mich etwas stutzen. Ich selbst wohne in Hamburg (Eimsbüttel), ich kenne eine ganze Menge Menschen hier. Besonders…