Vortrag - HTW Dresden

Transcription

Vortrag - HTW Dresden
Fakultät Wirtschaftswissenschaften Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business Analytics
Data Mining im betrieblichen Umfeld
Prof. Dr. Andreas Hilbert
Andreas.Hilbert@TU-Dresden.de
http://wiid.wiwi.tu-dresden.de
01062 Dresden
Telefon
Telefax
+49 351 463-32268
+49 351 463-32736
Business Analytics
in Action: Mobilfunk-Kunden und Talkline
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
S E R V I C E– IDATA
N T E LMINING
LIGENCE
SERVICE INTELLIGENCE
Der Mobilfunk-Anbieter TALKLINE sah sich 2001 dem
Problem gegenüber, dass ca. 200.000 Kundenverträge kurz
vor dem Vertragsende standen. Um nach dem „Gießkannen-Prinzip“ jedem Kunden ein neues Handy zu einem
Preis anbieten zu können, der unter dem regulären
Kaufpreis lag, hätte TALKLINE etwa 100 EURO pro Vertrag
investieren müssen. Daraus ergab sich sofort die Frage:
Welche Kunden sind besonders gewinnbringend,
d.h. subventionswürdig, werden aber mit hoher
Wahrscheinlichkeit zur Konkurrenz wechseln?
Die Lösung fand sich im CHURN-Management: Mit Hilfe
des Data Mining wurde auf Basis der vorhandenen Kunden-
Business Analytics – Seite 2
Datenbank-Stammtisch 2015 – HTW Dresden
Welche Kunden sind besonders gewinnbringend,
Business Analytics
d.h. undsubventionswürdig,
werden aber mit hoher
in Action: Talkline
das CHURN-Management
Wahrscheinlichkeit zur Konkurrenz wechseln?
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Die Lösung fand sich im CHURN-Management: Mit Hilfe
des Data Mining wurde auf Basis der vorhandenen Kundeninformationen ermittelt, mit welcher Wahrscheinlichkeit ein
Kunde abwandern wird. Schließlich wurden diese
Informationen in Bezug zum Gewinnbeitrag des Kunden
gesetzt, was letztlich eine Portfolio-Analyse ergab.
hoch
Gewinnbeitrag
!
kritische Kunden
Hinweis:
Hier sind individuelle Angebote
und hohe Subventionen sinnvoll !
mittel
niedrig
niedrig
mittel
hoch
Abwanderungswahrscheinlichkeit
Business Analytics – Seite 3
Datenbank-Stammtisch 2015 – HTW Dresden
Business Analytics
CHURN-Management und die zu lösenden Aufgaben
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Kündigungsprävention: Von der Analyse bis zur betrieblichen Umsetzung
Im Rahmen eines systematischen Kundenmanagements besteht bezüglich der
großen Bedeutung einer „Kündigungsprävention“ (CHURN) Konsens. In der
betrieblichen Praxis erweist sich ihre Umsetzung jedoch schwierig – aus zwei
Hauptgründen:
1. Es fehlen häufig Instrumente, um eine „Kündigungsgefahr“ im Bestand überhaupt
„treffsicher“ erkennen zu können
2. Die Bearbeitung von „Kündigungsgefährdeten“ wird als Service-Aufgabe gesehen,
die nicht unmittelbar zu „mehr“ Umsatz führt, gleichwohl sofort Ressourcen bindet:
Damit fehlt die vertriebliche Akzeptanz
Dabei bleiben aber auch andere Fragen offen: Sollen die „Hoch-Gefährdeten“
bedient werden; oder sind diese bereits verloren und man sollte sich eher auf die
noch „Bekehrbaren“ konzentrieren. Dann bleibt allerdings die Frage, was
identifiziert werden soll: Die Kündigungswahrscheinlichkeit oder die „Turn“Wahrscheinlichkeit.
Business Analytics – Seite 4
Datenbank-Stammtisch 2015 – HTW Dresden
Business Analytics
Mehr Beispiele aus dem betrieblichen Umfeld
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Fragestellungen
• Vorhersage der Kündiger von Versicherungen (Kündigungspräventionsmaßnahme)
• Vorhersage der Kündiger von TelCo-Kunden (Kündigungspräventionsmaßnahme)
• Vorhersage von Betrugsfällen beim Online-Kauf (Vorauskasse, Rechnungszahlung)
• Vorhersage von Betrugsfällen beim Kreditkartengebrauch (Zahlungsverweigerung)
• Vorhersage der Bonität eines Kreditkunden (Ausfallwahrscheinlichkeit, Zinsanpassung)
• Zuordnung eines Kunden zur Gruppe der kredit(un)würdigen Kunden (Kreditverweigerung)
• …
Probleme
• Welches Verfahren soll man verwenden?
• Welche Daten braucht man dazu?
• Wie überprüft man die Güte des gefundenen Modells?
• Wie setzt man dieses Modell in der Realität um?
•
…
Business Analytics – Seite 5
Datenbank-Stammtisch 2015 – HTW Dresden
Agenda
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business Intelligence Research
Knowledge Discovery in Databases
Methodenüberblick
Meinungen und Trends
Herausforderungen
Ausblick
Business Analytics – Seite 6
Datenbank-Stammtisch 2015 – HTW Dresden
Fakultät Wirtschaftswissenschaften Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business Analytics
Business Intelligence Research
Prof. Dr. Andreas Hilbert
Andreas.Hilbert@TU-Dresden.de
http://wiid.wiwi.tu-dresden.de
01062 Dresden
Telefon
Telefax
+49 351 463-32268
+49 351 463-32736
Herausforderungen der Business Intelligence
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Informationsangebot
Informationsnachfrage
Informationsbedarf
Wir ertrinken in Informationen, aber uns dürstet nach Wissen. (John Naisbitt)
Business Analytics – Seite 8
Datenbank-Stammtisch 2015 – HTW Dresden
Business Intelligence Research
Corporate Mission
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Der Lehrstuhlversteht sich als Forschungs-, Lehr- und Transferzentrum der
Wirtschaftsinformatik und angrenzender Gebiete der Betriebswirtschaftslehre.
• Den zentralen Gegenstand der Forschungsaktivitäten bilden zum einen die Business
Intelligence (BI) mit ihren Facetten Data Warehousing, Online Analytical Processing, Data,
Text und Web Mining, Customer Relationship Management sowie Revenue Management
und zum anderen der Einsatz von Business Intelligence in unterschiedlichen
Anwendungsdomänen, z.B. im Energiebereich, Electronic Commerce, im Web 2.0 Umfeld
oder im Bereich der Industrie 4.0
• Im Rahmen der Lehre erwerben die Studierenden wissenschaftlich fundierte Kenntnisse und
Fähigkeiten zur Analyse, Beschreibung, Gestaltung und Bewertung von ManagementSupport-Systemen (BI-Systeme). Damit werden sie in die Lage versetzt, die zum
erfolgreichen Führen von Unternehmen benötigten Daten und
Informationen zu identifizieren, eine analyseorientierte Speicherung
InformationsInformationsangebot
nachfrage
dieser Informationen in Data Warehouses zu konzipieren und zu
implementieren sowie unbekannte Zusammenhänge in
den Daten mit Hilfe des Data Mining aufzudecken und
Informationssomit zur Wertschöpfung dieser Unternehmen beizutragen.
bedarf
Business Analytics – Seite 9
Datenbank-Stammtisch 2015 – HTW Dresden
Business Intelligence
Die Prognose: The New York Times, Mai 2000
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Die Realität
Warenkorbanalysen bei Wal Mart
Kampagnenmanagement bei t-Mobile
Betrugsprävention bei Amazon
Absatzprognose beim Springer-Verlag
Business Analytics – Seite 10
Datenbank-Stammtisch 2015 – HTW Dresden
Business Intelligence
Money Watch & University of California, Mai 2010
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
http://moneywatch.bnet.com/saving-money/blog/college-solution/10-hottest-careers-in-america/2154/
Business Analytics – Seite 11
Datenbank-Stammtisch 2015 – HTW Dresden
Business Intelligence
Gartner, Januar 2015
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
http://gartnerevent.com/NABI13Survey
Business Analytics – Seite 12
Datenbank-Stammtisch 2015 – HTW Dresden
Business Intelligence Research
Lehre im Überblick
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Grundlagen
Wirtschaftsinformatik
Data
Warehousing
Data
Mining
Einführung in die
Wirtschaftsinformatik
Corporate
Performance
Management
Bootcamps
BI
Minor-Modul
Wirtschaftsinformatik:
AWS & E-MSS
Theorie
Praxis
Vertiefung
Wirtschaftsinformatik
Bachelor
Mathematische
Planungsverfahren
Allgemeine
Kompetenzen
Allgemeine
Qualifizierung
(AQUA)
Entscheidungslehre
Master
Diplom
Schwerpunkt
Business
Intelligence
Quantitative
Kompetenzen
Applied Data Analysis
Business Analytics – Seite 13
Datenbank-Stammtisch 2015 – HTW Dresden
Business Intelligence Research
Lehre – Kooperationen
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Unique Selling Proposition (USP):
–
Ausbildung entlang der gesamten Wertschöpfungskette der BI
–
Kooperation mit weltweit führenden Softwareanbietern im Bereich BI
• Seit 2005 mit Kooperation mit SAS
• Seit 2009 Kooperation mit Microstrategy
• Aktuell Gespräche mit OS-Anbietern
(Lehr-)Vorträge aus der Praxis zu Themen der BI
Business Analytics – Seite 14
Datenbank-Stammtisch 2015 – HTW Dresden
Gartner’s Magic Quadrant
for Business Intelligence and Analytics Platforms
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Kooperationspartner
seit 2005:
seit 2009:
Quelle: Gartner 2015
Business Analytics – Seite 15
Datenbank-Stammtisch 2015 – HTW Dresden
Business Intelligence Research
Forschung – Diplom- und Masterarbeiten
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
seit 09/2005 (erste Vergabe) über 130 Abschlussarbeiten (Stand 01.03.2015)
hoher Anteil an Arbeiten in Kooperation mit Praxispartnern
–
Altran GmbH
–
AMTC GmbH
–
BMW AG
–
Dresden Monarchs
–
Dresdner Bank AG
–
EADS GmbH
–
Infor AG
–
LSG Sky Chefs
–
Mummert Steria AG
–
SAP AG
–
Solar World AG
–
T-Systems MMS GmbH
–
Völcker Informatik AG
Signifikant gute Erfolgsbilanz der Absolventen (Berufseinstieg)
Business Analytics – Seite 16
Datenbank-Stammtisch 2015 – HTW Dresden
Herausforderungen der Business Intelligence
Wir ertrinken in Informationen, aber uns dürstet nach Wissen. (John Naisbitt)
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business Intelligence
Managementsupport
Die Professur versteht sich als Forschungs-, Lehrund Transferzentrum der Wirtschaftsinformatik und
angrenzender Gebiete der Betriebswirtschafts-lehre.
Den zentralen Gegenstand der Forschungsaktivitäten bilden zum einen die Business
Intelligence (BI) mit ihren Facetten Data
Warehousing, Online Analytical Processing, Data,
Text und Web Mining (Business Analytics) sowie
der Einsatz von Business Intelligence in diversen
Anwendungsdomänen, z. B. im Controlling, im eMarketing, im CRM, im HR-Management oder in der
Produktion oder aus dem Web.
Kooperationen
Blog Mining Qualitätssicherung
Executive
Information
System
(EIS)
BUSINESS
Decision
Support System
(DSS)
INTELLIGENCE
Management Information System
(MIS)
Forschungsprojekte (Auswahl)
Microblogging Reporting Opinion Mining
Fraud Detection
Weblogs
Revenue
Management Pattern Recognition
Web Mining Business Analytics
OLAP Data Mining Employer Branding
Web Intelligence Social Network
Unter Business Intelligence wird ein integrierter, unternehmensspezifischer, IT-basierter Gesamtansatz zur betrieblichen
Entscheidungsunterstützung verstanden. Kemper, Mehanna, Unger, 2004
Business Analytics – Seite 17
Datenbank-Stammtisch 2015 – HTW Dresden
Business Analytics
Forschungs- und Kooperationsprojekte
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Pattern Recognition
(im Management)
Pattern Recognition
(in der Produktion)
Pattern Recognition ist die Fähigkeit, in
einer Menge von Daten Regelmäßigkeiten, Wiederholungen, Ähnlichkeiten
oder Gesetzmäßigkeiten zu erkennen.
Pattern Recognition ist die Fähigkeit, in
einer Menge von Daten Regelmäßigkeiten, Wiederholungen, Ähnlichkeiten
oder Gesetzmäßigkeiten zu erkennen.
Dabei stehen im Management vor allem
unterstützende, nicht-wertschöpfende
Prozesse im Fokus.
Dabei stehen in der Produktion vor allem
wertschöpfende Prozesse im Fokus, die
allerdings durch eine extrem hohe
Datendichte charakterisiert sind.
• Business Analytics im Property
Management: Verwaltungskostenprognose im Property Management für
Gewerbeimmobilien (infor AG)
• Financial lnformation Harvesting:
Informationsextraktion aus OnlineDatenbanken zur Unterstützung des
Risikomanagements (Dresdner Bank)
• Fraud Detection: Vorhersage der
Betrugsabsicht im Online-Vertrieb
(Weltbild GmbH)
• Role Mining: Administration von
Nutzerdaten in IT-Systemen
(Völcker Informatik AG)
Blog Mining Qualitätssicherung
Microblogging Reporting Opinion Mining
Fraud Detection
Weblogs
Revenue
Management Pattern Recognition
• Process Quality Mining:
Qualitätssicherung von Produktionsprozessen mit Hilfe von Data Mining
(Advanced Mask Technology Center)
• Entwicklung von Methoden zur
Datenaufbereitung und -analyse im
Qualitätsmanagement (Litronic GmbH)
Web Mining Business Analytics
OLAP Data Mining Employer Branding
Web Intelligence Social Network
Business Analytics ist eine Form der Datenauswertung zur strategischen Unternehmenssteuerung bzw. zur Steuerung von Geschäftsprozessen, bei der nicht nur Massendaten gesammelt, sondern auch … aufbereitet und ausgewertet werden. Davenport, Harris 2007,
Business Analytics – Seite 18
Datenbank-Stammtisch 2015 – HTW Dresden
Web Intelligence
Forschungsprojekte
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Opinion Mining
Employer Branding
Mit Hilfe des Opinion Mining werden in
(Online-)Texten wiedergegebene
Meinungen extrahiert.
Employer Branding ist eine unternehmensstrategische Maßnahme, bei der
Konzepte aus dem Marketing, insb. der
Markenbildung, angewandt werden, um
das Unternehmen als attraktiven
Arbeitgeber darzustellen und gegenüber
Wettbewerbern zu positionieren.
So können sich Unternehmen einen
Überblick darüber verschaffen, wie ihre
Produkte und Dienstleistungen von den
Kunden (auch im Sinne eines Benchmarking mit Konkurrenten) wahrgenommen werden.
Das Ergebnis ist die Arbeitgebermarke,
Employer Brand, das vom Unternehmen
gezielt gestaltete Image, als attraktiver
Arbeitgeber wahrgenommen zu werden.
• Web-Kundenbarometer:
Exploration der Kundenstimmung
durch Analyse von Meinungsäußerungen im Web
• Beobachtung der Akzeptanz neu
eingeführter Produkte oder Dienstleistungen
• Identifikation von Meinungsführern
in sozialen Netzwerken für den zielgerichteten Einsatz von Marketingmaßnahmen
Blog Mining Qualitätssicherung
Microblogging Reporting Opinion
Fraud Detection
Weblogs
Mining
Revenue
Management Pattern Recognition
Web Mining Business Analytics
OLAP Data Mining Employer
• Employer Branding Analytics:
Branding Aktivitäten deutscher Daxund M-Dax-Unternehmen in Microblogs wie Twitter
• Erfolgsfaktoren des Employer
Branding in sozialen Netzwerken als
Teil der Recruiting-Strategie von
Unternehmen
Branding
Web Intelligence Social Network
Der Begriff Web Intelligence bündelt Strategien und Technologien zur Optimierung der Online-Wertschöpfung im Unternehmen. Die
gezielte Erfassung und Analyse von Nutzungsdaten sowie deren Korrelation mit weiteren betriebswirtschaftlichen Daten und
Kennzahlen ermöglicht u.a. geringere Akquisitionskosten, Umsatzsteigerungen, verbesserte Kundenbindung und höheren ROI.
Business Analytics – Seite 19
Datenbank-Stammtisch 2015 – HTW Dresden
Business Intelligence und Industrie 4.0
Forschungs- und Kooperationsprojekte
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Herausforderungen der BI im
Kontext von Industrie 4.0
In einer Smart Factory steuern, regulieren und
gestalten die Beschäftigten die intelligent
vernetzten Produktionsressourcen und
Produktionsschritte nach situativen und
kontextabhängigen Zielvorgaben. Die Nutzung von
Prozessdaten sowie dem menschlichen
Erfahrungswissen wird zum
wettbewerbsrelevanten Faktor.
Dabei stehen vor allem folgende
Leitanbieterperspektiven und Handlungsbedarfe im
Fokus:
• Methoden und Beispielapplikationen im
Bereich der automatisierungstechnischen
Modellierung und Systemoptimierung
mittels Data Mining (Identifikation von
Erklärungs- und Planungsmodellen zur
Komplexitätsbeherrschung)
Forschungsprojekte & Kooperationen
• Unterstützung der Beschäftigten in der
Produktion (Nachvollziehbarkeit von
Ereignissen und Entscheidungen, Auslegung
von Regulierungsfunktionen)
• Berechnung und Bewertung der End-to-EndPerformance (Prozessleistung und deren
Einflussgrößen)
Business Analytics – Seite 20
Datenbank-Stammtisch 2015 – HTW Dresden
Business Intelligence und Industrie 4.0
Forschungs- und Kooperationsprojekte
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Forschungsschwerpunkte
Process Data Intelligence
Integration von Six Sigma und Data Mining
ProcessPerformance-DataWarehouse
Process Data Intelligence: Ziel ist die
Beherrschung von komplexen, datenintensiven
Produktionsprozessen durch den Aufbau von
Erklärungsmodellen zur Integration einer
intelligenten Steuerung sowie als
Informationsbedarfsanalyse für analytische IS.
• Identifikation von Erklärungsmodellen in
komplexen Prozessen: Die Integration von
Methodenfragmenten aus dem Six-SigmaDMAIC und dem Data Mining ermöglicht die
Identifikation von Steuerungs-, Einflussgrößen
und deren Ursache-Wirkungsbeziehungen.
Dabei wird sowohl das menschliche
Erfahrungswissen, als auch das Wissen
innerhalb von Prozessdaten verwendet.
• Integration von Entscheidungs- und
Prognosemodellen: Identifizierte Modelle
werden steuerungswirksam in den Prozess
integriert und stellen die Prozessverbesserung
dar.
Process-Performance-Data-Warehouse
Ziel ist die Schaffung eines industriellen Assistenzsystems zur
taktischen Steuerung von industriellen Prozessen.
• Überführung der Erklärungsmodelle in ein analytisches
Informationssystem: Auf Basis des erzeugten
Erklärungsmodells erfolgt eine modellgestützte
Transformation in ein prozessorientiertes PerformanceData-Warehouse.
Business Analytics – Seite 21
Datenbank-Stammtisch 2015 – HTW Dresden
Business Intelligence und Industrie 4.0
Forschungs- und Kooperationsprojekte
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Process Data Intelligence
Pattern Recognition ist die Fähigkeit, in
einer Menge von Daten Regelmäßigkeiten, Wiederholungen, Ähnlichkeiten
oder Gesetzmäßigkeiten zu erkennen.
Dabei stehen im Management vor allem
unterstützende, nicht-wertschöpfende
Prozesse im Fokus.
• Six Sigma: Verwaltungskostenprognose im Property Management für
Gewerbeimmobilien (infor AG)
Business Analytics – Seite 22
Datenbank-Stammtisch 2015 – HTW Dresden
Working Capital Management
Forschungsprojekte
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Ziel dieses Projektes ist die Erstellung eines softwaregestützten Beratungsansatzes für das
Process Performance Measurement (PPM) im Bereich Working Capital Management.
Das Working Capital Management
(WCM) als unternehmensinterner und
damit nahezu vom Markt unabhängiger
Ansatz zur Liquiditäts- und
Rentabilitätssteigerung ist in den letzten
Jahren, v.a. im Zusammenhang mit
einem volatilen Finanzumfeld und
restriktiver Kreditvergabe, verstärkt in den
Fokus vieler Unternehmen und Studien
gerückt
Entsprechend der Komponenten des Working Capital stehen drei zu optimierende
Geschäftsprozesse im Fokus:
Working Capital definiert als:
Ziel der Optimierung ist u.a. eine Verkürzung der Kapitalbindung.
• die Reduzierung der Vorratsbestandshöhen und Verkürzung ihrer Lagerdauer im
Forecast-to-Fulfill-Prozess (Spitzenkennzahl DIO),
• die Beschleunigung von Kundenanzahlungen bzw. Verkürzung von
Forderungsaußenstandszeiten im Order-to-Cash-Prozess (Spitzenkennzahl DSO)
sowie
• die zeitliche Verschiebung eigener Zahlungsabgänge an Lieferanten in die Zukunft im
Purchase-to-Pay-Prozess (Spitzenkennzahl DPO).
• das durch die operative
Geschäftstätigkeit gebundene
Umlaufvermögen
• dessen Positionen nicht zinstragend
sind und
• daher durch verzinsliches Kapital zu
finanzieren ist.
Quelle: Controlling Portal , http://www.controllingportal.de/Fachinfo/Grundlagen/Working-Capital-Management-alsInstrument-des-Finanzcontrolling.html, Abruf am 14.10.2014
Business Analytics – Seite 23
Datenbank-Stammtisch 2015 – HTW Dresden
Business Intelligence Research
Wissenstransfer – Kooperationen
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Gründungen zum Wissenstransfer
Competence Center
for Business Intelligence
• Bündelung von Kompetenzen an der Fakultät
und innerhalb der Universität
• Wahrnehmung in der Öffentlichkeit, Plattform zum
Austausch von Wirtschaft und Wissenschaft
• Gründung am 01. September 2008
• Organisation von Workshops, Kolloquien und
Praxisvorträgen
Verein
Business Intelligence Research e. V.
• Unterstützung von Forschung und Lehre zur BI
• Wahrnehmung in der nationalen Öffentlichkeit,
Plattform zum Austausch von Wirtschaft und
Wissenschaft
• Gründung am 12. Dezember 2008
• Organisation von Workshops
Business Analytics – Seite 24
Datenbank-Stammtisch 2015 – HTW Dresden
Business Intelligence Research e.V.
Internet via bi-research.de
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Gründungsmitglieder
Prof. Dr. Andreas Hilbert, TUD
Christian Langmayr, Microstrategy
Erwin Mertens, Microstrategy
Alexander E. Müller, TUD
Tilman Prang, T-Systems MMS
Karoline Schönbrunn, TUD
Stefan Sommer, T-Systems MMS
Dr. Tobias von Martens, Altran
Joachim Weber
Kooperationsvertrag mit Microstrategy
Xing-Gruppe „Business Intelligence Research“ mit ca. 100 Mitgliedern
Business Analytics – Seite 25
Datenbank-Stammtisch 2015 – HTW Dresden
Competence Center for Business Intelligence
Internet via bi.wiwi.tu-dresden.de
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business Analytics – Seite 26
Datenbank-Stammtisch 2015 – HTW Dresden
Business Intelligence Research
Internet via bi.wiwi.tu-dresden.de
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business Analytics – Seite 27
Datenbank-Stammtisch 2015 – HTW Dresden
Business Intelligence Research
Kontakt via Facebook
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business Analytics – Seite 28
Datenbank-Stammtisch 2015 – HTW Dresden
Fakultät Wirtschaftswissenschaften Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business Analytics
Knowledge Discovery in Databases
Prof. Dr. Andreas Hilbert
Andreas.Hilbert@TU-Dresden.de
http://wiid.wiwi.tu-dresden.de
01062 Dresden
Telefon
Telefax
+49 351 463-32268
+49 351 463-32736
Business Analytics
Definition
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business analytics (BA) refers to the
•
skills,
•
technologies,
•
practices
for
•
continuous iterative exploration and investigation
•
of past business performance
•
to gain insight and drive business planning.
Quelle: Beller, MJ; Barnett A (2009): Next Generation Business Analytics. Lightship Partners LLC
http://www.docstoc.com/docs/7486045/Next-Generation-Business-Analytics-Presentation
Business Analytics – Seite 30
Datenbank-Stammtisch 2015 – HTW Dresden
Business Analytics
Definition und Interpretation
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Quelle: Beller, MJ; Barnett A (2009): Next Generation Business Analytics. Lightship Partners LLC
http://www.docstoc.com/docs/7486045/Next-Generation-Business-Analytics-Presentation
Business Analytics – Seite 31
Datenbank-Stammtisch 2015 – HTW Dresden
Business Intelligence vs. Business Analytics
Abgrenzung
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business analytics focuses
• on developing new insights and understanding of business performance
• based on data and [complex] statistical methods.
• can answer questions like why is this happening, what if these trends
continue, what will happen next (that is, predict), what is the best that can
happen (that is, optimize).
In contrast, business intelligence traditionally focuses
• on using a consistent set of metrics
• to both measure past performance and guide business planning,
• which is also based on data and [simple] statistical methods.
• can answer questions such as what happened, how many, how often, where
the problem is, and what actions are needed.
Quelle: http://en.wikipedia.org/wiki/Business_analytics
Business Analytics – Seite 32
Datenbank-Stammtisch 2015 – HTW Dresden
Business Analytics
Statistische Analysen
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
• Business analytics makes extensive use of statistical analysis, including
explanatory and predictive modeling, …
• Typische Analysen sind:
–
Descriptive Analytics:
Gain insight from historical data with reporting, scorecards, clustering etc.
–
Predictive analytics
predictive modeling using statistical and machine learning techniques
–
Prescriptive analytics
recommend decisions using optimization, simulation etc.
Prescriptive Analytics extends
beyond predictive analytics by
specifying both the actions
necessary to achieve predicted
outcomes, and the interrelated
effects of each decision
Quelle: http://en.wikipedia.org/wiki/Business_analytics, http://en.wikipedia.org/wiki/Prescriptive_analytics
Business Analytics – Seite 33
Datenbank-Stammtisch 2015 – HTW Dresden
Data Mining
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Data Mining – ein Bild aus dem Bergbau
• Mining: Maschineller Abbau und Aufbereitung riesiger
Gesteinsmengen mit großem technologischen Aufwand, um
Edelmetalle und Edelsteine zu fördern.
http://djitz.com
• Data Mining: Maschinelle Aufbereitung riesiger Datenmengen mit
anspruchsvollen, automatisierten
Methoden, um neue, gesicherte und
handlungsrelevanten Muster zu
fördern.
http://pinterest.com
Business Analytics – Seite 34
Datenbank-Stammtisch 2015 – HTW Dresden
Data Mining
Definition und Einordnung
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
• „Data Mining is the process of extracting previously unknown, valid, and
actionable information from large databases and then using the information to
make crucial business decisions.“ (Cabena, et al. 1997)
• „Data Mining, as we use the term, is the exploration and analysis, by automatic
or semiautomatic means, of large quantities of data in order to discover
meaningful patterns and rules.“ (Berry et al. 1997)
• „Data Mining is the step in the KDD process consisting of particular data mining
algorithms that, under some acceptable computational efficiency limitations,
produces a particular enumeration of pattern Ej over F (where Ej is an expression
and F is an set of facts).“ (Fayyad, U.M. et al. 1996)
„Knowledge discovery in databases is the non-trivial process of identifying valid,
novel, potential useful, and ultimately understandable patterns in data.“ (Fayyad,
U.M. et al. 1996)
Business Analytics – Seite 35
Datenbank-Stammtisch 2015 – HTW Dresden
Knowledge Discovery in Databases
Definition
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
• KDD (Knowledge Discovery in Databases) „bezeichnet den nichttrivialen Prozess
der Identifikation valider, neuartiger, potentiell nützlicher und klar verständlicher
Muster in Daten.“
• Data Mining „ist ein Teilschritt des KDD-Prozesses, der aus Algorithmen besteht,
die in akzeptabler Rechenzeit aus einer vorgegebenen Datenbasis eine Menge
von Mustern liefern.“
90%
10%
Quelle: KDD-Prozess-Modell nach FAYYAD ET AL. (1996), S. 9
Business Analytics – Seite 36
Datenbank-Stammtisch 2015 – HTW Dresden
Knowledge Discovery in Databases
vs. Data Mining
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
• Grundsätzlich ist Data Mining die Suche nach bestimmten Mustern in
Datensätzen.
• Eindeutige Definition des Begriffes fehlt, da es sich mehr um eine Ganzheit von
Methoden und Anwendungen handelt:
– Data Mining i.e.S.: Zusammenstellung von Algorithmen, die eine
analytische und statistische Analyse von einer großen Datenbasis
durchführt.
– Data Mining i.w.S.: Anwendung, die alle Tools enthält, die dem
Anwender helfen seine Daten zu analysieren und zu verstehen
• Manche Autoren verwenden auch die Begriffe Knowledge discovery in
databases (KDD) für das Data Mining i.w.S., während Data Mining (DM) auch
als Data Mining i.e.S. gesehen wird
Business Analytics – Seite 37
Datenbank-Stammtisch 2015 – HTW Dresden
Vorgehensmodelle
SEMMA im Überblick
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
http://www.sas.com
Business Analytics – Seite 38
Datenbank-Stammtisch 2015 – HTW Dresden
Vorgehensmodelle
CRISP-DM im Überblick
Cross Industry Standard Process for Data Mining
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
http://www.crisp-dm.org/
Business Analytics – Seite 39
Datenbank-Stammtisch 2015 – HTW Dresden
CRISP-DM
Business Understanding
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business
Understanding
Determine
Business
Objectives
Data
Understanding
Background
Data
Preparation
Business
Objectives
Business understanding
Modeling
Evaluation
Deployment
Business
Success
Criteria
This initial phase focuses on understanding the project objectives and
Accessrequirements from a
business perspective,
then converting
this
Requirements,
Inventory of
Risk and
Costs and
Situation
Assumptions
Terminology
Resources
Contingencies
Benefits
knowledge
into a data
mining problem
definition and a preliminary
& Constraints
plan designed to achieve the objectives.
Determine
Data Mining
Goals
Produce
Project
Plan
Data Mining
Goals
Data Mining
Success
Criteria
Project Plan
Initial
Assessment
of Tools and
Techniques
Quelle: CRISP-DM 1.0, SPSS Handbuch
Business Analytics – Seite 40
Datenbank-Stammtisch 2015 – HTW Dresden
CRISP-DM
Data Understanding
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business
Understanding
Collect
Initial
Data
Data
Understanding
Data
Preparation
Modeling
Evaluation
Deployment
Initial Data
Collection
Report
Data understanding
The data understanding phase starts with an initial data collection and
Describe
proceeds with
Data activities in order to get familiar with the data, to
Data
Description
identify data
quality problems, to discover first insights into the data
Report
or to detect interesting subsets to form hypotheses for hidden
Exploreinformation.
Data
Data
Verify
Data
Quality
Business Analytics – Seite 41
Exploration
Report
Data
Quality
Report
Datenbank-Stammtisch 2015 – HTW Dresden
CRISP-DM
Data Preparation
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business
Understanding
Data
Understanding
Data Set
Data
Preparation
Modeling
Evaluation
Deployment
Data Set
Description
Select
Data
Rational for
Data preparation
Inclusion /
Exclusion
The data preparation
phase covers all activities to construct the final
Clean dataset (data
Datathat will be fed into the modelling tool(s)) from the initial
Data
Cleaning
Report
raw data. Data
preparation tasks are likely to be performed multiple
times and not in any prescribed order. Tasks include table, record and
Construct
Derived
Generated
Data
Attributes
attribute selection
as Records
well as transformation and cleaning of data for
modeling tools.
Integrate
Data
Format
Data
Business Analytics – Seite 42
Merged
Data
Reformatted
Data
Datenbank-Stammtisch 2015 – HTW Dresden
CRISP-DM
Modeling
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business
Understanding
Select
Modeling
Technique
Data
Understanding
Data
Preparation
Modeling
Modeling
Parameter
Settings
Models
Model
Assessment
Revised
Parameter
Settings
Modeling
Evaluation
Deployment
Assumptions
ModelingTechnique
In this phase, various modelling techniques are selected and applied
and their parameters are calibrated to optimal values. Typically, there
Generate
Test are several Test
techniques for the same data mining problem type. Some
Design
techniquesDesign
have specific requirements on the form of data. Therefore,
stepping back to the data preparation phase is often necessary.
Build
Model
Assess
Model
Business Analytics – Seite 43
Model
Description
Datenbank-Stammtisch 2015 – HTW Dresden
CRISP-DM
Evaluation
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business
Understanding
Evaluate
Results
Data
Understanding
Assessment of
Data Mining
Results
Evaluation
Data
Preparation
Modeling
Evaluation
Deployment
Approved
Models
At this stage in the project you have built a mode! (or models) that
Reviewappears to have high quality from a data analysis perspective. Before
Review of
Process
proceedingProcess
to final deployment of the model, it is important to more
thoroughly evaluate the model and review the steps executed to
Determine
construct the
List ofmodel to be certain it properly achieves the business
Next Steps
Possible
Decision
objectives.Actions
A key objective is to determine if there is some important
business issue that has not been sufficiently considered. At the end
of this phase, a decision on the use of the data mining results should
be reached.
Business Analytics – Seite 44
Datenbank-Stammtisch 2015 – HTW Dresden
CRISP-DM
Deployment
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business
Understanding
Plan
Deployment
Data
Understanding
Data
Preparation
Modeling
Evaluation
Deployment
Deployment
Deployment
Plan
Creation of the model is generally not the end of the project. Even if
Plan the purpose of the model is to increase knowledge of the data, the
Monitoring
Monitoring
gained will need to be organized and presented in a way
And knowledge and
Maintenance
Maintenance
Plan
that the customer
can use it. lt often involves applying “live“ models
within an organization‘s decision making processes, for example in
Produce
of Web pages or repeated scoring of
Final real-time personalization
Final
Final
Report
marketing Report
databases.Presentation
However, depending on the requirements, the
deployment phase can be as simple as generating a report or as
Reviewcomplex as implementing a repeatable data mining process across
Experience
Project
Documentation
the enterprise.
Business Analytics – Seite 45
Datenbank-Stammtisch 2015 – HTW Dresden
CRISP-DM
Zusammenfassung
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business Analytics – Seite 46
Datenbank-Stammtisch 2015 – HTW Dresden
Data Mining
Domänenübergreifende Datenanalysemethoden
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Quellen: in Anlehnung an KÜSTERS (2001), S. 95 ff.; MEYER (2002)
Business Analytics – Seite 47
Datenbank-Stammtisch 2015 – HTW Dresden
Data Mining
Lehre in Deutschland
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Prof. Daniel Keim, Uni Konstanz
Dr. Johannes Steinmüller (ehemals Prof. Dilger), TU Chemnitz
Prof. Michael Berthold , Uni Konstanz
Dr. Thomas Seidl, RWTH Aachen
Prof. Stefan Wrobel, Uni Bonn
Prof. Rudolf Kruse , Uni Magdeburg
Informatik
Prof. Stefan Kramer , TU München
Prof. Frank Klawonn, FH Braunschweig
Prof. Katharina Morik, Uni Dortmund
Prof. Javier Esparza , TU München
Prof. Klemens Böhm, Uni Karlsruhe
Prof. Hans-Peter Kriegel, Uni München
Prof. Günther Palm, Uni Ulm
Prof. Harald Kosch, Uni Passau
Prof. Ralph Bergmann, Uni Trier
Prof. Frank Puppe, Uni Würzburg
Prof. Carsten Felden, TU Freiberg
Prof. Hans-Georg Kemper, Uni Stuttgart
Prof. Hans-Joachim Lenz, FU Berlin
Prof. Günther Palm, Uni Ulm
Prof. Klaus Wilde, KU Eichstätt
Betriebswirtschaft
Wirtschaftsinformatik
Prof. Ulrich Küsters, KU Eichstätt
Prof. Reinhold Decker, Uni Bielefeld
Prof. Gholamreza Nakhaeizadeh, Uni Karlsruhe
Prof. Peter Chamoni, Uni Duisburg
Prof. Manfred Schwaiger, Uni München
Prof. Rainer Thomé, Uni Würzburg
Prof. Heinz Lother Grob, Uni Münster
Prof. Myra Spiliopoulou, Uni Magdeburg
Prof. Andreas Hilbert, TU Dresden
Prof. Johannes Ruhland, Uni Jena
Prof. Rudi Studer, Uni Karlsruhe
Prof. Ralph Bergmann, Uni Trier
Prof. Dirk C. Mattfeld, TU Braunschweig
Statistik und
Mathematik
Prof. Peter Gluchowski, TU Chemnitz
Prof. Antony Unwin, Uni Augsburg
Prof. Robert Klein, Uni Augsburg
Prof. Alfred Ultsch, Uni Marburg
Prof. Rolf-Dieter Reiss, Uni Siegen
Quelle: aufbauend auf MEYER (2002)
Business Analytics – Seite 48
Datenbank-Stammtisch 2015 – HTW Dresden
Gartner’s Magic Quadrant
for Business Intelligence and Analytics Platforms – Software
Quelle: Gartner 2015
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business Analytics – Seite 49
Ausgewählte Angebote
Datenbank-Stammtisch 2015 – HTW Dresden
Einsatzbereiche
Erfolgreicher Einsatz von Data Mining nach Branchen 2005
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Quelle: in Anlehnung an http://www.kdnuggets.com/polls/2005/successful_data_mining_applications.htm
Business Analytics – Seite 50
Datenbank-Stammtisch 2015 – HTW Dresden
Einsatzbereiche
Erfolgreicher Einsatz von Data Mining nach Branchen 2012
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Quelle: in Anlehnung an http://www.kdnuggets.com/polls/2014/industries-applied-analytics-data-mining-data-science.html
Business Analytics – Seite 51
Datenbank-Stammtisch 2015 – HTW Dresden
Einsatzbereiche
Erfolgreicher Einsatz von Data Mining nach Branchen 2014
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Quelle: in Anlehnung an http://www.kdnuggets.com/polls/2014/industries-applied-analytics-data-mining-data-science.html
Business Analytics – Seite 52
Datenbank-Stammtisch 2015 – HTW Dresden
Fakultät Wirtschaftswissenschaften Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business Analytics
Methodenüberblick
Prof. Dr. Andreas Hilbert
Andreas.Hilbert@TU-Dresden.de
http://wiid.wiwi.tu-dresden.de
01062 Dresden
Telefon
Telefax
+49 351 463-32268
+49 351 463-32736
Data Mining
Methodenüberblick
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Data Mining
Problemtyp
Beschreibungsprobleme
Prognoseprobleme
Deskription
Klassifikation
Abweichungsanalyse
(Wirkungs-)Prognose
Assoziation
Segmentierung
Business Analytics – Seite 54
Datenbank-Stammtisch 2015 – HTW Dresden
Methodenüberblick
Klassifikation und Identifikation
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
• Aufgabe ist es, von einer Menge von p Variablen {x1, x2,..., xp} auf die
Klassenzugehörigkeit c{1,...,C} eines Objektes zu schließen.
• Typisches Beispiel: Beim Kredit-Scoring soll mit Hilfe von z.B. mtl. Einkommen,
Familienstand, Beruf etc. auf die Kreditwürdigkeit geschlossen werden.
• Häufig wird diese Aufgabe auch als Identifikation bezeichnet, wobei dann
zugleich auch die Prognose als Verfahrensvariante zu nennen ist.
• Typische Verfahren sind

Logistische Regression

Entscheidungsbaum-Verfahren

Künstliche Neuronale Netze

Support Vector Machines
Business Analytics – Seite 55
Datenbank-Stammtisch 2015 – HTW Dresden
Methodenüberblick
Regression und Prognose
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
• Modellierung von Abhängigkeitsbeziehungen zwischen (i.A.) einer
abhängigen Variablen yi und einer Menge unabhängiger Variablen {xi1, xi2,..., xip}.
• Dabei wird die Beziehung durch den Parametervektor B beschrieben und ist
üblicherweise mit einem Fehler i behaftet (yi =f(xi1, xi2,..., xip, , i)).
• Geschätzte Beziehung kann für erklärende und prognostische Zwecke
eingesetzt werden:
–
Bei Zeitreihen variiert der Beobachtungsindex über die Zeit; bei autoprojektiven
Verfahren werden die abhängigen Variablen yi-1, yi-2,... als verzögerte Regressoren
anstelle der unabhängigen Variablen eingesetzt.
–
Querschnittsuntersuchungen dienen der Aufdeckung von Zusammenhangsstrukturen zwischen den Variablen.
• Typische Verfahren sind

(Nichtlineare) Regression

Künstliche Neuronale Netze
Business Analytics – Seite 56
Datenbank-Stammtisch 2015 – HTW Dresden
Klassifikation
Arten von Diskriminanzfunktionen im Zwei-Klassen-Fall
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Diskriminierung durch unterschiedliche Funktionen Y = f(X1, X2, ..., Xm)
Nearest
Neighbor
Rekursive
Zerlegung (Rules)
Lineare
Funktionen
Nicht-lineare
Funktionen
Business Analytics – Seite 57
Datenbank-Stammtisch 2015 – HTW Dresden
Methodenüberblick
Clusterbildung und Segmentierung
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
• Im Gegensatz zur Klassifikation steht die Klassenzugehörigkeit der Objekte nicht
im vorhinein fest. Aufgabe ist vielmehr die Bildung von Klassen, die in sich
möglichst homogen und untereinander heterogen sind.
• Formal findet eine Zerlegung des Wertebereichs X1 ...  Xp von p Variablen
{x1, x2,..., xp} in C (in der Regel) nicht überlappende Regionen {R1, R2,..., RC} statt.
• Besonderheit der sog. Fuzzy-Clusteranalyse ist, dass Regionen {R1, R2,..., RC}
ermittelt werden, die gemeinsame, nichtleere Schnittmengen aufweisen können.
• Typisches Beispiel: Kundensegmentierung auf der Basis von
sozioökonomischen Merkmalen, Verhaltensmustern, Einstellungsmerkmalen.
Business Analytics – Seite 58
Datenbank-Stammtisch 2015 – HTW Dresden
Methodenüberblick
Clusterbildung und Segmentierung – Ziele der Clusteranalyse
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
• Die Segmentierung oder Clusteranalyse dient der Zusammenfassung
von Objekten und/oder Merkmalen zu Klassen oder Gruppen, so dass

zwischen den Elementen derselben Klassen größtmögliche
Ähnlichkeit,

zwischen den Elementen unterschiedlicher Klassen
größtmögliche Verschiedenheit
erreicht wird.
• Die Cluster sind vorher nicht
bekannt.
• Einsatz finden z.B. sog. unüberwachte Lernverfahren wie

Quick-Cluster-Algorithmus

kMeans-Algorithmus

SO(F)M

…
Business Analytics – Seite 59
Datenbank-Stammtisch 2015 – HTW Dresden
Data Mining
Gemäß Wikipedia im Mai 2009 – damals „Verfahren“
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Quelle: http://de.wikipedia.org/wiki/Data_Mining, Abruf am 10. Mai 2009
Business Analytics – Seite 60
Datenbank-Stammtisch 2015 – HTW Dresden
Data Mining
Gemäß Wikipedia im März 2015 – heute „Aufgabenstellungen“
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Quelle: http://de.wikipedia.org/wiki/Data-Mining, Abruf am 17. März 2015
Business Analytics – Seite 61
Datenbank-Stammtisch 2015 – HTW Dresden
Klassifikationen
… wohin das Auge schaut
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Quelle: Broschüre SAS® Enterprise Miner™ Software, SAS Institute GmbH
Business Analytics – Seite 62
Datenbank-Stammtisch 2015 – HTW Dresden
Fakultät Wirtschaftswissenschaften Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business Analytics
Meinungen und Trends
Predictive Analytics for Business Advantage
Prof. Dr. Andreas Hilbert
Andreas.Hilbert@TU-Dresden.de
http://wiid.wiwi.tu-dresden.de
01062 Dresden
Telefon
Telefax
+49 351 463-32268
+49 351 463-32736
Research Methodology and Demographics
Country and Position
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Reference: Fern Halper: Predictive Analytics for Business
Advantage. TDWI Best Practice Report. TDWI Research,
First Quarter, 2014.
United States
Europe
Asia
Canada
Australia
Central or South America
Africa
Middle East
0% 10% 20% 30% 40% 50%
Position
Business Sponsors/users
Consultants
Corporate IT professionals
0%
20% 40% 60% 80%
Based on 373 survey respondents
Business Analytics – Seite 64
Datenbank-Stammtisch 2015 – HTW Dresden
Research Methodology and Demographics
Company
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Company Size by Revenue
Less than $100 million
$100-500 million
$500 million-$1 billion
$1-10 billion
More than $10 billion
Unable to disclose
Don't know
0%
5% 10% 15% 20% 25%
Based on 373 survey respondents
Business Analytics – Seite 65
Datenbank-Stammtisch 2015 – HTW Dresden
Predictive Analytics
A Technology whose time has come
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Drivers for Predictive Analytics
Predict trends
3,95
Understand customers
3,93
Improve business performance
3,89
Drive strategic decision making
3,85
Predict behavior
3,85
Drive operational efficiency
3,78
Provide targeted products and services
3,74
Identify new business opportunities
3,73
Improve productivity
3,62
Identify risks
3,61
Faster response to business change
3,50
Competitive differentiator
3,48
Reduce fraud
3,14
1
Based on 329 survey respondents
Business Analytics – Seite 66
2
3
4
5
1 = extremely unimportant … 3 = neither nor … 5 = extremely important
Datenbank-Stammtisch 2015 – HTW Dresden
Use Cases for Predictive Analytics
What is predictive analytics used for in your company?
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Direct marketing
58%
Cross-sell/upsell/propensity to spend
55%
Retention analysis
55%
Portfolio analysis/prediction
47%
Optimization
46%
Risk analysis
13%
21%
Fraud detection
Quality assurance
Scientific investigation
Loan default
15%
0%
10%
20%
50%
21%
29%
45%
40%
19%
27%
35%
30%
14%
32%
16%
9%
14%
21%
28%
20%
8%
17%
31%
24%
12%
15%
26%
19%
11%
18%
31%
30%
8%
17%
23%
34%
9%
16%
17%
43%
Econometric forecasting
20%
31%
60%
70%
Using today and will keep using
Will use within 3 years
No plans
N/A or don't know
80%
90%
100%
Based on 126 active respondents
Business Analytics – Seite 67
Datenbank-Stammtisch 2015 – HTW Dresden
Use Cases for Predictive Analytics
Where is predictive analytics used in your company?
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Marketing and/or market analysis
64%
Sales
24%
54%
Executive management
20%
49%
Customer service and support
25%
46%
Finance
27%
39%
Operations management
37%
IT, network, or computer management
30%
Engineering/R&D/scientific research
29%
Online presence /social media
26%
Product development/life cycle management
25%
Manufacturing/supply chain
HR
0%
10%
16%
11%
17%
17%
25%
17%
30%
11%
29%
17%
25%
29%
27%
12%
26%
36%
22%
20%
15%
17%
30%
17%
11%
18%
28%
15%
15%
26%
35%
19%
6% 6%
19%
30%
36%
40%
50%
25%
60%
Using today and will keep using
Will use within 3 years
No plans
N/A or don't know
70%
80%
90% 100%
Based on 126 active respondents
Business Analytics – Seite 68
Datenbank-Stammtisch 2015 – HTW Dresden
Data, Data, Data
What kind of data do you use for predictive analytics?
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Structured data (from tables, records)
98%
Demographic data
2%
77%
Times series data
11% 6% 6%
65%
14%
11%
10%
Web log data
37%
33%
21%
9%
Geospatial data
35%
37%
16%
12%
Clickstream data from websites
32%
Real-time event data
31%
Internal text data (i.e. from e-mails, call center notes,
claims, etc.)
31%
External social media text data
29%
40%
19%
0%
14%
20%
45%
21%
Machine-generated data (e.g., RFID, sensor, etc.)
25%
18%
44%
22%
9%
25%
38%
6%
10%
21%
10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Using today and will keep using
Will use within 3 years
No plans
N/A or don't know
Based on 126 active respondents
Business Analytics – Seite 69
Datenbank-Stammtisch 2015 – HTW Dresden
Current Value
Which statement best describes the value you‘ve seen from your PA efforts?
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
We have measured positive top- and bottom-line impact
We have measured top-line impact only
We believe that we have besome more effective, but…
We have measured a cost reduction olny
We believe that we have become more efficient, but…
We have gained more insight
0%
5%
10% 15% 20% 25% 30% 35% 40%
Based on 126 active respondents
Business Analytics – Seite 70
Datenbank-Stammtisch 2015 – HTW Dresden
User Skills and Delivery Models
Say Hello to the Business User
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Who in your organization (or company) is using
predictive analytics to actually build models?
Statistician/data scientist
Business analyst
IT developers
External partner
Other business user
Casual user
0%
10%
20%
30%
40%
50%
60%
70%
80%
Based on 126 active respondents
Business Analytics – Seite 71
Datenbank-Stammtisch 2015 – HTW Dresden
User Skills and Delivery Models
Get Ready for a Different Skill Set
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
To what extent do you believe the following skills are necessary to
perform predictive analytics?
Knowledge of the business
Critical thinking
Knowledge and understanding of the source data and…
Training in predictive analytics
Communication skills
Degree in statistics, math, or other quantitative discipline
Training on the software
0%
10% 20% 30% 40% 50% 60% 70% 80%
Based on 330 respondents
Business Analytics – Seite 72
Datenbank-Stammtisch 2015 – HTW Dresden
User Skills and Delivery Models
Get Ready for a Different Skill Set
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
In the near future, who do you expect will be using predictive
analytics tools in your company?
Business analyst
Statistician/data scientist
Other business user
IT developers
External partners
Casual users
Customers
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
Based on 126 active respondents
Business Analytics – Seite 73
Datenbank-Stammtisch 2015 – HTW Dresden
User Skills and Delivery Models
Operationalizing Predictive Analytics
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Which statement best describes how predictive analytics is
deployed in your organization?
It is used by statisticians/data scientists and business
analysts to develop models for decision making
Models are built by statisticians or other internal staff and
then operationalized as part of a business process
Statisticians/data scientists develop the models and then
analysts and other business users interact with them
Models are built by external partners and then
operationalized as part of a business process
Models are built by external partners and then utilized for
decision making
0%
5%
10% 15% 20% 25% 30% 35% 40%
Based on 126 active respondents
Business Analytics – Seite 74
Datenbank-Stammtisch 2015 – HTW Dresden
Tools, Techniques, an Processes
Top Techniques
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
47%
Linear regression
59%
57%
57%
Decision trees
40%
Cluster analysis
51%
45%
47%
Time series models
28%
30%
Logistic regression
7%
Other regression
17%
18%
16%
Neural networks
11%
12%
10%
11%
Association rule learning
Naive Bayes
2%
Support vector machines
Survival analysis
Ensemble learning
0%
6%
7%
5%
6%
5%
10%
20%
Investigating
30%
40%
50%
60%
Active
Based on 126 respondents in the active group and 195 in the investigating group.
Business Analytics – Seite 75
Datenbank-Stammtisch 2015 – HTW Dresden
Key Features and Processes Supporting PA
How important are the following currently to your predictive analytics efforts?
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
4,46
4,42
Data integration
3,94
Operationalizing it
4,29
4,17
Ease of use
3,65
Model management
3,99
4,06
3,98
Bata governance
3,80
3,86
Accessibility to all analysts
In-database analytics
3,70
3,69
Analytic sandboxes
3,70
3,69
3,58
3,53
In-Memory analytics
3,18
3,03
Text analytics
Open source analytics
2,83
Mobile delivery
2,82
Public cloud services
0,00
4,18
2,56
1,00
2,00
Investigating
3,13
3,13
2,82
3,00
4,00
5,00
Active
Based on 126 respondents in the active group and 195 in the investigating group.
Business Analytics – Seite 76
Datenbank-Stammtisch 2015 – HTW Dresden
Infrastructure for Predictive Analysis
What infrastructure do you have in place predictive analytics?
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Data warehouse/data marts
89%
Desktop application only
7% 1%
3%
78%
Flat files on servers
1%
75%
An analytics platform
4%
55%
Appliance
28%
41%
Hadoop
21%
26%
Public cloud
18%
0%
10%
20%
30%
50%
60%
6%
8%
14%
38%
40%
15%
17%
25%
29%
6%
9%
21%
35%
15%
15%
70%
Using today and will keep using
Will use within 3 years
No plans
N/A or don't know
80%
90%
100%
Based on 126 active respondents
Business Analytics – Seite 77
Datenbank-Stammtisch 2015 – HTW Dresden
Fakultät Wirtschaftswissenschaften Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business Analytics
Herausforderungen
Prof. Dr. Andreas Hilbert
Andreas.Hilbert@TU-Dresden.de
http://wiid.wiwi.tu-dresden.de
01062 Dresden
Telefon
Telefax
+49 351 463-32268
+49 351 463-32736
Business Analytics
Ist Modeling die ganze Kunst?
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business Analytics – Seite 79
Datenbank-Stammtisch 2015 – HTW Dresden
Business Analytics
Was bedeutet Evaluation?
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business Analytics – Seite 80
Datenbank-Stammtisch 2015 – HTW Dresden
Business Analytics
Weitere Herausforderungen
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business Analytics – Seite 81
Datenbank-Stammtisch 2015 – HTW Dresden
Herausforderung
Business Understanding
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business Analytics – Seite 82
Datenbank-Stammtisch 2015 – HTW Dresden
Herausforderung
Business Understanding – CHURN, FRAUD und Co.
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Kündigungsprävention: Von der Analyse bis zur betrieblichen Umsetzung
Im Rahmen eines systematischen Kundenmanagements besteht bezüglich der
großen Bedeutung einer „Kündigungsprävention“ (CHURN) Konsens. In der
betrieblichen Praxis erweist sich ihre Umsetzung jedoch schwierig – aus zwei
Hauptgründen:
1. Es fehlen häufig Instrumente, um eine „Kündigungsgefahr“ im Bestand überhaupt
„treffsicher“ erkennen zu können (-> Data Mining auf vergangenen Bestandsdaten,
Klassifikation der aktuellen Bestandsdaten)
2. Die Bearbeitung von „Kündigungsgefährdeten“ wird als Service-Aufgabe gesehen,
die nicht unmittelbar zu „mehr“ Umsatz führt, gleichwohl sofort Ressourcen bindet:
Damit fehlt die vertriebliche Akzeptanz (-> Deployment; es müssen Anreize
geschaffen werden)
Dabei bleiben aber auch andere Fragen offen: Sollen die „Hoch-Gefährdeten“
bedient werden; oder sind diese bereits verloren und man sollte sich eher auf die
noch „Bekehrbaren“ konzentrieren. Dann bleibt die Frage, was identifiziert werden
soll: Die Kündigungswahrscheinlichkeit oder die „Turn“-Wahrscheinlichkeit.
Business Analytics – Seite 83
Datenbank-Stammtisch 2015 – HTW Dresden
Herausforderung
Business Understanding
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business Analytics – Seite 84
Datenbank-Stammtisch 2015 – HTW Dresden
Herausforderung
Business Understanding – Community Mining
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Semantic Tag Clustering
Die Nutzer der Business Network Plattform Xing
tragen in ihrem Profil Tags zur Beschreibung ihrer beruflichen Fähigkeiten und Interesse ein.
Diese Information stellen neben den standardisierten Informationen wie bspw. „Alter“ und
„Dauer der XING-Mitgliedschaft“ ein enormes Potential an Information dar.
Besonders relevant sind dabei semantische Zusammenhänge zwischen unterschiedlichen
Tags, bspw. zwischen BI und Data Mining. Auf Basis dieser
Zusammenhänge lassen sich Cluster von semantischen
zusammengehörigen Tags bilden. Diese Tag-Cluster wiederum
bilden unter anderem die Grundlage für innovative
Recommendation-Features.
Business Analytics – Seite 85
Datenbank-Stammtisch 2015 – HTW Dresden
Herausforderung
Business Understanding – Adaptive Data Mining
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Adaptive Kampagnensteuerung
Damit analytische Auswertungen mit der zunehmenden Automatisierung von Geschäftsprozessen Schritt halten können, empfiehlt sich für diverse Aufgabenstellungen eine
Einbettung in operative Anwendungssysteme.
Dieser Idee folgend wurde bei Cortal Consors eine dynamische Komponente in das
Kampagnenmanagementsystem integriert, die periodisch Kundenreaktionen auf CrossSelling-Angebote auswertet und damit Scoring-Modelle verfeinert, die wiederum zur
Selektion der Kundenkontakte für Angebote dienen. So entstand ein
selbstlernendes System, das in einer prototypischen
Implementierung seit 2008 operativ läuft.
Business Analytics – Seite 86
Datenbank-Stammtisch 2015 – HTW Dresden
Herausforderung
Business Understanding – Revenue Management
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business Analytics – Seite 87
Datenbank-Stammtisch 2015 – HTW Dresden
Herausforderung
Data Understanding
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business Analytics – Seite 88
Datenbank-Stammtisch 2015 – HTW Dresden
Herausforderung
Data Understanding – Weblogs: Definition
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Weblogs:
Weblogs
Corporate Blogs
Public Relations
chronologisch dargestellt
• Einträge sind einzeln über
URLs adressierbar
Information
• Inhalte werden umgekehrt
Externe Blogs
Marktkommunikation
Interne
Kommunikation
Service Blogs
Knowledge
Blogs
Kampagnen
Blogs
• Kommentare zu jedem
untereinander
Blogosphäre:
Die Gesamtheit aller Weblogs
Business Analytics – Seite 89
Persuasion
• Starke Verlinkung
CEO Blogs
Argumentation
Eintrag möglich
Produkt Blogs
Customer
Relationship
Blogs
Krisen-Blogs
Kollaborations-Blogs
Meinungsmacher Blogs
Wahrnehmung in der Öffentlichkeit
• Regelmäßige Updates
Social
Network
Blogs
Blogs im
Nebel
Datenbank-Stammtisch 2015 – HTW Dresden
Herausforderung
Data Understanding – Weblogs: Aufbau und Beispiel
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business Analytics – Seite 90
Datenbank-Stammtisch 2015 – HTW Dresden
Herausforderung
Data Preparation
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business Analytics – Seite 91
Datenbank-Stammtisch 2015 – HTW Dresden
Herausforderung
Data Preparation – Zeitreihen
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
• Zeitreihenanalyse im Rahmen von Datamining gefragtes Forschungsgebiet
–
Besondere Handhabung von Zeitreihen notwendig
–
Viele Ergebnisse von Publikationen schwer verallgemeinerbar
–
Evaluation und Anwendung unterschiedlicher Ansätze auf Industriedaten
• Problem: Bislang manuelle Analysen von Daten des Ätzprozesses um
Instabilitäten in der Linie zu analysieren
–
Annahme: Zeitreihendaten des Ätzens korrelieren mit Qualität einer Maske
–
Verstärkung bzw. Rückweisung der Annahme erhöht Prozessverständnis
–
Erweitertes Verständnis dieser Zusammenhänge könnte Anwendung von FDC (Fault
Detection and Classification) ermöglichen
Business Analytics – Seite 92
Datenbank-Stammtisch 2015 – HTW Dresden
Herausforderung
Data Preparation – Zeitreihen: Datenvorverarbeitung
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
• Aufwand für Datenvorverarbeitung oft unterschätzt
• Vorverarbeitung von Zeitreihen
–
Missing Value Analysis (Autokorrelation, Interpolation, Zeitreihenmerkmal…)
–
Ausreißer und Datenrauschen (visuelle Erkennung…)
–
Normalisierung (Überführung der Wertebereiche auf vorgegebenen Bereich)
–
Diskretisierung (Anzahl der Merkmalsausprägungen verringern)
–
Datenreduktion (PCA, Fourier Transformation, Wavelet Transformation…)
• Verringerung der Redundanz und Erhöhung der Verständlichkeit
• Vorhersagemodelle aufbauend auf einzelnen Zeitreihencharakteristiken
Business Analytics – Seite 93
Datenbank-Stammtisch 2015 – HTW Dresden
Herausforderung
Data Preparation – Zeitreihen: Datenvorverarbeitung: PCA & Fourier-Transformation
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
• Hauptkomponentenanalyse (PCA)
– Hauptkomponenten = Linearkombinationen der Objektattribute
– Hauptkomponenten stehen senkrecht aufeinander
– Ersten k Hauptkomponenten genügen zur Repräsentation der Objekte
– Kritik:
• Hauptkomponenten schwer interpretierbar
• Keine Berücksichtigung der Reihenfolge der Attribute (Zeitverlauf)
• Die Fourier-Transformation
– Überführung der Daten von Zeitraum in Frequenzraum
– Darstellung der Zeitreihe mit Hilfe von Sinus- und Kosinuskurven
– Erfassung globaler Eigenschaften
– Windowed Fourier Transform  Erfassung lokaler Eigenschaften möglich
– Verwendung der k ersten oder k größten Fourierkoeffizienten zur
Repräsentation der Objekte
Business Analytics – Seite 94
Datenbank-Stammtisch 2015 – HTW Dresden
Business Analytics
Ist Modeling die ganze Kunst? NEIN
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business Analytics – Seite 95
Datenbank-Stammtisch 2015 – HTW Dresden
Fakultät Wirtschaftswissenschaften Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Business Analytics
Ausblick
Prof. Dr. Andreas Hilbert
Andreas.Hilbert@TU-Dresden.de
http://wiid.wiwi.tu-dresden.de
01062 Dresden
Telefon
Telefax
+49 351 463-32268
+49 351 463-32736
Ausblick
TU Dresden Lehrstuhl für Wirtschaftsinformatik – Business Intelligence Research
Es gibt viel zu tun,
packen wir‘s an.
Process Mining
Web Mining
Text Mining
Data Mining
Statistik
Business Analytics – Seite 97
Image Mining
Music Mining
Multimedia Mining
Community Mining
Link Mining
Distributed Data Mining
Data Mining as a Service
Adaptive Data Mining
Datenbank-Stammtisch 2015 – HTW Dresden