Hazard-Raten-Modelle und ihr Anwendungspotenzial bei der Berechnung des Customer Lifetime Value
Zusammenfassung
Bedingt durch gesättigte Märkte und hohe Wettbewerbsintensität übersteigen bspw. die Kosten zur Gewinnung neuer Kunden die Kosten zur Bindung oft um ein Vielfaches.
Es findet sich in der Literatur eine Fülle an Methoden, die zur Berechnung des Kundenwerts angewandt werden können Besonders im Bereich des Customer Relationship Management (CRM) hat sich das Modell des Customer Lifetime Value (CLV) in Bezug auf die mehrdimensionalen Ansätze als ein dominierendes Konstrukt der Kundenwertberechnung erwiesen. Da der CLV in den letzten Jahren zunehmend an Bedeutung gewann, soll seine Kalkulation mit Hilfe von Hazard-Raten-Modellen im Rahmen dieser Studie intensiv betrachtet werden.
Leseprobe
Inhaltsverzeichnis
2.1 Konzeption des CLV-Ansatzes
Grundsätzlich ist der CLV-Ansatz ein Berechnungsverfahren, das die Prinzipien der dynamischen Investitionsrechnung auf Kundenbeziehungen überträgt. Generell sind hier zwei Berechnungsformen möglich, die sich einzig durch den Referenzzeitpunkt unterscheiden: Der Potential CLV und der Present CLV. Der Potential CLV entspricht in seiner Grundstruktur dem Deckungsbeitragspotenzial eines Kunden. Hierbei werden die Zahlungsströme ohne Berücksichtigung eines Referenzzeitpunktes kumuliert. Der ermittelte Wert zeigt auf, welchen potenziellen Gewinn/Deckungsbeitrag ein Kunde für das Unternehmen während seiner gesamten Lebenszeit aufweist (Bruhn et al. 2000, S. 171).
Abbildung in dieser Leseprobe nicht enthalten
Formel 1: Potential CLV
(Quelle: Eigene Darstellung, in Anlehnung an Krafft 2007, S. 234)
Der Present CLV entspricht dem CLV im engeren Sinne und ist die Basis der meisten CLV-Berechnungen. Mittels Diskontierung (Abzinsung) der Zahlungsströme wird der gegenwärtige Wert eines Kunden ermittelt (Simon 2005, S. 47). Diese Vorgehensweise beruht auf dem Prinzip, dass zukünftige Zahlungen weniger wert sind als gegenwärtige (Homburg/Daum 1997, S. 100). Der Gegenwartswert eines Kunden ist insofern von Interesse, da die gesamten strategischen Entscheidungen nur auf Basis des aktuellen Wertes getroffen werden können (Bruhn et al. 2000, S. 169; Bruhn 2009, S. 219f.).
Abbildung in dieser Leseprobe nicht enthalten
Formel 2: Present CLV
(Quelle: Eigene Darstellung, in Anlehnung an Eberling 2002, S. 179)
Die Differenz zwischen Ein- und Auszahlungen in einer Periode wird als Netto-Cash-Flow (NFC) bezeichnet. Wird der Kapitalwert auf den Beginn des Planungszeitraumes bezogen, stellen die jeweils auf Abbildung in dieser Leseprobe nicht enthalten abgezinsten zukünftigen Ein- und Auszahlungen Barwerte dar (Englbrecht 2007, S. 107).
Eine Erweiterung des Present CLV stellt der CLV mit Retention-Rate dar. Die Retention-Rate ist die Kundenbindungsrate oder Wiederkaufwahrscheinlichkeit. Sie entspricht der Wahrscheinlichkeit, dass die Geschäftsbeziehung in der jeweiligen Periode noch aktiv ist. Die Implementierung einer Retention-Rate basiert auf der Überlegung, dass bei der Ermittlung des Kundenwertes das Risiko der Beziehung bzw. die Unsicherheit der Beziehungserhaltung miteinbezogen werden sollte. Hierdurch erhöht sich die Aussagekraft des CLV dramatisch (Jackson 1985, S. 18; Bruhn et al. 2000, S. 170-173).
Abbildung in dieser Leseprobe nicht enthalten
Formel 3: Present CLV mit Retention-Rate
(Quelle: Eigene Darstellung, in Anlehnung an Englbrecht 2007, S. 142)
Aufgrund der Annahme, dass eine Abwanderung (Nicht-Kauf in einer Periode) endgültig ist, muss bei der CLV-Berechnung der Nettoerlös jeweils mit der kumulierten Retention-Rate multipliziert werden (Englbrecht 2007, S. 121).
Ausgehend von einer Unterscheidung von Märkten anhand des Always-a-share-Modells auf der einen Seite und des Lost-for-good-Modells (Jackson 1985, S. 122-124) auf der anderen Seite, kann diese Beziehungsunsicherheit in einem Migration-Modell oder einem Retention-Modell konzeptionalisiert werden (Dwyer 1997, S. 8-13). Auf die beiden letztgenannten Modelle wird im Unterabschnitt 3.2 noch ausführlicher eingegangen.
2.2 Determinanten des CLV
Der CLV wird aus Wert- und Zeitkomponenten berechnet (Bruhn et al. 2004, S. 439). Die Wertkomponenten setzen sich aus den laufenden Ein- und Auszahlungen zusammen. Beobachtungszeitraum und die Periodenlänge stellen die Zeitkomponenten dar. Der Zinssatz zur Diskontierung wird sowohl als Wertkomponente als auch als Zeitkomponente aufgefasst (Rust et al. 2000, S. 38).
2.2.1 Zahlungsströme (Cash-Flow)
Es existieren verschiedene Schemata zur Ermittlung des investitionsrechnerisch geprägten Cash-Flows. Meistens besteht der überwiegende Teil des Cash-Flows aus Einzahlungen aus Kundenbeziehungen. Diese Mittel sind primär dazu bestimmt, die durch die Leistungserstellung bedingten Auszahlungen zu decken. In der Regel sind dies Auszahlungen für Personal und Material (Barth/Wille 2000, S. 35). Die übrigen Mittel können zum Aufbau neuer und zum Ausbau bestehender Kundenbeziehungen eingesetzt werden. Der resultierende Wert wird als Netto-Cash-Flow (NFC) bezeichnet (Englbrecht 2007, S. 115).
2.2.2 Kalkulationszinssatz
Der Kalkulationszinssatz ist der auf die Periode bezogene Zinssatz, mit dem sämtliche Zahlungen auf den Bezugszeitpunkt abgezinst werden. Hierdurch lassen sich im Kapitalwertmodell Investitionsalternativen vergleichbar machen. Dabei müssen entstehende Finanzierungskosten (Kapitalkosten) berücksichtigt werden, da diese nicht in den Nettozahlungen enthalten sind. Der Fremdkapitalkostensatz kann aus der tatsächlichen Zinsbelastung relativ einfach bestimmt werden. Den Eigenkapitalkostensatz determiniert die entgangene Verzinsung bei einer risikoadäquaten Alternativanlage (Opportunitätskosten des Eigenkapitaleinsatzes). Durch eine Erhöhung des Kalkulationszinssatzes sinkt demnach ceteris paribus der CLV (Englbrecht 2007, S. 116).
Generell werden die Angaben zur Bestimmung eines risikoangepassten Kalkulationszinsfußes in der CRM-Literatur sehr allgemein gehalten und thematisieren diese Problematik kaum. Laut Dwyer (1997, S. 10), Berger und Nasr (1998, S. 20ff.), und Bruhn et al. (2000a, S. 172) werden in numerischen Beispielen zur Vereinfachung meist Zinssätze von 10%-20% verwendet.
2.2.3 Periodenlänge
Die Einteilung diskreter Perioden ist Voraussetzung für die Diskontierung und gestattet die Erfassung unterschiedlicher Zahlungsströme im Zeitverlauf. Zur Festlegung der Periodenlänge ist der durchschnittliche Verlauf der Kundenbeziehung in Abhängigkeit der Branche bzw. des Produktes zu berücksichtigen. Für eine Lebensversicherung bspw. dürfte eine Periode von einem Jahr angemessen sein, da sich in diesem Zeitraum Ein- und Auszahlungen nicht ändern. Für einen Mobilfunkanbieter jedoch ist dieser Zeitraum wahrscheinlich zu lang. Abhängig von der Periodenlänge ist auch die Abbildung bestimmter Effekte. Saisoneffekte werden z.B. bei einer Periodenlänge von einem Jahr nicht sichtbar. Empfehlenswert ist daher, mehrere Modellvarianten zu testen und zu vergleichen. In der Literatur wird meist eine Periodenlänge von einem Jahr verwendet (Berger/Nasr 1998, S. 19; Englbrecht 2007, S. 114).
2.2.4 Beziehungsdauer
Um den CLV im eigentlichen Wortsinn als Kundenlebenszeitwert berechnen zu können, muss der Zeithorizont des CLV möglichst korrekt bestimmt werden. Es gilt die Dauer der Kundenbeziehung ex ante zu schätzen, bzw. die Kundenbindungswahrscheinlichkeit (Retention-Rate) zu ermitteln (Englbrecht 2007, S. 110). In der Praxis werden dazu meist grobe Schätzungen auf der Basis vergangenheitsbezogener Durchschnitts- oder Segmentwerte vorgenommen. Für eine hinreichend valide Prognose der individuellen Kundenlebenszeit bieten sich allerdings neuere, theoretisch anspruchsvollere Methoden an, wie z.B. Hazard-Raten-Modelle oder NBD/Pareto-Modelle. Sie beziehen sich dabei jeweils auf spezifische Gegebenheiten von vertraglichen und nichtvertraglichen Geschäftsverhältnissen (Simon 2005, S. 53ff.).
3 Anwendungspotenzial von Hazard-Raten-Modellen bei der CLV-Analyse
3.1 Schätzung der Beziehungsdauer bei vertraglicher Bindung
Sind Käufer und Verkäufer durch einen Vertrag für gewisse Zeit aneinander gebunden, wie es etwa in der Finanzdienstleistungs- oder Telekommunikationsbranche der Fall ist, lässt sich die Kundenbeziehungsdauer gut mit Hilfe von Hazard-Raten- bzw. Survival-Modellen prognostizieren (Krafft/Rutsatz 2006, S. 275). Diese gehören zur Gruppe der Ereignisanalysen (Simon 2005, S. 53). Aufgrund ihrer Verteilungsannahmen erfordern diese Ansätze lediglich Informationen über den ersten und letzten Kauf, die sich bei vertraglichen Geschäftsbeziehungen leicht feststellen lassen (Litfin 2000, S. 64; Simon 2005, S. 57).
Bestehen keine vertraglichen Bindungen zwischen Unternehmen und Kunden, wie etwa beim Versandhandel oder auf dem Pharmamarkt, ist die Anwendung von Hazard-Raten-Modellen problematisch, da die einzelnen Kaufepisoden nicht einwandfrei bestimmt werden können. Daher empfiehlt sich insbesondere das NBD/Pareto-Modell als Ansatz zur Bestimmung der Kundenlebenszeit (Englbrecht 2007, S. 114). Dieses ist der Gruppe der Count-Data-Modelle zuzuordnen (Simon 2005, S. 58). Das auf Schmittlein, Morrison und Colombo (1987) zurückgehende Verfahren berechnet auf Basis historischer Transaktionsdaten zunächst die Wahrscheinlichkeit, dass ein Kunde in der Geschäftsbeziehung mit dem Unternehmen noch aktiv ist. Die kundenindividuelle Wahrscheinlichkeit des „Überlebens“ wird als Abbildung in dieser Leseprobe nicht enthalten bezeichnet (Jain/Singh 2002, S. 40). Darauf aufbauend kann dann in einem zweiten Schritt die Kundenlebenszeit geschätzt werden (Krafft 2007, S. 114). Eine ausführlichere Darstellung des NBD/Pareto-Modells folgt in Unterabschnitt 5.2.1.
3.2 Kundenbeziehungstypen: Lost-for-good vs. Always-a-share
Parallel zu der Frage nach einer vertraglichen Geschäftsbeziehung findet sich in der Literatur eine weitere Unterscheidung hinsichtlich der Anwendbarkeit verschiedener Modelltypen. Hierbei unterschied Jackson (1985) erstmals zwei Arten von Kundenbeziehungstypen: Die Lost-for-good-Kunden und die Always-a-share-Kunden (Jackson 1985, S. 13ff.). Bei verschiedenen Marktformen lassen sich die beiden Modelle als die beiden Extrema eines Spektrums differenzieren (Jackson 1985, S. 122; Dwyer 1997, S. 8; Berger/Nasr 1998, S. 19; Bruhn et al. 2000, S. 168).
Das Lost-for-good-Modell nimmt an, dass ein Kunde entweder total an ein Unternehmen gebunden, oder endgültig („lost for good“) verloren und an einen anderen Anbieter gebunden ist (Jackson 1985, S. 13f.; Berger/Nasr 1998, S. 19). Diese Kunden haben aufgrund hoher Wechselkosten in der Regel langfristige Bindungen (Commitments). Meist suchen derartige Kunden bei ihrem Unternehmen die Lösung eines komplexeren Problems (Dwyer 1997, S. 8). Das Lost-for-good-Modell spiegelt daher eine Kundenbeziehung mit schwer austauschbaren, differenzierten Leistungen wider (Bruhn et al. 2000, S. 168), wie es z.B. bei einer Versicherung der Fall wäre.
Auf der anderen Seite steht das Always-a-share-Modell, das auf Märkte mit leicht austauschbaren Leistungen anwendbar ist. Das Verhältnis zwischen Anbieter und Nachfrager ist nicht auf eine langfristige Kundenbeziehung ausgelegt, sondern bezieht sich hauptsächlich auf die nächste Transaktion (Bruhn et al. 2000, S. 168). Im Gegensatz zum Lost-for-good-Modell kann der Kunde leicht mit neuen Anbietern experimentieren, da die Wechselkosten in der Regel sehr gering sind (Jackson 1985, S. 14; Berger/Nasr 1998, S. 19). Der Kunde hat somit die Möglichkeit bei jedem Anbieter einen Teil seines Kaufvolumens zu decken („always a share“) (Jackson 1985, S. 15). Daher ist ein solcher Kunde auch sehr viel preissensibler und empfänglicher im Bezug auf Werbung (Dwyer 1997, S. 8). Ein gutes Beispiel hierfür wäre der Einkauf in einem Supermarkt.
Dwyer griff 1997 die Klassifizierung von Jackson auf und entwickelte auf dieser Basis zwei Grundmodelle zur Berechnung des CLV, nämlich das Customer-Retention-Modell und das Customer-Migration-Modell (Dwyer 1997, S. 9ff.; Berger/Nasr 1998, S. 19; Englbrecht 2007, S. 121).
Das Customer-Migration-Modell lehnt sich an das Always-a-share-Modell an. Die Anwendungsbereiche umfassen kurzlebige Verbrauchsgüter (z.B. Büromaterial) oder Dienstleistungen ohne lange vertragliche Bindung (Versandhandel, Reisen etc.) (Dwyer 1997, S. 8).
Das Migration-Modell verzichtet auf die Dichotomisierung in Kunde und Nicht-Kunde. Die Verwendung von Kaufwahrscheinlichkeiten anstelle von Bindungsraten ermöglicht es, Kunden auch dann weiterhin im Modell zu erfassen, wenn in einer oder mehreren Perioden keine Erlöse erzielt wurden. Dazu erfolgt eine Segmentaufteilung. Hierzu klassifiziert Dwyer (1997) die Kunden nach dem Zeitpunkt des letzten Kaufs (Recency), der nach empirischen Untersuchungen maßgeblichen Einfluss auf das zukünftige Kaufverhalten hat (Dwyer 1997, S. 11). Die Wahrscheinlichkeit einer erneuten Berücksichtigung des Unternehmens durch den Kunden ist umso geringer, je länger der vorherige Kauf zurückliegt (Bruhn et al. 2000, S. 173f.). Die Kunden wandern mit einer bestimmten Wahrscheinlichkeit zwischen den sogenannten „Recency-Cells“. Darauf aufbauend wird ein Wahrscheinlichkeitsbaum aufgestellt, mit dessen Hilfe der Kundenwert in Form eines Erwartungswertes ermittelt wird (Bruhn et al. 2000, S. 174).
Im Kontrast dazu steht das Customer-Retention-Modell, welches sich auf die Lost-for-good-Situation bezieht. Typischerweise werden Retention-Modelle bei Kontraktgütern (u.a. Mobilfunk, Banken, Versicherungen, Zeitschriftenabonnement) oder langlebigen Gebrauchsgütern (z.B. Automobil, Computer) angewandt (Englbrecht 2007, S. 123).
3.3 Bestimmung der Retention-Rate im Lost-for-good-Szenario
Wie schon in Unterabschnitt 2.1 erläutert, wird im Retention-Modell die CLV-Formel im Lost-for-good-Szenario mit der Retention-Rate erweitert. Diese Wahrscheinlichkeit kann konstant oder dynamisch sein. Allerdings spiegelt eine Dynamisierung die Entwicklung des Kunden im Beziehungslebenszyklus wider und ist daher vorzuziehen (Wang/Splegel 1994, S. 75). Die Retention-Rate drückt die Wahrscheinlichkeit aus, mit der der Kunde bis zum nächsten Kauf beim Unternehmen bleibt, unter der Voraussetzung dass alle bisherigen Käufe bei diesem Unternehmen stattgefunden haben (Jackson 1985, S. 18). Deshalb kann sie nur Werte zwischen 0 (Beziehungsbeendigung) und 1 (sichere Beziehungsweiterführung) annehmen (Bruhn et al. 2000, S. 174).
Um eine dynamische Retention-Rate zu erzeugen, erweisen sich Hazard-Raten-Modelle als besonders effektiv. Denn durch Bestimmung der Survivorfunktion für einen bestimmten Kunden zu einem bestimmten Zeitpunkt erhält man ohne aufwendige Umformungen die Retention-Rate für die jeweilige Periode. Das bedeutet, der Wert der Survivorfunktion zu einem bestimmten Zeitpunkt entspricht der Retention-Rate. Diese kann dann ganz einfach in die bereits in 2.1 gezeigte CLV-Formel mit Retention-Rate eingesetzt werden. Wie genau sich die Survivorfunktion herleitet wird in Unterabschnitt 4.3 beschrieben.
4 Methodik der Hazard-Raten-Modelle
Ursprünglich wurden Hazard-Raten-Modelle in der Medizin genutzt, um Überlebensraten bei Krankheitsverläufen zu untersuchen (Cox/Oakes 1984; Klein/Moeschberger 1998; Simon 2005, S. 55). Später erlangten sie grundlegende Bedeutung in der Versicherungsmathematik, wo sie im Rahmen von Sterbetafeln (Life Tables), u.a. bei der Rentenberechnung Anwendung fanden (Kaplan/Meier 1958).
In den letzten Jahren entdeckten nun zunehmend auch die Wirtschafts- und Sozialwissenschaften Hazard-Raten-Modelle für sich (Blossfeld et al. 1986/1989; Litfin 2000; Hüppelshäuser et al. 2006), um mit Hilfe von neuen, leistungsstarken Statistikprogrammen Längsschnittdaten aus Prozess- und Verlaufsuntersuchungen zu analysieren (Blossfeld et al. 1986, S. 27; Blossfeld et al. 1989b, S. 213).
Hazard-Raten-Modelle werden im Allgemeinen als Ereignis- oder Verweildaueranalysen (Blossfeld et al. 1986) bezeichnet, im Englischen analog Event History Analysis (Allison 1984) oder in technischen Anwendungen, wie z.B. Gerätelaufzeiten, Analysis of Failure Time Data (Kalbfleisch/Prentice 2002).
Die typische Fragestellung ist meist die Zeitdauer bis zum Eintritt eines Ereignisses. Dieses Ereignis kann bspw. eine Abo-Kündigung oder die Adoption eines neuen Produktes sein (Garczorz 2004, Litfin 2000). Im speziellen Fall der Kundenwertberechnung interessiert jedoch in erster Linie die Dauer bis zum Ende der Kundenbeziehung. Da es bei nicht-vertraglichen Beziehungen schwer abzuschätzen ist, ab wann ein momentan inaktiver Kunde tatsächlich zu einem anderen Anbieter abgewandert ist, eignen sich Hazard-Analysen vorrangig für vertragliche Beziehungen. Hierbei wird der Abwanderungszeitpunkt ganz einfach durch die Kündigung des Kunden bestimmt. In diesem Kontext lässt sich mit Hilfe von Hazard-Raten zum einen ein geeigneter Betrachtungszeitraum festlegen, und zum anderen über den Umweg der Survivorfunktion die Retention-Rate bestimmen.
Allgemein formuliert untersuchen Hazard-Raten-Modelle die Länge der Zeitintervalle zwischen aufeinanderfolgenden Zustandswechseln. Sie informieren über die Zeitdauern bis zum Eintreten bestimmter Ereignisse und damit über die genauen Zeitpunkte bis zum einem Zustandswechsel. Die Ereignisse können zu beliebigen Zeitpunkten eintreten. Dabei unterstellen sie diskrete Zustände (z.B. entweder Kunde oder Nicht-Kunde) und stetige Zeit. Oft geht man dabei davon aus, dass die Zeitdauer bis zum Eintreten des Ereignisses einer spezifischen, stochastischen Verteilung folgt, auf die Einflussfaktoren hemmend oder beschleunigend einwirken können (Litfin 2000, S. 64).
Der englische Begriff „Hazard“ bedeutet soviel wie Gefahr oder Risiko. Krafft (2007, S. 158) bezeichnet die Hazard-Rate auch als Mortalitätsrate („Kundensterberate“).
Einfacher ausgedrückt und auf die CLV-Berechnung übertragen bedeutet das, dass Hazard-Raten-Modelle die Gefahr oder das Risiko bestimmen, dass ein Kunde, der die Geschäftsbeziehung bisher noch nicht beendet hat, diese im folgenden infinitesimal kleinen Zeitintervall beenden wird (Simon 2005, S. 56). „Überlebt“ ein Kunde den Zeitpunkt t jedoch, so gibt die Hazard-Rate Aufschluss über „den weiteren Verlauf“ der Beziehung (Blossfeld et al. 1989b, S. 219).
Als Besonderheit der Hazard-Raten-Modellen gegenüber anderen Verfahren, wie z.B. der Logistischen Regression, muss hervorgehoben werden, dass eben nicht nur der Zustand zu einem bestimmten Zeitpunkt, sondern zusätzlich auch noch die Zeitdauer bis zum Zustandswechsel wichtig ist. Diese Information ist von Bedeutung, da die Wahrscheinlichkeit, dass es zu einem Zustandswechsel (Kündigung/Beziehungsbeendigung) kommt, von der bereits vergangenen Verweildauer des Individuums in einem bestimmten Zustand (aktiver Kunde) abhängig ist. Die Hazard-Analyse kann diese funktionale Abhängigkeit von der Zeit explizit berücksichtigen (Garczorz 2004, S. 72).
Im Falle der CLV-Berechnung liegt der einfachste Fall der Ereignisanalyse vor, denn es handelt sich um einen Ein-Episodenfall (Blossfeld et al. 1986, S. 30; Blossfeld et al. 1989b, S 217f.). Als Episode wird der Zeitraum zwischen zwei Zuständen bezeichnet. Die Messung beginnt mit dem Anfangszustand (aktive Kundenbeziehung) und endet beim Erreichen des Endzustandes (Kündigung/Beziehungsbeendigung).
Generell aber bestechen Hazard-Raten-Modelle gegenüber anderen Verfahren durch zwei entscheidende Vorteile: Zum einen erlauben sie die Integration zeitveränderlicher Einflussgrößen, und zum anderen gelingt ihnen eine adäquate Erfassung der Zensierungsproblematik, ohne dass es zu Verzerrzungen der geschätzten Parameter und den daraus möglicherweise resultierenden fehlerhaften Implikationen kommt. (Blossfeld et al. 1989b, S. 213f.; Helsen/Schmittlein 1993, S. 399f.; Garczorz 2004, S. 71f.; Krafft/Rutsatz 2006, S. 275).
4.1 Zensierung und Trunkierung
Hazard-Raten-Modelle wurden entwickelt, um insbesondere den Zeitbezug von empirischen Fragestellungen zu analysieren. Im Fokus stehen also Zeitpunkte oder Zeiträume (Reimer/Barrot 2007, S. 294). Sollen bspw. Kundenwerte berechnet werden, so benötigt man für eine vollständige Beobachtung Startpunkt und Endpunkt der Kundenbeziehung. Startpunkt kann je nach Berechnungsmethode der Anfang der Kundenbeziehung oder der gegenwärtige Zeitpunkt sein. Endpunkt ist in jedem Fall die Kündigung bzw. die Beendigung der Kundenbeziehung. Allerdings ist es aus forschungsökonomischen Gründen häufig nicht möglich alle Beobachtungen vollständig zu messen. Es entstehen unvollständige Beobachtungen (Zensierung) oder Teile der Grundgesamtheit können gänzlich aus der Analyse herausfallen (Trunkierung) (Blossfeld/Rohwer 1995, S. 34; Klein/Moeschberger 1998, S. 55ff.). Sowohl Krafft (2007, S. 160f.), als auch Litfin (2000, S. 69f.) und Garczorz (2004, S. 88f.) vermischen die Begriffe Trunkierung und Zensierung. Diese Arbeit jedoch orientiert sich an den Begrifflichkeiten von Klein/Moeschberger (1998, S. 55ff.) und Reimer/Barrot (2007, S. 294).
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 1: Zensierung und Trunkierung
(Quelle: Reimer/Barrot 2007, S. 294)
In der vorliegenden Abbildung spricht man von Linkstrunkierung (D), wenn Kundenbeziehungen schon vor Beobachtungsbeginn beendet wurden, so dass sie in der Analyse keine Berücksichtigung finden. Rechtstrunkierung (E) hingegen bedeutet, dass die Individuen erst nach der Datenerhebung überhaupt zu Kunden wurden (Klein/Moeschberger 1998, S. 64). Unvollständige Beobachtungen lassen sich wiederum in zwei Arten gliedern. Wenn ein Zustandswechsel beim Objekt stattfindet, jedoch der Startzeitpunkt des Originalzustandes nicht bekannt ist, so spricht man von Linkszensierung (C) (Reimer/Barrot 2007, S. 294). Im Gegensatz dazu steht die Rechtszensierung (B), welche bedeutet, dass das Ereignis (Kündigung) des Untersuchungsgegenstandes erst nach Ende des Beobachtungszeitraums eintritt (Blossfeld et al. 1986, S. 72; Blossfeld et al. 1989a, S. 69). Übertragen auf den vorliegenden Fall heißt das, dass die betrachtete Person am Ende des Beobachtungsfensters immer noch Kunde ist.
In der Praxis umgeht man das Problem der Linkstrunkierung meist durch Definition des Startpunktes der Untersuchung als „absoluten Nullpunkt“, so dass alle Individuen zum Zeitpunkt t = 0 noch kein Ereignis (Kündigung) aufweisen. Gleichzeitig vermeidet man so eine Linkszensierung, da alle Verweildauern im Beobachtungszeitraum beginnen (Reimer/Barrot 2007, S. 294). Bei der CLV-Berechnung vereinfachen sich die Verhältnisse zusätzlich, da der CLV theoretisch zu jedem Zeitpunkt von jedem Kunden berechnet werden kann und der Beziehungsbeginn außerdem in vertraglichen Beziehungen immer genau festzustellen ist.
Eine Rechtszensierung ist per se nicht nachteilig, da die prognostische Stärke von Hazard-Modellen zu den besonders vorteilhaften Eigenschaften dieser Verfahren zählt. Würde das Beobachtungsfenster so weit ausgedehnt, dass selbst beim letzten Objekt das betrachtete Ereignis eingetreten ist, wäre eine Prognose nicht mehr möglich (Krafft 2007, S. 106f.). Eine Elimination rechtszensierter Daten ist außerdem nicht zu empfehlen, da sie zu potenziell verzerrten Schätzern führen kann (Blossfeld et al. 1986, S. 72; Helsen/Schmittlein 1993, S. 399ff.; Litfin 2000, S. 70). Daher sollten rechtszensierte Daten für die Überprüfung der prognostischen Validität von Hazard-Modellen genutzt werden. Dies geschieht, indem zu einem Zeitpunkt jenseits des Beobachtungsfensters überprüft wird, ob das prognostizierte Verhalten eingetreten ist (Litfin 2000, S. 279ff.). Zudem stellt die Kenntnis, dass bei einigen Objekten das Ereignis noch nicht, bzw. schon sehr früh eingetreten ist, eine wertvolle Information dar (Helsen/Schmittlein 1993, S. 396).
4.2 Systematisierung
Grundsätzlich lassen sich Hazard-Raten-Modelle in drei verschiedene Ansätze differenzieren. Nicht parametrische Modelle sind eher deskriptiver Natur während semi-parametrische und parametrische Modelle auch Kovariableneinflüsse berücksichtigen (Kalbfleisch/Prentice 2002).
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 2: Übersicht Hazard-Raten-Modelle
(Quelle: Reimer/Barrot 2007, S. 295, in Anlehnung an Hüppelshäuser et al.2006, S. 203)
4.3 Dichtefunktion, Verteilungsfunktion, Survivorfunktion und Hazard-Rate
Bei der Anwendung von Survivor-Modellen muss die Annahme erfüllt sein, dass der Zeitpunkt des Eintritts des Ereignisses (Abbruch der Kundenbeziehung) einem Zufallsprozess folgt (Litfin 2000, S. 65; Panzer 2003, S. 142; Krafft 2007, S. 157). Es handelt sich also um stochastische Prozesse mit stetiger Zeit und einer endlichen Anzahl von möglichen Endzuständen, wobei die verstrichene Zeitdauer als Episode bezeichnet wird (Garczorz 2004, S. 84).
Die Dauer der Episode wird im statistischen Modell durch eine nicht-negative Zufallsvariable Abbildung in dieser Leseprobe nicht enthalten repräsentiert (Blossfeld et al. 1986, S. 30; Litfin 2000, S. 64; Krafft 2007, S. 157).
Im weiteren Verlauf der Arbeit werden zusätzlich zeitkonstante und zeitvariierende Kovariablen der Kunden miteinbezogen, die mit dem Vektor Abbildung in dieser Leseprobe nicht enthalten erfasst werden (Krafft 2007, S.157).
Für die nachfolgenden Formeln gelten diese Größen:
Abbildung in dieser Leseprobe nicht enthalten
Nach Krafft (2007, S. 157) ergibt sich, dass der Zeitpunkt des Zustandswechsels für die Subjekte Abbildung in dieser Leseprobe nicht enthalten Abbildung in dieser Leseprobe nicht enthalten einer Zufallsvariablen mit einer bestimmten Wahrscheinlichkeitsfunktion entspricht. Die kumulierte Verteilungsfunktion der auch als Episodenlänge bezeichneten Variablen Abbildung in dieser Leseprobe nicht enthalten des Kunden Abbildung in dieser Leseprobe nicht enthalten Abbildung in dieser Leseprobe nicht enthalten, die durch Abbildung in dieser Leseprobe nicht enthalten gegeben ist, bezeichnet dabei die Wahrscheinlichkeit, dass das Individuum Abbildung in dieser Leseprobe nicht enthalten Abbildung in dieser Leseprobe nicht enthalten während des Beobachtungszeitraums Abbildung in dieser Leseprobe nicht enthaltenbei einer Episodenlänge von Abbildung in dieser Leseprobe nicht enthaltendie Geschäftsbeziehung abbricht. Anders ausgedrückt gibt die kumulierte Verteilungsfunktion Abbildung in dieser Leseprobe nicht enthalten die Wahrscheinlichkeit an, mit der zum Zeitpunkt Abbildung in dieser Leseprobe nicht enthalten die Kündigung beim i-ten Kunden eingetreten ist (Garczorz 2004, S. 85; Reimer/Barrot 2007, S. 296). Abbildung in dieser Leseprobe nicht enthalten ist dabei die Wahrscheinlichkeit, dass der Kunde Abbildung in dieser Leseprobe nicht enthalten Abbildung in dieser Leseprobe nicht enthalten innerhalb des Beobachtungsfensters inaktiv wird, bzw. kündigt. Die entsprechende Dichtefunktion ist durch Abbildung in dieser Leseprobe nicht enthalten gegeben. Diese gibt die Wahrscheinlichkeit an, dass die Kündigung in einem marginal kleinen Zeitintervall auftritt (Garczorz 2004, S. 85). Das Beobachtungsfenster hat die Länge Abbildung in dieser Leseprobe nicht enthalten.
Somit ergibt sich folgende Beziehung zwischen der kumulierten Verteilungsfunktion Abbildung in dieser Leseprobe nicht enthalten und der Dichtefunktion Abbildung in dieser Leseprobe nicht enthalten(Blossfeld et al. 1986, S. 31ff.; Panzer 2003, S. 142):
Abbildung in dieser Leseprobe nicht enthalten
Formel 4: Beziehung Dichtefunktion zu Verteilungsfunktion
(Quelle: Garczorz 2004, S. 85)
Intuitiv verständlicher und leichter zu interpretieren ist hingegen die Survivorfunktion Abbildung in dieser Leseprobe nicht enthalten. Sie stellt das Komplement zur Verteilungsfunktion Abbildung in dieser Leseprobe nicht enthaltendar. Die Survivorfunktion Abbildung in dieser Leseprobe nicht enthalten erfasst die Wahrscheinlichkeit, dass der Kunde Abbildung in dieser Leseprobe nicht enthalten den Zeitpunkt Abbildung in dieser Leseprobe nicht enthalten „erlebt“, also noch aktiv ist, nicht gekündigt hat und die Episode noch andauert (Blossfeld et al. 1986, S. 31; Blossfeld et al. 1989a, S. 31; Blossfeld et al. 1989b, S. 218; Klein/Moeschberger 1998, S. 21ff.; Panzer 2003, S. 142; Garczorz 2004, S. 85). Abbildung in dieser Leseprobe nicht enthalten hat demnach folgende Form:
Abbildung in dieser Leseprobe nicht enthalten
Formel 5: Survivorfunktion
(Quelle: Garczorz 2004, S. 85)
Unabhängig von der unterstellten Verteilung von Abbildung in dieser Leseprobe nicht enthalten werden in allen Survivorfunktionen über die Zeit monoton fallende Verläufe unterstellt. Dies erscheint logisch, da die Überlebenswahrscheinlichkeit mit der Zeit sinkt, bzw. mit fortschreitender Zeit immer mehr Kunden kündigen werden (Litfin 2000, S. 66). Zu Beginn des Beobachtungsfensters beträgt die Survivorfunktion 1, für Abbildung in dieser Leseprobe nicht enthalten konvergiert sie gegen 0 (Panzer 2003, S. 142; Krafft 2007, S. 158).
Die Survivorfunktion Abbildung in dieser Leseprobe nicht enthalten wird ebenfalls bei den in Unterabschnitt 4.1 angesprochenen rechtszensierten Daten angewandt, bei denen die Episode auch nach dem Beobachtungszeitraum noch andauert. Mit Hilfe der Survivorfunktion Abbildung in dieser Leseprobe nicht enthalten lässt sich in etwa bestimmen, wie lange eine Kundenbeziehung noch andauern wird. Um vollständige und zensierte Beobachtungen zusammenfassen zu können wird dann zur Berechnung ein Zensierungsindikator Abbildung in dieser Leseprobe nicht enthalten eingeführt (Garczorz 2004, S. 89). Im Rahmen dieser Arbeit wird allerdings auf die ausführliche Darstellung verzichtet.
Zusätzlich zur kumulierten Betrachtung der Wahrscheinlichkeiten des Bestehens einer Geschäftsbeziehung, interessiert besonders die Zustandsbestimmung zu einem beliebigen, konkreten Zeitpunkt Abbildung in dieser Leseprobe nicht enthalten. D.h. die Bestimmung des Risikos, dass ein bestimmter Kunde zu einem bestimmten Zeitpunkt die Geschäftsbeziehung beendet – vorausgesetzt, er hat das nicht bereits getan. Solche bedingten Wahrscheinlichkeiten sind nicht direkt beobachtbar, sondern werden über den Umweg der Hazard-Rate Abbildung in dieser Leseprobe nicht enthalten ermittelt (Panzer 2003, S. 143; Krafft 2007, S. 158).
Die Hazard-Rate wird von Diekmann und Mitter (1984, S. 39) als das zentrale Element der Ereignisanalyse angesehen. Sie veranschaulichen die Hazard-Rate als „Häufigkeit von Zustandswechseln in einem sehr kleinen Zeitintervall dividiert durch alle ‚Überlebenden’, d.h. die Kandidaten für einen Zustandswechsel […]“ (Diekmann/Mitter 1984, S. 42). Folgende Formel drückt dies aus:
Abbildung in dieser Leseprobe nicht enthalten
Formel 6: Hazard-Rate
(Quelle: Garczorz 2004, S. 86)
Eine äquivalente Darstellung ist gegeben durch:
Abbildung in dieser Leseprobe nicht enthalten
Formel 7: Äquivalente Darstellung der Hazard-Rate
(Quelle: Garczorz 2004, S. 86)
Die Darstellung in dieser Formel lässt sich folgendermaßen motivieren: Da T eine kontinuierliche Variable darstellt, ist die Wahrscheinlichkeit, dass eine Kündigung zu einem ganz bestimmten Zeitpunkt Abbildung in dieser Leseprobe nicht enthalten eintritt, infinitesimal klein (Allison 1984, S. 23). Deshalb wird nicht ein Zeitpunkt, sondern ein sehr kleines Zeitintervall Abbildung in dieser Leseprobe nicht enthalten bzw. Abbildung in dieser Leseprobe nicht enthalten betrachtet. Nach dieser Formulierung wäre es allerdings möglich die Kündigungswahrscheinlichkeit durch die Wahl eines genügend großen Abbildung in dieser Leseprobe nicht enthalten zu inflationieren. Denn dadurch würde das Intervall zu groß. Dies wird durch die Grenzwertbildung Abbildung in dieser Leseprobe nicht enthalten und durch Division der Wahrscheinlichkeit mit der Größe des Zeitraums (Abbildung in dieser Leseprobe nicht enthalten verhindert (Allison 1984, S. 23; Litfin 2000, S. 67; Panzer 2003, S. 143; Krafft 2007, S. 159).
Außerdem muss sichergestellt werden, dass ausschließlich Kunden betrachtet werden, welche noch nicht gekündigt haben. Denn es wäre sinnlos das Risiko des Eintretens des Ereignisses für das Zeitintervall Abbildung in dieser Leseprobe nicht enthalten anzugeben, wenn der Zustandswechsel bereits stattgefunden hätte.
Folglich kann die Hazard-Rate Abbildung in dieser Leseprobe nicht enthalten aufgefasst werden als Grenzwert der bedingten Wahrscheinlichkeit, dass das Ereignis „Kündigung“ bisher noch nicht stattgefunden hat Abbildung in dieser Leseprobe nicht enthalten, aber im folgenden infinitesimal kleinen Zeitintervall Abbildung in dieser Leseprobe nicht enthalten stattfinden wird (Blossfeld et al. 1986, S. 31; Blossfeld et al. 1989a, S. 31; Klein/Moeschberger 1998, S. 27ff.; Litfin 2000, S. 62f.; Garczorz 2004, S. 86; Simon 2005, S. 56; Reimer/Barrot 2007, S. 297).
Es ist zu bemerken, dass die Hazard-Rate Abbildung in dieser Leseprobe nicht enthalteneben keine Wahrscheinlichkeit, sondern eine bedingte Dichte ist. Daher kann sie auch Werte größer 1 annehmen. Nur für ein sehr kleines Abbildung in dieser Leseprobe nicht enthalten lässt sich die Hazard-Rate Abbildung in dieser Leseprobe nicht enthalten als Approximation der Übergangswahrscheinlichkeit interpretieren (Blossfeld et al. 1986, S. 32; Blossfeld et al. 1989b, S. 218).
Falls der i-te Kunde den Zeitpunkt Abbildung in dieser Leseprobe nicht enthalten jedoch „überlebt“, informiert die Hazard-Rate Abbildung in dieser Leseprobe nicht enthalten näherungsweise über den weiteren Verlauf der Eintrittswahrscheinlichkeiten des Ereignisses. Diese kann dabei sehr unterschiedliche Verläufe aufweisen (Blossfeld et al. 1986, S. 33; Blossfeld et al. 1989b, S. 219; Klein/Moeschberger 1998, S. 27). Die einzige Restriktion ist die Annahme nicht-negativer Hazard-Raten (Garczorz 2004, S. 87).
Hazard-Rate Abbildung in dieser Leseprobe nicht enthalten, Dichtefunktion Abbildung in dieser Leseprobe nicht enthalten, Survivorfunktion Abbildung in dieser Leseprobe nicht enthalten und Verteilungsfunktion Abbildung in dieser Leseprobe nicht enthalten sind also äquivalente Formen, um die kontinuierliche Wahrscheinlichkeitsverteilung einer Episodendauer zu beschreiben. Jede der eben genannten Formeln lässt sich aus jeder der genannten Formeln berechnen (Garczorz 2004, S. 87). Abbildung 3 gibt einen graphischen Überblick über die einzelnen Funktionen:
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 3: Beziehung von Dichte-, Verteilungs-, Survivorfunktion und Hazard-Rate
(Quelle: Reimer/Barrot 2007, S. 297)
Obgleich es für die vollständige Beschreibung dieses statistischen Problems ausreichen würde eine der oben genannten Funktionen zu berechnen, ist eine Unterscheidung sinnvoll, da jeweils andere Aspekte im Zentrum der Analyse, bzw. der Interpretation stehen. Im Allgemeinen gilt jedoch, dass die Hazard-Rate Abbildung in dieser Leseprobe nicht enthalten mathematisch einfacher zu handhaben (Blossfeld et al. 1989b, S. 220) und inhaltlich intuitiv verständlicher ist (Garczorz 2004, S. 88).
[...]
Details
- Seiten
- Erscheinungsform
- Erstausgabe
- Erscheinungsjahr
- 2010
- ISBN (PDF)
- 9783956848971
- ISBN (Paperback)
- 9783956843976
- Dateigröße
- 1.6 MB
- Sprache
- Deutsch
- Institution / Hochschule
- Katholische Universität Eichstätt-Ingolstadt
- Erscheinungsdatum
- 2015 (Februar)
- Note
- 1
- Schlagworte
- Cash-Flow CLV-Analyse CRM Retention-Rate Churn-Analyse
- Produktsicherheit
- BACHELOR + MASTER Publishing