[{"@context":"http:\/\/schema.org\/","@type":"BlogPosting","@id":"https:\/\/wiki.edu.vn\/wiki22\/2020\/12\/31\/predictive-analytics-wikipedia\/#BlogPosting","mainEntityOfPage":"https:\/\/wiki.edu.vn\/wiki22\/2020\/12\/31\/predictive-analytics-wikipedia\/","headline":"Predictive Analytics &#8211; Wikipedia","name":"Predictive Analytics &#8211; Wikipedia","description":"before-content-x4 Statistische Techniken, die Fakten analysieren, um Vorhersagen \u00fcber unbekannte Ereignisse zu treffen Predictive Analytics umfasst eine Vielzahl statistischer Techniken","datePublished":"2020-12-31","dateModified":"2020-12-31","author":{"@type":"Person","@id":"https:\/\/wiki.edu.vn\/wiki22\/author\/lordneo\/#Person","name":"lordneo","url":"https:\/\/wiki.edu.vn\/wiki22\/author\/lordneo\/","image":{"@type":"ImageObject","@id":"https:\/\/secure.gravatar.com\/avatar\/44a4cee54c4c053e967fe3e7d054edd4?s=96&d=mm&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/44a4cee54c4c053e967fe3e7d054edd4?s=96&d=mm&r=g","height":96,"width":96}},"publisher":{"@type":"Organization","name":"Enzyklop\u00e4die","logo":{"@type":"ImageObject","@id":"https:\/\/wiki.edu.vn\/wiki4\/wp-content\/uploads\/2023\/08\/download.jpg","url":"https:\/\/wiki.edu.vn\/wiki4\/wp-content\/uploads\/2023\/08\/download.jpg","width":600,"height":60}},"image":{"@type":"ImageObject","@id":"https:\/\/wiki.edu.vn\/wiki4\/wp-content\/uploads\/2023\/08\/download.jpg","url":"https:\/\/wiki.edu.vn\/wiki4\/wp-content\/uploads\/2023\/08\/download.jpg","width":100,"height":100},"url":"https:\/\/wiki.edu.vn\/wiki22\/2020\/12\/31\/predictive-analytics-wikipedia\/","wordCount":11591,"articleBody":"     (adsbygoogle = window.adsbygoogle || []).push({});before-content-x4Statistische Techniken, die Fakten analysieren, um Vorhersagen \u00fcber unbekannte Ereignisse zu treffen  Predictive Analytics umfasst eine Vielzahl statistischer Techniken aus Data Mining, Vorhersagemodellierung und maschinellem Lernen, die aktuelle und historische Fakten analysieren, um Vorhersagen \u00fcber zuk\u00fcnftige oder anderweitig unbekannte Ereignisse zu treffen.[1][2]In Unternehmen nutzen Vorhersagemodelle Muster aus historischen Daten und Transaktionsdaten, um Risiken und Chancen zu identifizieren.  Modelle erfassen Beziehungen zwischen vielen Faktoren, um die Bewertung von Risiken oder Potenzialen zu erm\u00f6glichen, die mit bestimmten Bedingungen verbunden sind, und leiten die Entscheidungsfindung f\u00fcr Kandidatentransaktionen.[3]Der definierende funktionale Effekt dieser technischen Ans\u00e4tze besteht darin, dass die pr\u00e4diktive Analyse eine pr\u00e4diktive Bewertung (Wahrscheinlichkeit) f\u00fcr jede Person (Kunde, Mitarbeiter, Patient im Gesundheitswesen, Produkt-SKU, Fahrzeug, Komponente, Maschine oder andere Organisationseinheit) liefert, um zu bestimmen, zu informieren oder organisatorische Prozesse beeinflussen, die sich auf eine gro\u00dfe Anzahl von Personen beziehen, wie z. B. Marketing, Kreditrisikobewertung, Betrugserkennung, Fertigung, Gesundheitswesen und Regierungsgesch\u00e4fte, einschlie\u00dflich Strafverfolgung.  Predictive Analytics wird in der Versicherungsmathematik eingesetzt.[4]Marketing,[5]Unternehmensf\u00fchrung, Sport \/ Fantasy-Sport, [6]Versicherung, Telekommunikation,[7]Verkauf,[8]Reise,[9]Mobilit\u00e4t,[10]Gesundheitswesen,[11]Kinderschutz,[12][13]Pharmazeutika,[14]Kapazit\u00e4tsplanung,[15]soziales Netzwerk[16]  und andere Felder.Eine der bekanntesten Anwendungen ist die Kreditbewertung.[1]  die in der gesamten Gesch\u00e4ftsf\u00fchrung verwendet wird.  Bewertungsmodelle verarbeiten die Bonit\u00e4tshistorie, den Kreditantrag, die Kundendaten usw. eines Kunden, um Einzelpersonen nach ihrer Wahrscheinlichkeit zu ordnen, k\u00fcnftige Kreditzahlungen rechtzeitig zu leisten.Table of ContentsDefinition[edit]Vorhersagemodelle[edit]Beschreibende Modelle[edit]Entscheidungsmodelle[edit]Anwendungen[edit]Gesch\u00e4ft[edit]Kinderschutz[edit]Klinische Entscheidungsunterst\u00fctzungssysteme[edit]Vorhersage der Ergebnisse rechtlicher Entscheidungen[edit]Prognose auf Portfolio-, Produkt- oder Wirtschaftsebene[edit]Underwriting[edit]Technologie- und Big-Data-Einfl\u00fcsse[edit]Analytische Techniken[edit]Regressionstechniken[edit]Lineares Regressionsmodell[edit]Modelle mit diskreter Auswahl[edit]Logistische Regression[edit]Probit-Regression[edit]Multinomiale logistische Regression[edit]Logit versus Probit[edit]Zeitreihenmodelle[edit]\u00dcberlebens- oder Daueranalyse[edit]Klassifikations- und Regressionsb\u00e4ume (CART)[edit]Multivariate adaptive Regressionssplines[edit]Techniken des maschinellen Lernens[edit]PMML[edit]Kritik[edit]Siehe auch[edit]Verweise[edit]Weiterf\u00fchrende Literatur[edit]Definition[edit]Predictive Analytics ist ein Bereich der Statistik, in dem Informationen aus Daten extrahiert und zur Vorhersage von Trends und Verhaltensmustern verwendet werden.  Die Verbesserung der pr\u00e4diktiven Webanalyse berechnet statistische Wahrscheinlichkeiten zuk\u00fcnftiger Ereignisse online.  Zu den statistischen Techniken der Predictive Analytics geh\u00f6ren Datenmodellierung, maschinelles Lernen, KI, Deep-Learning-Algorithmen und Data Mining.[17]  Oft liegt das unbekannte Ereignis von Interesse in der Zukunft, aber Predictive Analytics kann auf jede Art von Unbekanntem angewendet werden, sei es in der Vergangenheit, Gegenwart oder Zukunft.  Zum Beispiel die Identifizierung von Verd\u00e4chtigen nach Begehung eines Verbrechens oder Kreditkartenbetrug, sobald dieser auftritt.[18]  Der Kern der pr\u00e4diktiven Analyse besteht darin, die Beziehungen zwischen erkl\u00e4renden Variablen und den vorhergesagten Variablen aus fr\u00fcheren Ereignissen zu erfassen und sie zur Vorhersage des unbekannten Ergebnisses zu nutzen.  Es ist jedoch wichtig zu beachten, dass die Genauigkeit und Verwendbarkeit der Ergebnisse stark vom Grad der Datenanalyse und der Qualit\u00e4t der Annahmen abh\u00e4ngt.  Predictive Analytics wird h\u00e4ufig als Vorhersage auf einer detaillierteren Granularit\u00e4tsebene definiert, dh als Generierung von Predictive Scores (Wahrscheinlichkeiten) f\u00fcr jedes einzelne Organisationselement.  Dies unterscheidet es von der Prognose.  Beispiel: &#8220;Predictive Analytics &#8211; Technologie, die aus Erfahrungen (Daten) lernt, um das zuk\u00fcnftige Verhalten von Personen vorherzusagen und bessere Entscheidungen zu treffen.&#8221;[19]  In zuk\u00fcnftigen industriellen Systemen besteht der Wert der pr\u00e4diktiven Analyse darin, potenzielle Probleme vorherzusagen und zu verhindern, um einen Ausfall nahe Null zu erreichen, und weiter in die pr\u00e4skriptive Analyse zur Entscheidungsoptimierung integriert zu werden.[citation needed]Im Allgemeinen wird der Begriff &#8220;pr\u00e4diktive Analyse&#8221; verwendet, um pr\u00e4diktive Modellierung, &#8220;Bewertung&#8221; von Daten mit pr\u00e4diktiven Modellen und Prognose zu bezeichnen.  Der Begriff wird jedoch zunehmend f\u00fcr verwandte analytische Disziplinen verwendet, z. B. deskriptive Modellierung und Entscheidungsmodellierung oder -optimierung.  Diese Disziplinen beinhalten auch eine strenge Datenanalyse und werden im Gesch\u00e4ftsleben h\u00e4ufig zur Segmentierung und Entscheidungsfindung eingesetzt, haben jedoch unterschiedliche Zwecke und die ihnen zugrunde liegenden statistischen Techniken variieren.Vorhersagemodelle[edit]Die pr\u00e4diktive Modellierung verwendet Vorhersagemodelle, um die Beziehung zwischen der spezifischen Leistung einer Einheit in einer Stichprobe und einem oder mehreren bekannten Attributen oder Merkmalen der Einheit zu analysieren.  Ziel des Modells ist es, die Wahrscheinlichkeit zu bewerten, mit der eine \u00e4hnliche Einheit in einer anderen Stichprobe die spezifische Leistung aufweist.  Diese Kategorie umfasst Modelle in vielen Bereichen, z. B. Marketing, in denen nach subtilen Datenmustern gesucht wird, um Fragen zur Kundenleistung zu beantworten, oder Modelle zur Betrugserkennung.  Vorhersagemodelle f\u00fchren h\u00e4ufig Berechnungen w\u00e4hrend Live-Transaktionen durch, um beispielsweise das Risiko oder die Chance eines bestimmten Kunden oder einer bestimmten Transaktion zu bewerten und eine Entscheidung zu treffen.  Mit den Fortschritten bei der Rechengeschwindigkeit sind einzelne Agentenmodellierungssysteme in der Lage, menschliches Verhalten oder Reaktionen auf bestimmte Reize oder Szenarien zu simulieren.Die verf\u00fcgbaren Stichprobeneinheiten mit bekannten Attributen und bekannten Leistungen werden als &#8220;Trainingsstichprobe&#8221; bezeichnet.  Die Einheiten in anderen Stichproben mit bekannten Attributen, aber unbekannten Leistungen werden als &#8220;out of&#8221; bezeichnet [training] Beispieleinheiten. Die Out-of-Sample-Einheiten haben nicht unbedingt eine chronologische Beziehung zu den Training-Sample-Einheiten. Beispielsweise kann das Training-Sample aus literarischen Attributen von Schriften viktorianischer Autoren mit bekannter Zuordnung und der Out-of-Sample-Einheit bestehen Es kann sich um ein neu gefundenes Schreiben mit unbekannter Urheberschaft handeln. Ein Vorhersagemodell kann dabei helfen, eine Arbeit einem bekannten Autor zuzuordnen. Ein weiteres Beispiel ist die Analyse von Blutspritzern in simulierten Tatorten, bei denen die Einheit au\u00dferhalb der Probe das tats\u00e4chliche Blutspritzer-Muster ist ein Tatort. Die Einheit au\u00dferhalb der Stichprobe kann aus derselben Zeit wie die Trainingseinheiten stammen, aus einer fr\u00fcheren Zeit oder aus einer zuk\u00fcnftigen Zeit.Beschreibende Modelle[edit]Beschreibende Modelle quantifizieren Beziehungen in Daten auf eine Weise, die h\u00e4ufig verwendet wird, um Kunden oder Interessenten in Gruppen zu klassifizieren.  Im Gegensatz zu Vorhersagemodellen, die sich auf die Vorhersage eines einzelnen Kundenverhaltens konzentrieren (z. B. Kreditrisiko), identifizieren beschreibende Modelle viele verschiedene Beziehungen zwischen Kunden oder Produkten.  Beschreibende Modelle ordnen Kunden nicht nach ihrer Wahrscheinlichkeit, eine bestimmte Aktion auszuf\u00fchren, wie Vorhersagemodelle.  Stattdessen k\u00f6nnen beschreibende Modelle verwendet werden, um beispielsweise Kunden nach ihren Produktpr\u00e4ferenzen und ihrer Lebensphase zu kategorisieren.  Deskriptive Modellierungswerkzeuge k\u00f6nnen verwendet werden, um weitere Modelle zu entwickeln, die eine gro\u00dfe Anzahl individualisierter Agenten simulieren und Vorhersagen treffen k\u00f6nnen.Entscheidungsmodelle[edit]Entscheidungsmodelle beschreiben die Beziehung zwischen allen Elementen einer Entscheidung &#8211; den bekannten Daten (einschlie\u00dflich der Ergebnisse von Vorhersagemodellen), der Entscheidung und den Prognoseergebnissen der Entscheidung -, um die Ergebnisse von Entscheidungen mit vielen Variablen vorherzusagen.  Diese Modelle k\u00f6nnen zur Optimierung verwendet werden, um bestimmte Ergebnisse zu maximieren und andere zu minimieren.  Entscheidungsmodelle werden im Allgemeinen verwendet, um Entscheidungslogik oder eine Reihe von Gesch\u00e4ftsregeln zu entwickeln, die f\u00fcr jeden Kunden oder Umstand die gew\u00fcnschte Aktion erzeugen.Anwendungen[edit]Obwohl Predictive Analytics in vielen Anwendungen eingesetzt werden kann, skizzieren wir einige Beispiele, bei denen Predictive Analytics in den letzten Jahren positive Auswirkungen gezeigt hat.Gesch\u00e4ft[edit]Analytisches Kundenbeziehungsmanagement (CRM) ist eine h\u00e4ufige kommerzielle Anwendung der pr\u00e4diktiven Analyse.  Methoden der pr\u00e4diktiven Analyse werden auf Kundendaten angewendet, um eine ganzheitliche Sicht auf den Kunden zu erstellen.  CRM verwendet Predictive Analysis in Anwendungen f\u00fcr Marketingkampagnen, Vertrieb und Kundendienst.  Analytisches CRM kann w\u00e4hrend des gesamten Lebenszyklus des Kunden angewendet werden (Akquisition, Beziehungswachstum, Kundenbindung und R\u00fcckgewinnung).Oft sammeln und pflegen Unternehmensorganisationen reichlich Daten wie Kundendatens\u00e4tze oder Verkaufstransaktionen.  In diesen F\u00e4llen k\u00f6nnen Predictive Analytics dazu beitragen, die Ausgaben, die Nutzung und andere Verhaltensweisen der Kunden zu analysieren, was zu einem effizienten Cross-Sales f\u00fchrt oder zus\u00e4tzliche Produkte an aktuelle Kunden verkauft.[2]Die ordnungsgem\u00e4\u00dfe Anwendung von Predictive Analytics kann zu proaktiveren und effektiveren Aufbewahrungsstrategien f\u00fchren.  Durch eine h\u00e4ufige Untersuchung der fr\u00fcheren Servicenutzung, der Serviceleistung, der Ausgaben und anderer Verhaltensmuster eines Kunden k\u00f6nnen Vorhersagemodelle die Wahrscheinlichkeit bestimmen, dass ein Kunde den Service bald beendet.[7]  Eine Intervention mit Angeboten mit hohem wahrgenommenen Wert kann die Chance erh\u00f6hen, den Kunden zu konvertieren oder zu halten.  Predictive Analytics kann auch stille Abnutzungserscheinungen vorhersagen, das Verhalten eines Kunden, die Nutzung langsam, aber stetig zu reduzieren.Kinderschutz[edit]Einige Kinderhilfswerke haben begonnen, Predictive Analytics zu verwenden, um F\u00e4lle mit hohem Risiko zu kennzeichnen.[20]  In Hillsborough County, Florida, hat beispielsweise die Verwendung eines Vorhersagemodellierungswerkzeugs durch die Kinderschutzbeh\u00f6rde missbrauchsbedingte Todesf\u00e4lle bei Kindern in der Zielgruppe verhindert.[21]Klinische Entscheidungsunterst\u00fctzungssysteme[edit]Pr\u00e4diktive Analysen haben im Gesundheitswesen in erster Linie Verwendung gefunden, um festzustellen, bei welchen Patienten das Risiko besteht, Erkrankungen wie Diabetes, Asthma oder Herzerkrankungen zu entwickeln.  Dar\u00fcber hinaus enthalten hochentwickelte Systeme zur Unterst\u00fctzung klinischer Entscheidungen pr\u00e4diktive Analysen zur Unterst\u00fctzung der medizinischen Entscheidungsfindung.Eine Studie \u00fcber neurodegenerative Erkrankungen aus dem Jahr 2016 bietet ein aussagekr\u00e4ftiges Beispiel f\u00fcr eine CDS-Plattform zur Diagnose, Verfolgung, Vorhersage und \u00dcberwachung des Fortschreitens der Parkinson-Krankheit.[22]Vorhersage der Ergebnisse rechtlicher Entscheidungen[edit]Die Vorhersage des Ergebnisses juristischer Entscheidungen kann durch KI-Programme erfolgen.  Diese Programme k\u00f6nnen als Hilfsmittel f\u00fcr Berufe in dieser Branche verwendet werden.[23][24]Prognose auf Portfolio-, Produkt- oder Wirtschaftsebene[edit]Oft liegt der Fokus der Analyse nicht auf dem Verbraucher, sondern auf dem Produkt, Portfolio, Unternehmen, der Industrie oder sogar der Wirtschaft.  Beispielsweise k\u00f6nnte ein Einzelh\u00e4ndler daran interessiert sein, die Nachfrage auf Filialebene f\u00fcr Bestandsverwaltungszwecke vorherzusagen.  Oder das Federal Reserve Board k\u00f6nnte daran interessiert sein, die Arbeitslosenquote f\u00fcr das n\u00e4chste Jahr vorherzusagen.  Diese Arten von Problemen k\u00f6nnen durch pr\u00e4diktive Analysen unter Verwendung von Zeitreihentechniken angegangen werden (siehe unten).  Sie k\u00f6nnen auch \u00fcber maschinelle Lernans\u00e4tze angesprochen werden, die die urspr\u00fcngliche Zeitreihe in einen Merkmalsvektorraum umwandeln, in dem der Lernalgorithmus Muster mit Vorhersagekraft findet.[25][26]Underwriting[edit]Viele Unternehmen m\u00fcssen das Risiko aufgrund ihrer unterschiedlichen Dienstleistungen ber\u00fccksichtigen und die zur Deckung des Risikos erforderlichen Kosten ermitteln.  Predictive Analytics k\u00f6nnen dabei helfen, diese Mengen zu zeichnen, indem sie das Risiko von Krankheit, Ausfall, Insolvenz usw. vorhersagen. Predictive Analytics k\u00f6nnen den Prozess der Kundenakquise rationalisieren, indem sie das zuk\u00fcnftige Risikoverhalten eines Kunden anhand von Daten auf Anwendungsebene vorhersagen.[4]  Predictive Analytics in Form von Kredit-Scores haben den Zeitaufwand f\u00fcr Kreditgenehmigungen, insbesondere auf dem Hypothekenmarkt, verk\u00fcrzt.  Eine ordnungsgem\u00e4\u00dfe pr\u00e4diktive Analyse kann zu angemessenen Preisentscheidungen f\u00fchren, die dazu beitragen k\u00f6nnen, das zuk\u00fcnftige Ausfallrisiko zu verringern.Technologie- und Big-Data-Einfl\u00fcsse[edit]Big Data ist eine Sammlung von Datens\u00e4tzen, die so gro\u00df und komplex sind, dass die Arbeit mit herk\u00f6mmlichen Datenbankverwaltungstools schwierig wird.  Das Volumen, die Vielfalt und die Geschwindigkeit von Big Data haben zu allgemeinen Herausforderungen bei der Erfassung, Speicherung, Suche, Freigabe, Analyse und Visualisierung gef\u00fchrt.  Beispiele f\u00fcr Big-Data-Quellen sind Weblogs, RFID, Sensordaten, soziale Netzwerke, Indexierung der Internetsuche, Anrufdetailaufzeichnungen, milit\u00e4rische \u00dcberwachung und komplexe Daten in den Bereichen Astronomie, Biogeochemie, Genomik und Atmosph\u00e4renwissenschaften.  Big Data ist der Kern der meisten pr\u00e4diktiven Analysedienste, die von IT-Organisationen angeboten werden.[27] Dank des technologischen Fortschritts bei der Computerhardware &#8211; schnellere CPUs, billigerer Speicher und MPP-Architekturen &#8211; und neuer Technologien wie Hadoop, MapReduce sowie Datenbank- und Textanalysen f\u00fcr die Verarbeitung von Big Data ist es jetzt m\u00f6glich, Daten zu sammeln, zu analysieren und abzubauen riesige Mengen strukturierter und unstrukturierter Daten f\u00fcr neue Erkenntnisse.[28]  Es ist auch m\u00f6glich, Vorhersagealgorithmen f\u00fcr Streaming-Daten auszuf\u00fchren.[29]  Heutzutage ist die Erforschung von Big Data und die Verwendung von Predictive Analytics f\u00fcr mehr Unternehmen als je zuvor erreichbar, und es werden neue Methoden vorgeschlagen, mit denen solche Datens\u00e4tze verarbeitet werden k\u00f6nnen.[30][31]Analytische Techniken[edit]Die Ans\u00e4tze und Techniken zur Durchf\u00fchrung pr\u00e4diktiver Analysen lassen sich grob in Regressionstechniken und Techniken des maschinellen Lernens einteilen.Regressionstechniken[edit]Regressionsmodelle sind die Hauptst\u00fctze der pr\u00e4diktiven Analyse.  Der Schwerpunkt liegt auf der Erstellung einer mathematischen Gleichung als Modell zur Darstellung der Wechselwirkungen zwischen den verschiedenen betrachteten Variablen.  Je nach Situation gibt es eine Vielzahl von Modellen, die bei der Durchf\u00fchrung von Predictive Analytics angewendet werden k\u00f6nnen.  Einige von ihnen werden im Folgenden kurz erl\u00e4utert.Lineares Regressionsmodell[edit]Das lineare Regressionsmodell sagt die Antwortvariable als lineare Funktion der Parameter mit unbekannten Koeffizienten voraus.  Diese Parameter werden so angepasst, dass ein Ma\u00df f\u00fcr die Anpassung optimiert wird.  Ein Gro\u00dfteil des Aufwands bei der Modellanpassung konzentriert sich auf die Minimierung der Gr\u00f6\u00dfe des Residuums sowie auf die Sicherstellung, dass es in Bezug auf die Modellvorhersagen zuf\u00e4llig verteilt ist.Das Ziel der Regression besteht darin, die Parameter des Modells so auszuw\u00e4hlen, dass die Summe der quadratischen Residuen minimiert wird.  Dies wird als gew\u00f6hnliche Sch\u00e4tzung der kleinsten Quadrate (OLS) bezeichnet.Modelle mit diskreter Auswahl[edit]Die multiple Regression (oben) wird im Allgemeinen verwendet, wenn die Antwortvariable kontinuierlich ist und einen unbegrenzten Bereich aufweist.  Oft ist die Antwortvariable nicht kontinuierlich, sondern diskret.  W\u00e4hrend es mathematisch m\u00f6glich ist, multiple Regression auf diskrete geordnete abh\u00e4ngige Variablen anzuwenden, gelten einige der Annahmen hinter der Theorie der multiplen linearen Regression nicht mehr, und es gibt andere Techniken wie diskrete Auswahlmodelle, die f\u00fcr diese Art der Analyse besser geeignet sind.  Wenn die abh\u00e4ngige Variable diskret ist, sind einige dieser \u00fcberlegenen Methoden logistische Regression, multinomiale Logit- und Probit-Modelle.  Logistische Regressions- und Probit-Modelle werden verwendet, wenn die abh\u00e4ngige Variable bin\u00e4r ist.Logistische Regression[edit]In einer Klassifizierungseinstellung kann das Zuweisen von Ergebniswahrscheinlichkeiten zu Beobachtungen mithilfe eines logistischen Modells (auch als Logikmodell bezeichnet) erreicht werden, das Informationen \u00fcber die bin\u00e4r abh\u00e4ngige Variable in eine unbegrenzte kontinuierliche Variable umwandelt und ein regul\u00e4res multivariates Modell sch\u00e4tzt.Der Wald- und der Likelihood-Ratio-Test werden verwendet, um die statistische Signifikanz jedes Koeffizienten zu testen b im Modell (analog zu den in der OLS-Regression verwendeten t-Tests; siehe oben).  Ein Test zur Beurteilung der Anpassungsg\u00fcte eines Klassifizierungsmodells ist der &#8220;korrekt vorhergesagte Prozentsatz&#8221;.Probit-Regression[edit]Probit-Modelle bieten eine Alternative zur logistischen Regression zur Modellierung kategorial abh\u00e4ngiger Variablen.Multinomiale logistische Regression[edit]Eine Erweiterung des bin\u00e4ren Logit-Modells auf F\u00e4lle, in denen die abh\u00e4ngige Variable mehr als zwei Kategorien aufweist, ist das multinomiale Logit-Modell.  In solchen F\u00e4llen ist das Zusammenfassen der Daten in zwei Kategorien m\u00f6glicherweise nicht sinnvoll oder f\u00fchrt zu einem Verlust des Datenreichtums.  Das multinomiale Logit-Modell ist in diesen F\u00e4llen die geeignete Technik, insbesondere wenn die abh\u00e4ngigen Variablenkategorien nicht geordnet sind (zum Beispiel Farben wie Rot, Blau, Gr\u00fcn).  Einige Autoren haben die multinomiale Regression um Methoden zur Merkmalsauswahl \/ -bedeutung wie die zuf\u00e4llige multinomiale Protokollierung erweitert.Logit versus Probit[edit]Die beiden Regressionen verhalten sich in der Regel \u00e4hnlich, mit der Ausnahme, dass die logistische Verteilung tendenziell etwas flacher ist.  Die aus dem Logit- und Probit-Modell erhaltenen Koeffizienten liegen normalerweise nahe beieinander.  Das Odds Ratio ist jedoch im Logit-Modell leichter zu interpretieren.Praktische Gr\u00fcnde f\u00fcr die Wahl des Probit-Modells gegen\u00fcber dem Logistikmodell k\u00f6nnen sein:Es besteht eine starke \u00dcberzeugung, dass die zugrunde liegende Verteilung normal istDas tats\u00e4chliche Ereignis ist kein bin\u00e4res Ergebnis (z.B, Insolvenzstatus), aber ein Anteil (z.B, Anteil der Bev\u00f6lkerung mit unterschiedlichen Schulden).Zeitreihenmodelle[edit]Zeitreihenmodelle werden zur Vorhersage oder Vorhersage des zuk\u00fcnftigen Verhaltens von Variablen verwendet.  Diese Modelle ber\u00fccksichtigen die Tatsache, dass Datenpunkte, die im Laufe der Zeit erfasst wurden, m\u00f6glicherweise eine interne Struktur (wie Autokorrelation, Trend oder saisonale Variation) aufweisen, die ber\u00fccksichtigt werden sollte.  Infolgedessen k\u00f6nnen Standardregressionstechniken nicht auf Zeitreihendaten angewendet werden, und es wurde eine Methodik entwickelt, um den Trend, die saisonale und die zyklische Komponente der Reihe zu zerlegen.Zeitreihenmodelle sch\u00e4tzen Differenzgleichungen, die stochastische Komponenten enthalten.  Zwei h\u00e4ufig verwendete Formen dieser Modelle sind autoregressive Modelle (AR) und Modelle mit gleitendem Durchschnitt (MA).  Die Box-Jenkins-Methode kombiniert die AR- und MA-Modelle, um das ARMA-Modell (autoregressive Moving Average) zu erstellen, das den Eckpfeiler der station\u00e4ren Zeitreihenanalyse darstellt.  ARIMA (autoregressive integrierte gleitende Durchschnittsmodelle) werden dagegen zur Beschreibung instation\u00e4rer Zeitreihen verwendet.In den letzten Jahren sind Zeitreihenmodelle komplexer geworden und versuchen, bedingte Heteroskedastizit\u00e4t zu modellieren.  Zu diesen Modellen geh\u00f6ren das ARCH-Modell (autoregressive bedingte Heteroskedastizit\u00e4t) und das GARCH-Modell (generalisierte autoregressive bedingte Heteroskedastizit\u00e4t), die beide h\u00e4ufig f\u00fcr finanzielle Zeitreihen verwendet werden.\u00dcberlebens- oder Daueranalyse[edit]Die \u00dcberlebensanalyse ist ein anderer Name f\u00fcr die Zeit-zu-Ereignis-Analyse.  Diese Techniken wurden haupts\u00e4chlich in den medizinischen und biologischen Wissenschaften entwickelt, sind aber auch in den Sozialwissenschaften wie Wirtschaftswissenschaften und Ingenieurwissenschaften weit verbreitet.Zensur und Nichtnormalit\u00e4t, die f\u00fcr \u00dcberlebensdaten charakteristisch sind, verursachen Schwierigkeiten beim Versuch, die Daten unter Verwendung herk\u00f6mmlicher statistischer Modelle wie der multiplen linearen Regression zu analysieren.  Die Normalverteilung, die eine symmetrische Verteilung ist, nimmt sowohl positive als auch negative Werte an, aber die Dauer kann naturgem\u00e4\u00df nicht negativ sein, und daher kann beim Umgang mit Dauer- \/ \u00dcberlebensdaten keine Normalit\u00e4t angenommen werden.Dauer-Modelle k\u00f6nnen parametrisch, nicht parametrisch oder semiparametrisch sein.  Einige der \u00fcblicherweise verwendeten Modelle sind Kaplan-Meier- und Cox-Proportional-Hazard-Modelle (nicht parametrisch).Klassifikations- und Regressionsb\u00e4ume (CART)[edit]Klassifizierungs- und Regressionsb\u00e4ume (CART) sind eine nicht parametrische Lernmethode f\u00fcr Entscheidungsb\u00e4ume, die entweder Klassifizierungs- oder Regressionsb\u00e4ume erzeugt, je nachdem, ob die abh\u00e4ngige Variable kategorisch oder numerisch ist.Entscheidungsb\u00e4ume werden durch eine Sammlung von Regeln gebildet, die auf Variablen im Modellierungsdatensatz basieren:Regeln, die auf Variablenwerten basieren, werden ausgew\u00e4hlt, um die beste Aufteilung zu erhalten, um Beobachtungen basierend auf der abh\u00e4ngigen Variablen zu unterscheidenSobald eine Regel ausgew\u00e4hlt und ein Knoten in zwei geteilt wurde, wird der gleiche Prozess auf jeden &#8220;untergeordneten&#8221; Knoten angewendet (dh es handelt sich um eine rekursive Prozedur).Das Aufteilen stoppt, wenn CART feststellt, dass keine weitere Verst\u00e4rkung erzielt werden kann oder einige voreingestellte Stoppregeln eingehalten werden.  (Alternativ werden die Daten so weit wie m\u00f6glich aufgeteilt und der Baum sp\u00e4ter beschnitten.)Jeder Zweig des Baums endet in einem Endknoten.  Jede Beobachtung f\u00e4llt in einen und genau einen Endknoten, und jeder Endknoten wird durch eine Reihe von Regeln eindeutig definiert.Eine sehr beliebte Methode f\u00fcr die pr\u00e4diktive Analyse sind zuf\u00e4llige W\u00e4lder.Multivariate adaptive Regressionssplines[edit]Multivariate adaptive Regressionssplines (MARS) sind eine nicht parametrische Technik, mit der flexible Modelle durch Anpassen st\u00fcckweise linearer Regressionen erstellt werden.Der multivariate und adaptive Regressions-Spline-Ansatz passt das Modell absichtlich an und schneidet es dann ab, um zum optimalen Modell zu gelangen.  Der Algorithmus ist rechenintensiv und in der Praxis wird eine Obergrenze f\u00fcr die Anzahl der Basisfunktionen festgelegt.Techniken des maschinellen Lernens[edit]Maschinelles Lernen umfasst eine Reihe fortschrittlicher statistischer Methoden zur Regression und Klassifizierung und findet Anwendung in einer Vielzahl von Bereichen, einschlie\u00dflich medizinischer Diagnostik, Erkennung von Kreditkartenbetrug, Gesichts- und Spracherkennung und Analyse der B\u00f6rse. In der Vergangenheit waren f\u00fcr die Verwendung von Predictive Analytics-Tools sowie f\u00fcr das Verst\u00e4ndnis der von ihnen erzielten Ergebnisse fortgeschrittene Kenntnisse erforderlich.  Moderne Predictive Analytics-Tools sind jedoch nicht mehr auf IT-Spezialisten beschr\u00e4nkt.[citation needed]  Da immer mehr Unternehmen Predictive Analytics in Entscheidungsprozesse einbinden und in ihre Abl\u00e4ufe integrieren, verlagern sie den Markt in Richtung Gesch\u00e4ftsanwender als Hauptverbraucher der Informationen.  Gesch\u00e4ftsanwender m\u00f6chten Tools, die sie selbst verwenden k\u00f6nnen.  Die Anbieter reagieren darauf mit der Erstellung einer neuen Software, die die mathematische Komplexit\u00e4t beseitigt, benutzerfreundliche grafische Oberfl\u00e4chen bereitstellt und \/ oder Verkn\u00fcpfungen einbaut, mit denen beispielsweise die Art der verf\u00fcgbaren Daten erkannt und ein geeignetes Vorhersagemodell vorgeschlagen werden kann.[32]  Predictive Analytics-Tools sind so ausgefeilt, dass Datenprobleme angemessen dargestellt und analysiert werden k\u00f6nnen.[citation needed]  Damit jeder datenbewusste Information Worker sie verwenden kann, um Daten zu analysieren und aussagekr\u00e4ftige, n\u00fctzliche Ergebnisse abzurufen.[2]  Beispielsweise pr\u00e4sentieren moderne Tools Ergebnisse anhand einfacher Diagramme, Grafiken und Scores, die die Wahrscheinlichkeit m\u00f6glicher Ergebnisse angeben.[33]Auf dem Markt sind zahlreiche Tools verf\u00fcgbar, die bei der Ausf\u00fchrung von Predictive Analytics helfen.  Diese reichen von denen, die nur sehr wenig Benutzerkompetenz ben\u00f6tigen, bis zu denen, die f\u00fcr den erfahrenen Praktiker entwickelt wurden.  Der Unterschied zwischen diesen Tools liegt h\u00e4ufig in der Anpassungsstufe und dem zul\u00e4ssigen hohen Datenaufwand.PMML[edit]Die Predictive Model Markup Language (PMML) wurde als Standardsprache zum Ausdr\u00fccken von Vorhersagemodellen vorgeschlagen.  Eine solche XML-basierte Sprache bietet den verschiedenen Tools die M\u00f6glichkeit, Vorhersagemodelle zu definieren und gemeinsam zu nutzen.  PMML 4.0 wurde im Juni 2009 ver\u00f6ffentlicht.Kritik[edit]Es gibt viele Skeptiker, wenn es um die F\u00e4higkeit von Computern und Algorithmen geht, die Zukunft vorherzusagen, darunter Gary King, Professor an der Harvard University und Direktor des Instituts f\u00fcr quantitative Sozialwissenschaften.[34]  Menschen werden auf unz\u00e4hlige Weise von ihrer Umwelt beeinflusst.  Um genau vorherzusagen, was die Menschen als n\u00e4chstes tun werden, m\u00fcssen alle einflussreichen Variablen bekannt sein und genau gemessen werden.  &#8220;Die Umgebung der Menschen \u00e4ndert sich noch schneller als sie selbst. Alles, vom Wetter bis zu ihrer Beziehung zu ihrer Mutter, kann die Art und Weise ver\u00e4ndern, wie Menschen denken und handeln. Alle diese Variablen sind unvorhersehbar. Wie sie sich auf eine Person auswirken, ist noch weniger vorhersehbar. Wenn Wenn sie morgen genau die gleiche Situation haben, treffen sie m\u00f6glicherweise eine v\u00f6llig andere Entscheidung. Dies bedeutet, dass eine statistische Vorhersage nur unter sterilen Laborbedingungen g\u00fcltig ist, was pl\u00f6tzlich nicht mehr so \u200b\u200bn\u00fctzlich ist, wie es vorher schien. &#8220;[35]In einer Studie von 1072 Artikeln, die zwischen 1990 und 2006 in Information Systems Research und MIS Quarterly ver\u00f6ffentlicht wurden, versuchten nur 52 empirische Artikel pr\u00e4diktive Behauptungen, von denen nur 7 eine ordnungsgem\u00e4\u00dfe pr\u00e4diktive Modellierung oder Pr\u00fcfung durchf\u00fchrten.[36]Siehe auch[edit]Verweise[edit]^ ein b Nyce, Charles (2007), Predictive Analytics White Paper (PDF), Amerikanisches Institut f\u00fcr Chartered Property Casualty Underwriter \/ Versicherungsinstitut von Amerika, p.  1^ ein b c Eckerson, Wayne (10. Mai 2007), Wertsteigerung Ihrer Data Warehousing-Investition, Das Data Warehouse Institut^ Coker, Frank (2014). Puls: Die Lebenszeichen Ihres Unternehmens verstehen (1. Aufl.).  Bellevue, WA: Ambient Light Publishing.  S. 30, 39, 42, mehr.  ISBN 978-0-9893086-0-1.^ ein b Conz, Nathan (2. September 2008), &#8220;Umstellung der Versicherer auf kundenorientierte Predictive Analytics-Technologien&#8221;, Versicherung &#038; Technologie, archiviert von das Original am 22. Juli 2012abgerufen 2. Juli, 2012^ Fletcher, Heather (2. M\u00e4rz 2011), &#8220;Die 7 besten Anwendungen f\u00fcr Predictive Analytics im Multichannel-Marketing&#8221;, Zielgerichtete Vermarktung^ Korn, Sue (21. April 2011), &#8220;Die Chance f\u00fcr Predictive Analytics im Finanzbereich&#8221;, HPC-Draht^ ein b Barkin, Eric (Mai 2011), &#8220;CRM + Predictive Analytics: Warum sich alles summiert&#8221;, Ziel-CRM^ Das, Krantik;  Vidyashankar, GS (1. Juli 2006), &#8220;Wettbewerbsvorteil im Einzelhandel durch Analytik: Erkenntnisse entwickeln, Werte schaffen&#8221;, Informationsmanagement^ McDonald, Mich\u00e8le (2. September 2010), &#8220;Neue Technologie nutzt &#8216;Predictive Analytics&#8217;, um auf Reiseempfehlungen abzuzielen&#8221;, Reisemarktbericht, archiviert von das Original am 10. September 2015^ Moreira-Matias, Lu\u00eds;  Gama, Jo\u00e3o;  Ferreira, Michel;  Mendes-Moreira, Jo\u00e3o;  Damas, Luis (01.02.2016). &#8220;Zeitentwickelte OD-Matrixsch\u00e4tzung unter Verwendung von Hochgeschwindigkeits-GPS-Datenstr\u00f6men&#8221;. Expertensysteme mit Anwendungen. 44: 275\u2013288.  doi:10.1016 \/ j.eswa.2015.08.048.^ Stevenson, Erin (16. Dezember 2011), &#8220;Tech Beat: K\u00f6nnen Sie Predictive Analytics f\u00fcr das Gesundheitswesen aussprechen?&#8221;, Times-Standard, archiviert von das Original am 4. August 2014abgerufen 2. Juli, 2012^ Lindert, Bryan (Oktober 2014). &#8220;Eckerd Rapid Safety Feedback bringt Business Intelligence zum Wohl der Kinder&#8221; (PDF). Politik &#038; Praxis.  Abgerufen 3. M\u00e4rz, 2016.^ &#8220;Florida nutzt Predictive Analytics, um Todesf\u00e4lle bei Kindern zu verhindern &#8211; andere Staaten folgen&#8221;. Die Huffington Post.  2015-12-21.  Abgerufen 2016-03-25.^ McKay, Lauren (August 2009), &#8220;Das neue Rezept f\u00fcr Pharma&#8221;, Ziel-CRM, archiviert von das Original am 10.07.2015abgerufen 2012-07-02^ Gaeth, Andrae. &#8220;Evaluierung von Predictive Analytics f\u00fcr die Kapazit\u00e4tsplanung&#8221; (PDF). www.hisa.org.au..  Abgerufen 22. November 2018.^ De, Shaunak;  Maity, Abhishek;  Goel, Vritti;  Shitole, Sanjay;  Bhattacharya, Avik (2017). &#8220;Vorhersage der Popularit\u00e4t von Instagram-Posts f\u00fcr ein Lifestyle-Magazin mithilfe von Deep Learning&#8221;. 2017 2. Internationale Konferenz f\u00fcr Kommunikationssysteme, Computer und IT-Anwendungen (CSCITA).  S. 174\u2013177.  doi:10.1109 \/ CSCITA.2017.8066548.  ISBN 978-1-5090-4381-1.  S2CID 35350962.^ Personali (2018-10-11). &#8220;Glossar zur UX-Optimierung> Data Science> Web Analytics> Predictive Analytics&#8221;. www.personali.com.  Abgerufen 2018-10-22.^ Finlay, Steven (2014). Predictive Analytics, Data Mining und Big Data.  Mythen, Missverst\u00e4ndnisse und Methoden (1. Aufl.).  Basingstoke: Palgrave Macmillan.  p.  237. ISBN 978-1137379276.^ Siegel, Eric (2013). Predictive Analytics: Die F\u00e4higkeit, vorherzusagen, wer klicken, kaufen, l\u00fcgen oder sterben wird (1. Aufl.).  Wiley.  ISBN 978-1-1183-5685-2.^ &#8220;Neue Strategien zur Messung des Kindeswohlrisikos l\u00e4ngst \u00fcberf\u00e4llig &#8211; Die Chronik des sozialen Wandels&#8221;. Die Chronik des sozialen Wandels.  2016-02-03.  Abgerufen 2016-04-04.^ &#8220;Eine nationale Strategie zur Beseitigung von Kindesmissbrauch und zur Vernachl\u00e4ssigung von Todesf\u00e4llen&#8221; (PDF).  Kommission zur Beseitigung von Kindesmissbrauch und Vernachl\u00e4ssigung von Todesf\u00e4llen.  (2016).  Abgerufen 14. April 2018.^ Dinov, Ivo D.;  Heavner, Ben;  Tang, Ming;  Glusman, Gustavo;  Mangold, Kyle;  Darcy, Mike;  Madduri, Ravi;  Pa, Judy;  Spino, Cathie;  Kesselman, Carl;  Foster, Ian;  Deutsch, Eric W.;  Price, Nathan D.;  Van Horn, John D.;  Ames, Joseph;  Clark, Kristi;  Hood, Leroy;  Hampstead, Benjamin M.;  Dauer, William;  Toga, Arthur W. (2016). &#8220;Predictive Big Data Analytics: Eine Studie zur Parkinson-Krankheit unter Verwendung gro\u00dfer, komplexer, heterogener, inkongruenter, quellen\u00fcbergreifender und unvollst\u00e4ndiger Beobachtungen&#8221;. PLUS EINS. 11 (8): e0157077.  Bibcode:2016PLoSO..1157077D.  doi:10.1371 \/ journal.pone.0157077.  PMC 4975403.  PMID 27494614.^ Vorhersage von Gerichtsentscheidungen des Europ\u00e4ischen Gerichtshofs f\u00fcr Menschenrechte: eine Perspektive der Verarbeitung nat\u00fcrlicher Sprache^ AI prognostiziert Ergebnisse von Menschenrechtsstudien^ Dhar, Vasant (April 2011).  &#8220;Prognose auf den Finanzm\u00e4rkten: Der Fall f\u00fcr kleine Disjunkte&#8221;. ACM-Transaktionen zu intelligenten Systemen und Technologien. 2 (3).  doi:10.1145 \/ 1961189.1961191.  S2CID 11213278.^ Dhar, Vasant;  Chou, Dashin;  Provost Foster (Oktober 2000). &#8220;Mit GLOWER interessante Muster f\u00fcr Investitionsentscheidungen entdecken &#8211; ein genetischer Lernalgorithmus, der mit Entropiereduktion \u00fcberlagert ist&#8221;. Data Mining und Knowledge Discovery. 4 (4): 251\u2013280.  doi:10.1023 \/ A: 1009848126475.  S2CID 1982544.^ http:\/\/www.hcltech.com\/sites\/default\/files\/key_to_monetizing_big_data_via_predictive_analytics.pdf^ Schiff, Mike (6. M\u00e4rz 2012), BI-Experten: Warum Predictive Analytics weiter wachsen wird, Das Data Warehouse Institut^ &#8220;Predictive Analytics f\u00fcr sich entwickelnde Datenstr\u00f6me&#8221; (PDF).^ Ben-Gal I. Dana A.;  Shkolnik N. und Singer (2014). &#8220;Effiziente Konstruktion von Entscheidungsb\u00e4umen nach der Dual Information Distance-Methode&#8221; (PDF).  Qualit\u00e4tstechnologie und quantitatives Management (QTQM), 11 (1), 133-147. ^ Ben-Gal I.;  Shavitt Y.;  Weinsberg E.;  Weinsberg U. (2014). &#8220;Abrufen von Peer-to-Peer-Informationen mithilfe von Clustering mit gemeinsam genutzten Inhalten&#8221; (PDF). Knowl Inf Syst. 39 (2): 383\u2013408.  doi:10.1007 \/ s10115-013-0619-9.  S2CID 16437786.^ Halper, Fern (1. November 2011), &#8220;Die Top 5 Trends in Predictive Analytics&#8221;, Informationsmanagement^ MacLennan, Jamie (1. Mai 2012), 5 Mythen \u00fcber Predictive Analytics, Das Data Warehouse Institut^ Temple-Raston, Dina (8. Oktober 2012), Vorhersage der Zukunft: Fantasie oder ein guter Algorithmus?, NPR^ Alverson, Cameron (September 2012), Umfragen und statistische Modelle k\u00f6nnen die Zukunft nicht vorhersagenCameron Alverson^ Shmueli, Galit (01.08.2010).  &#8220;Erkl\u00e4ren oder vorhersagen?&#8221;. Statistische Wissenschaft. 25 (3): 289\u2013310.  arXiv:1101.0891.  doi:10.1214 \/ 10-STS330.  ISSN 0883-4237.  S2CID 15900983.Weiterf\u00fchrende Literatur[edit]Agresti, Alan (2002). Kategoriale Datenanalyse.  Hoboken: John Wiley und S\u00f6hne.  ISBN 0-471-36093-7.Coggeshall, Stephen, Davies, John, Jones, Roger. Und Schutzer, Daniel, &#8220;Intelligent Security Systems&#8221;, in Roy S. Freedman, Robert A. Flein und Jess Lederman, Herausgeber (1995). K\u00fcnstliche Intelligenz auf den Kapitalm\u00e4rkten.  Chicago: Irwin.  ISBN 1-55738-811-3.CS1-Wartung: mehrere Namen: Autorenliste (Link)L. Devroye;  L. Gy\u00f6rfi;  G. Lugosi (1996). Eine probabilistische Theorie der Mustererkennung.  New York: Springer-Verlag.  ISBN 9781461207115.Enders, Walter (2004). Angewandte Zeitreihen\u00f6konometrie.  Hoboken: John Wiley und S\u00f6hne.  ISBN 0-521-83919-X.Greene, William (2012). Econometric Analysis, 7. Aufl.  London: Prentice Hall.  ISBN 978-0-13-139538-1.Guid\u00e8re, Mathieu;  Howard N, Sh.  Argamon (2009). Rich Language Analysis zur Terrorismusbek\u00e4mpfung.  Berlin, London, New York: Springer-Verlag.  ISBN 978-3-642-01140-5.Mitchell, Tom (1997). Maschinelles Lernen.  New York: McGraw-Hill.  ISBN 0-07-042807-7.Siegel, Eric (2016). Predictive Analytics: Die F\u00e4higkeit, vorherzusagen, wer klicken, kaufen, l\u00fcgen oder sterben wird.  John Wiley.  ISBN 978-1119145677.Tukey, John (1977). Explorative Datenanalyse.  New York: Addison-Wesley.  ISBN 0-201-07616-0.Finlay, Steven (2014). Predictive Analytics, Data Mining und Big Data.  Mythen, Missverst\u00e4ndnisse und Methoden.  Basingstoke: Palgrave Macmillan.  ISBN 978-1-137-37927-6.Coker, Frank (2014). Puls: Die Lebenszeichen Ihres Unternehmens verstehen.  Bellevue, WA: Ambient Light Publishing.  ISBN 978-0-9893086-0-1.     (adsbygoogle = window.adsbygoogle || []).push({});after-content-x4"},{"@context":"http:\/\/schema.org\/","@type":"BreadcrumbList","itemListElement":[{"@type":"ListItem","position":1,"item":{"@id":"https:\/\/wiki.edu.vn\/wiki22\/#breadcrumbitem","name":"Enzyklop\u00e4die"}},{"@type":"ListItem","position":2,"item":{"@id":"https:\/\/wiki.edu.vn\/wiki22\/2020\/12\/31\/predictive-analytics-wikipedia\/#breadcrumbitem","name":"Predictive Analytics &#8211; Wikipedia"}}]}]