Partitionsfunktion (Mathematik) – Wikipedia

before-content-x4

Das Partitionsfunktion oder Konfigurationsintegral, wie in der Wahrscheinlichkeitstheorie, Informationstheorie und dynamischen Systemen verwendet, ist eine Verallgemeinerung der Definition einer Partitionsfunktion in der statistischen Mechanik. Es ist ein Sonderfall einer Normalisierungskonstante in der Wahrscheinlichkeitstheorie für die Boltzmann-Verteilung. Die Partitionsfunktion tritt bei vielen Problemen der Wahrscheinlichkeitstheorie auf, weil in Situationen, in denen eine natürliche Symmetrie vorliegt, das zugehörige Wahrscheinlichkeitsmaß, das Gibbs-Maß, die Markov-Eigenschaft hat. Dies bedeutet, dass die Partitionsfunktion nicht nur in physikalischen Systemen mit Translationssymmetrie auftritt, sondern auch in so unterschiedlichen Umgebungen wie neuronalen Netzen (dem Hopfield-Netz) und Anwendungen wie Genomik, Korpuslinguistik und künstlicher Intelligenz, die Markov-Netze verwenden, und Markov Logiknetzwerke. Das Gibbs-Maß ist auch das einzigartige Maß, das die Eigenschaft hat, die Entropie für einen festen Erwartungswert der Energie zu maximieren; Dies liegt dem Auftreten der Partitionsfunktion bei Maximum-Entropie-Methoden und den daraus abgeleiteten Algorithmen zugrunde.

Die Partitionsfunktion verbindet viele verschiedene Konzepte und bietet somit einen allgemeinen Rahmen, in dem viele verschiedene Arten von Größen berechnet werden können. Insbesondere wird gezeigt, wie Erwartungswerte und Greensche Funktionen berechnet werden, um eine Brücke zur Fredholm-Theorie zu schlagen. Es bietet auch eine natürliche Umgebung für den Ansatz der Informationsgeometrie zur Informationstheorie, wobei die Fisher-Informationsmetrik als eine aus der Partitionsfunktion abgeleitete Korrelationsfunktion verstanden werden kann. es definiert zufällig eine Riemannsche Mannigfaltigkeit.

Wenn sich die Einstellung für Zufallsvariablen auf einen komplexen projektiven Raum oder einen projektiven Hilbert-Raum bezieht, der mit der Fubini-Study-Metrik geometrisiert wurde, ergeben sich die Ergebnisse der Quantenmechanik und allgemeiner die Ergebnisse der Quantenfeldtheorie. In diesen Theorien wird die Partitionsfunktion in der Pfadintegralformulierung mit großem Erfolg stark ausgenutzt, was zu vielen Formeln führt, die nahezu identisch mit den hier besprochenen sind. Da der zugrunde liegende Messraum im Gegensatz zum realwertigen Simplex der Wahrscheinlichkeitstheorie einen komplexen Wert hat, ist dies jedoch ein zusätzlicher Faktor von ich erscheint in vielen Formeln. Das Verfolgen dieses Faktors ist mühsam und wird hier nicht durchgeführt. Dieser Artikel konzentriert sich hauptsächlich auf die klassische Wahrscheinlichkeitstheorie, bei der die Summe der Wahrscheinlichkeiten eins ergibt.

Definition[edit]

Gegeben eine Reihe von Zufallsvariablen

X.ich{ displaystyle X_ {i}}

Werte annehmen

xich{ displaystyle x_ {i}}

und irgendeine Art von potentieller Funktion oder Hamiltonian

H.((x1,x2,){ displaystyle H (x_ {1}, x_ {2}, dots)}

ist die Partitionsfunktion definiert als

Die Funktion H. wird als eine reelle Funktion im Raum der Zustände verstanden

{X.1,X.2,}}{ displaystyle {X_ {1}, X_ {2}, cdots }}

während

β{ displaystyle beta}

ist ein reeller freier Parameter (üblicherweise die inverse Temperatur). Die Summe über die

xich{ displaystyle x_ {i}}

wird als Summe über alle möglichen Werte jeder der Zufallsvariablen verstanden

X.ich{ displaystyle X_ {i}}

könnte dauern. Somit ist die Summe durch ein Integral zu ersetzen, wenn die

X.ich{ displaystyle X_ {i}}

sind kontinuierlich und nicht diskret. So schreibt man

für den Fall von ständig variierenden

X.ich{ displaystyle X_ {i}}

.

Wann H. ist eine beobachtbare, wie eine endlichdimensionale Matrix oder ein unendlichdimensionaler Hilbert-Raumoperator oder ein Element einer C-Stern-Algebra, ist es üblich, die Summation als Spur auszudrücken, so dass

Wann H. ist unendlichdimensional, damit die obige Notation gültig ist, muss das Argument eine Trace-Klasse sein, dh eine Form, bei der die Summation existiert und begrenzt ist.

Die Anzahl der Variablen

X.ich{ displaystyle X_ {i}}

müssen nicht abzählbar sein, in welchem ​​Fall die Summen durch Funktionsintegrale ersetzt werden sollen. Obwohl es viele Notationen für funktionale Integrale gibt, wäre eine gemeinsame

Dies ist der Fall für die Partitionsfunktion in der Quantenfeldtheorie.

Eine übliche, nützliche Modifikation der Partitionsfunktion ist die Einführung von Hilfsfunktionen. Dies ermöglicht beispielsweise, dass die Partitionsfunktion als Erzeugungsfunktion für Korrelationsfunktionen verwendet wird. Dies wird nachstehend ausführlicher erörtert.

Der Parameter β[edit]

Die Rolle oder Bedeutung des Parameters

β{ displaystyle beta}

kann auf verschiedene Arten verstanden werden. In der klassischen Thermodynamik ist es eine inverse Temperatur. Allgemeiner würde man sagen, dass es die Variable ist, die mit einer (willkürlichen) Funktion konjugiert ist

H.{ displaystyle H}

der Zufallsvariablen

X.{ displaystyle X}

. Das Wort konjugieren hier wird im Sinne konjugierter verallgemeinerter Koordinaten in der Lagrange-Mechanik also richtig verwendet

β{ displaystyle beta}

ist ein Lagrange-Multiplikator. Es wird nicht selten als generalisierte Kraft bezeichnet. Allen diesen Konzepten ist gemeinsam, dass ein Wert festgehalten werden soll, da andere, die auf komplizierte Weise miteinander verbunden sind, variieren dürfen. Im aktuellen Fall ist der festzuhaltende Wert der Erwartungswert von

H.{ displaystyle H}

Auch wenn viele verschiedene Wahrscheinlichkeitsverteilungen genau denselben (festen) Wert ergeben können.

Für den allgemeinen Fall betrachtet man eine Reihe von Funktionen

{H.k((x1,)}}{ displaystyle {H_ {k} (x_ {1}, cdots) }}

dass jeder von den Zufallsvariablen abhängt

X.ich{ displaystyle X_ {i}}

. Diese Funktionen werden gewählt, weil man aus dem einen oder anderen Grund seine Erwartungswerte konstant halten möchte. Um die Erwartungswerte auf diese Weise einzuschränken, wendet man die Methode der Lagrange-Multiplikatoren an. Im allgemeinen Fall veranschaulichen Maximum-Entropie-Methoden die Art und Weise, wie dies durchgeführt wird.

Einige konkrete Beispiele sind angebracht. Bei grundlegenden thermodynamischen Problemen wird bei Verwendung des kanonischen Ensembles nur ein Parameter verwendet

β{ displaystyle beta}

spiegelt die Tatsache wider, dass es nur einen Erwartungswert gibt, der konstant gehalten werden muss: die freie Energie (aufgrund der Energieeinsparung). Für chemische Probleme mit chemischen Reaktionen bietet das große kanonische Ensemble die entsprechende Grundlage, und es gibt zwei Lagrange-Multiplikatoren. Eine besteht darin, die Energie konstant zu halten, und eine andere darin, die Partikelzahl konstant zu halten (da chemische Reaktionen die Rekombination einer festen Anzahl von Atomen beinhalten).

Für den allgemeinen Fall hat man

mit

β=((β1,β2,){ displaystyle beta = ( beta _ {1}, beta _ {2}, cdots)}

ein Punkt in einem Raum.

Für eine Sammlung von Observablen

H.k{ displaystyle H_ {k}}

würde man schreiben

Nach wie vor wird angenommen, dass das Argument von tr eine Traceklasse ist.

Das entsprechende Gibbs-Maß liefert dann eine Wahrscheinlichkeitsverteilung, so dass der Erwartungswert von jedem

H.k{ displaystyle H_ {k}}

ist ein fester Wert. Genauer gesagt hat man

mit den spitzen Klammern

H.k{ displaystyle langle H_ {k} rangle}

bezeichnet den erwarteten Wert von

H.k{ displaystyle H_ {k}}

, und

E.[]{ displaystyle mathrm {E} [;]}}

eine übliche alternative Notation sein. Eine genaue Definition dieses Erwartungswerts ist unten angegeben.

Obwohl der Wert von

β{ displaystyle beta}

wird allgemein als real angesehen, es muss im Allgemeinen nicht sein; Dies wird im folgenden Abschnitt Normalisierung erläutert. Die Werte von

β{ displaystyle beta}

kann als Koordinaten von Punkten in einem Raum verstanden werden; Dieser Raum ist in der Tat eine Mannigfaltigkeit, wie unten skizziert. Das Studium dieser Räume als Mannigfaltigkeiten bildet das Feld der Informationsgeometrie.

Symmetrie[edit]

Die potentielle Funktion selbst hat üblicherweise die Form einer Summe:

wo die Summe vorbei s ist eine Summe über eine Teilmenge der Potenzmenge P.((X.) des Sets

X.={x1,x2,}}{ displaystyle X = lbrace x_ {1}, x_ {2}, dots rbrace}

. In der statistischen Mechanik wie dem Ising-Modell liegt die Summe beispielsweise über Paaren nächster Nachbarn. In der Wahrscheinlichkeitstheorie wie Markov-Netzwerken kann die Summe über den Cliquen eines Graphen liegen. Für das Ising-Modell und andere Gittermodelle sind die maximalen Cliquen Kanten.

Die Tatsache, dass die potenzielle Funktion als Summe geschrieben werden kann, spiegelt normalerweise die Tatsache wider, dass sie unter der Wirkung einer Gruppensymmetrie, wie beispielsweise der translatorischen Invarianz, invariant ist. Solche Symmetrien können diskret oder kontinuierlich sein; Sie materialisieren sich in den Korrelationsfunktionen für die Zufallsvariablen (siehe unten). Somit wird eine Symmetrie im Hamilton-Operator zu einer Symmetrie der Korrelationsfunktion (und umgekehrt).

Diese Symmetrie hat eine kritisch wichtige Interpretation in der Wahrscheinlichkeitstheorie: Sie impliziert, dass das Gibbs-Maß die Markov-Eigenschaft hat; Das heißt, es ist in gewisser Weise unabhängig von den Zufallsvariablen, oder äquivalent dazu ist das Maß für die Äquivalenzklassen der Symmetrie identisch. Dies führt zu einem weit verbreiteten Auftreten der Partitionsfunktion bei Problemen mit der Markov-Eigenschaft, wie z. B. Hopfield-Netzwerken.

Als Maßnahme[edit]

Der Wert des Ausdrucks

kann als Wahrscheinlichkeit interpretiert werden, dass eine bestimmte Konfiguration von Werten

((x1,x2,){ displaystyle (x_ {1}, x_ {2}, dots)}

tritt im System auf. Somit ist eine bestimmte Konfiguration gegeben

((x1,x2,){ displaystyle (x_ {1}, x_ {2}, dots)}

,

ist die Wahrscheinlichkeit der Konfiguration

((x1,x2,){ displaystyle (x_ {1}, x_ {2}, dots)}

im System auftreten, das jetzt richtig normalisiert ist, so dass

0P.((x1,x2,)1{ displaystyle 0 leq P (x_ {1}, x_ {2}, dots) leq 1}

und so, dass die Summe über alle Konfigurationen eins ergibt. Als solches kann die Partitionsfunktion so verstanden werden, dass sie ein Maß (ein Wahrscheinlichkeitsmaß) für den Wahrscheinlichkeitsraum bereitstellt; formal wird es das Gibbs-Maß genannt. Es verallgemeinert die engeren Konzepte des großen kanonischen Ensembles und des kanonischen Ensembles in der statistischen Mechanik.

Es gibt mindestens eine Konfiguration

((x1,x2,){ displaystyle (x_ {1}, x_ {2}, dots)}

für die die Wahrscheinlichkeit maximiert ist; Diese Konfiguration wird üblicherweise als Grundzustand bezeichnet. Wenn die Konfiguration eindeutig ist, wird der Grundzustand genannt nicht entartetund das System soll ergodisch sein; sonst ist der Grundzustand degenerieren. Der Grundzustand kann mit den Generatoren der Symmetrie pendeln oder nicht; Wenn es pendelt, spricht man von einer unveränderlichen Maßnahme. Wenn es nicht pendelt, wird die Symmetrie als spontan gebrochen bezeichnet.

Bedingungen, unter denen ein Grundzustand existiert und einzigartig ist, sind durch die Karush-Kuhn-Tucker-Bedingungen gegeben; Diese Bedingungen werden üblicherweise verwendet, um die Verwendung des Gibbs-Maßes bei Problemen mit maximaler Entropie zu rechtfertigen.[citation needed]

Normalisierung[edit]

Die Werte von

β{ displaystyle beta}

hängen von dem mathematischen Raum ab, über den das Zufallsfeld variiert. Realwertige Zufallsfelder nehmen also Werte auf einem Simplex an: Dies ist die geometrische Art zu sagen, dass die Summe der Wahrscheinlichkeiten eins ergeben muss. Für die Quantenmechanik erstrecken sich die Zufallsvariablen über einen komplexen Projektionsraum (oder einen komplexwertigen projektiven Hilbert-Raum), wobei die Zufallsvariablen als Wahrscheinlichkeitsamplituden interpretiert werden. Der Schwerpunkt liegt hier auf dem Wort projektiv, da die Amplituden immer noch auf eins normiert sind. Die Normalisierung für die Potentialfunktion ist der Jacobi für den entsprechenden mathematischen Raum: Sie ist 1 für gewöhnliche Wahrscheinlichkeiten und ich für den Hilbert-Raum; so sieht man in der Quantenfeldtheorie

ichtH.{ displaystyle itH}

im Exponential statt

βH.{ displaystyle beta H}

. Die Partitionsfunktion wird bei der Pfadintegralformulierung der Quantenfeldtheorie mit großer Wirkung sehr stark genutzt. Abgesehen von diesem Unterschied und der Tatsache, dass sie normalerweise eher auf vierdimensionaler Raumzeit als allgemein formuliert ist, ist die Theorie dort nahezu identisch mit der hier vorgestellten.

Erwartungswerte[edit]

Die Partitionsfunktion wird üblicherweise als Erzeugungsfunktion für Erwartungswerte verschiedener Funktionen der Zufallsvariablen verwendet. Also zum Beispiel nehmen

β{ displaystyle beta}

als einstellbarer Parameter dann die Ableitung von

Log((Z.((β)){ displaystyle log (Z ( beta))}

in Gedenken an

β{ displaystyle beta}

gibt den Durchschnitt (Erwartungswert) von an H.. In der Physik würde dies als durchschnittliche Energie des Systems bezeichnet.

In Anbetracht der obigen Definition des Wahrscheinlichkeitsmaßes ist der Erwartungswert einer Funktion f der Zufallsvariablen X. kann nun wie erwartet geschrieben werden: also für diskrete Werte X.schreibt man

Die obige Notation ist für eine endliche Anzahl diskreter Zufallsvariablen streng korrekt, sollte jedoch für kontinuierliche Variablen als etwas “informell” angesehen werden. Richtig, die obigen Summierungen sollten durch die Notationen der zugrunde liegenden Sigma-Algebra ersetzt werden, die zur Definition eines Wahrscheinlichkeitsraums verwendet wird. Das heißt, die Identitäten bleiben bestehen, wenn sie auf einem Messraum richtig formuliert sind.

So ist beispielsweise die Entropie gegeben durch

Das Gibbs-Maß ist die eindeutige statistische Verteilung, die die Entropie für einen festen Erwartungswert der Energie maximiert. Dies liegt seiner Verwendung bei Methoden mit maximaler Entropie zugrunde.

Informationsgeometrie[edit]

Die Punkte

β{ displaystyle beta}

kann so verstanden werden, dass es einen Raum und insbesondere eine Mannigfaltigkeit bildet. Es ist daher vernünftig, nach der Struktur dieser Mannigfaltigkeit zu fragen; Dies ist die Aufgabe der Informationsgeometrie.

Mehrere Ableitungen in Bezug auf die Lagrange-Multiplikatoren führen zu einer positiven semidefiniten Kovarianzmatrix

Diese Matrix ist positiv semidefinit und kann als metrischer Tensor interpretiert werden, insbesondere als Riemannsche Metrik. Wenn Sie den Raum der Lagrange-Multiplikatoren auf diese Weise mit einer Metrik ausstatten, wird daraus eine Riemannsche Mannigfaltigkeit.[1] Das Studium solcher Mannigfaltigkeiten wird als Informationsgeometrie bezeichnet; Die obige Metrik ist die Fisher-Informationsmetrik. Hier,

β{ displaystyle beta}

dient als Koordinate am Verteiler. Es ist interessant, die obige Definition mit den einfacheren Fisher-Informationen zu vergleichen, von denen sie inspiriert sind.

Dass das Obige die Fisher-Informationsmetrik definiert, lässt sich leicht erkennen, wenn der Erwartungswert explizit ersetzt wird:

wo wir geschrieben haben

P.((x){ displaystyle P (x)}

zum

P.((x1,x2,){ displaystyle P (x_ {1}, x_ {2}, dots)}

und die Summation wird so verstanden, dass sie über allen Werten aller Zufallsvariablen liegt

X.k{ displaystyle X_ {k}}

. Bei stetig bewerteten Zufallsvariablen werden die Summierungen natürlich durch Integrale ersetzt.

Seltsamerweise kann die Fisher-Informationsmetrik auch als euklidische Flachraummetrik nach entsprechender Änderung von Variablen verstanden werden, wie im Hauptartikel beschrieben. Wenn der

β{ displaystyle beta}

sind komplexwertig, die resultierende Metrik ist die Fubini-Study-Metrik. Wenn es in gemischten Zuständen anstelle von reinen Zuständen geschrieben wird, wird es als Bures-Metrik bezeichnet.

Korrelationsfunktionen[edit]

Durch die Einführung künstlicher Hilfsfunktionen

J.k{ displaystyle J_ {k}}

In die Partitionsfunktion kann es dann verwendet werden, um den Erwartungswert der Zufallsvariablen zu erhalten. So zum Beispiel durch Schreiben

man hat dann

als Erwartungswert von

xk{ displaystyle x_ {k}}

. In der Pfadintegralformulierung der Quantenfeldtheorie werden diese Hilfsfunktionen üblicherweise als Quellfelder bezeichnet.

Mehrfachdifferenzierungen führen zu den verbundenen Korrelationsfunktionen der Zufallsvariablen. Also die Korrelationsfunktion

C.((xj,xk){ displaystyle C (x_ {j}, x_ {k})}

zwischen Variablen

xj{ displaystyle x_ {j}}

und

xk{ displaystyle x_ {k}}

ist gegeben durch:

Gaußsche Integrale[edit]

Für den Fall wo H. kann als quadratische Form geschrieben werden, an der ein Differentialoperator beteiligt ist, d. h

dann kann die Partitionsfunktion als Summe oder Integral über Gaußsche verstanden werden. Die Korrelationsfunktion

C.((xj,xk){ displaystyle C (x_ {j}, x_ {k})}

kann als die Greensche Funktion für den Differentialoperator verstanden werden (und im Allgemeinen zur Fredholmschen Theorie führen). In der Einstellung der Quantenfeldtheorie werden solche Funktionen als Propagatoren bezeichnet; Korrelatoren höherer Ordnung werden n-Punkt-Funktionen genannt; Die Arbeit mit ihnen definiert die effektive Wirkung einer Theorie.

Wenn die Zufallsvariablen Anti-Pendler-Grassmann-Zahlen sind, kann die Partitionsfunktion als Determinante des Operators ausgedrückt werden D.. Dies erfolgt durch Schreiben als Berezin-Integral (auch Grassmann-Integral genannt).

Allgemeine Eigenschaften[edit]

Partitionsfunktionen werden verwendet, um die kritische Skalierung und Universalität zu diskutieren, und unterliegen der Renormierungsgruppe.

Siehe auch[edit]

Verweise[edit]


after-content-x4