[{"@context":"http:\/\/schema.org\/","@type":"BlogPosting","@id":"https:\/\/wiki.edu.vn\/wiki28\/2021\/08\/30\/hits-algorithmus-wikipedia\/#BlogPosting","mainEntityOfPage":"https:\/\/wiki.edu.vn\/wiki28\/2021\/08\/30\/hits-algorithmus-wikipedia\/","headline":"HITS-Algorithmus \u2013 Wikipedia","name":"HITS-Algorithmus \u2013 Wikipedia","description":"Hyperlink-induzierte Themensuche (HITS; auch bekannt als Hubs und Beh\u00f6rden) ist ein von Jon Kleinberg entwickelter Linkanalysealgorithmus, der Webseiten bewertet. Die","datePublished":"2021-08-30","dateModified":"2021-08-30","author":{"@type":"Person","@id":"https:\/\/wiki.edu.vn\/wiki28\/author\/lordneo\/#Person","name":"lordneo","url":"https:\/\/wiki.edu.vn\/wiki28\/author\/lordneo\/","image":{"@type":"ImageObject","@id":"https:\/\/secure.gravatar.com\/avatar\/44a4cee54c4c053e967fe3e7d054edd4?s=96&d=mm&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/44a4cee54c4c053e967fe3e7d054edd4?s=96&d=mm&r=g","height":96,"width":96}},"publisher":{"@type":"Organization","name":"Enzyklop\u00e4die","logo":{"@type":"ImageObject","@id":"https:\/\/wiki.edu.vn\/wiki4\/wp-content\/uploads\/2023\/08\/download.jpg","url":"https:\/\/wiki.edu.vn\/wiki4\/wp-content\/uploads\/2023\/08\/download.jpg","width":600,"height":60}},"image":{"@type":"ImageObject","@id":"https:\/\/upload.wikimedia.org\/wikipedia\/commons\/thumb\/b\/b0\/SetsEN.jpg\/220px-SetsEN.jpg","url":"https:\/\/upload.wikimedia.org\/wikipedia\/commons\/thumb\/b\/b0\/SetsEN.jpg\/220px-SetsEN.jpg","height":"146","width":"220"},"url":"https:\/\/wiki.edu.vn\/wiki28\/2021\/08\/30\/hits-algorithmus-wikipedia\/","wordCount":3782,"articleBody":"Hyperlink-induzierte Themensuche (HITS; auch bekannt als Hubs und Beh\u00f6rden) ist ein von Jon Kleinberg entwickelter Linkanalysealgorithmus, der Webseiten bewertet. Die Idee hinter Hubs and Authorities entstand aus einer besonderen Einsicht in die Erstellung von Webseiten, als das Internet urspr\u00fcnglich entstand; das hei\u00dft, bestimmte Webseiten, die als Hubs bekannt sind, dienten als gro\u00dfe Verzeichnisse, die in Bezug auf die Informationen, die sie enthielten, nicht wirklich ma\u00dfgeblich waren, sondern als Zusammenstellung eines breiten Informationskatalogs verwendet wurden, der Benutzer direkt zu anderen ma\u00dfgeblichen Seiten f\u00fchrte. Mit anderen Worten, ein guter Hub stellt eine Seite dar, die auf viele andere Seiten verweist, w\u00e4hrend eine gute Autorit\u00e4t eine Seite darstellt, die von vielen verschiedenen Hubs verlinkt ist.[1] Das Schema vergibt daher f\u00fcr jede Seite zwei Bewertungen: seine Autorit\u00e4t, die den Wert des Inhalts der Seite sch\u00e4tzt, und seinen Hub-Wert, der den Wert seiner Links zu anderen Seiten sch\u00e4tzt.Table of ContentsGeschichte[edit]In Zeitschriften[edit]Im Internet[edit]Algorithmus[edit]Im Detail[edit]Autorit\u00e4tsaktualisierungsregel[edit]Regel f\u00fcr Hub-Updates[edit]Normalisierung[edit]Pseudocode[edit]Nicht konvergierender Pseudocode[edit]Siehe auch[edit]Verweise[edit]Externe Links[edit]Geschichte[edit]In Zeitschriften[edit]Es wurden viele Methoden verwendet, um die Bedeutung wissenschaftlicher Zeitschriften einzustufen. Eine solche Methode ist der Impact-Faktor von Garfield. Zeitschriften wie Wissenschaft und Natur sind mit zahlreichen Zitaten gef\u00fcllt, wodurch diese Zeitschriften sehr hohe Impact-Faktoren haben. Wenn man also zwei eher obskure Zeitschriften vergleicht, die ungef\u00e4hr die gleiche Anzahl von Zitaten erhalten haben, aber eine dieser Zeitschriften viele Zitate von Wissenschaft und Natur, muss diese Zeitschrift h\u00f6her eingestuft werden. Mit anderen Worten, es ist besser, Zitate aus einer wichtigen Zeitschrift zu erhalten als aus einer unwichtigen.[2] Im Internet[edit]Dieses Ph\u00e4nomen tritt auch im Internet auf. Das Z\u00e4hlen der Links zu einer Seite kann uns eine allgemeine Einsch\u00e4tzung ihrer Bedeutung im Web geben, aber auch eine Seite mit sehr wenigen eingehenden Links kann auffallen, wenn zwei dieser Links von den Homepages von Websites wie Yahoo! stammen. Google oder MSN. Da diese Seiten von sehr hoher Bedeutung sind, aber auch Suchmaschinen sind, kann eine Seite viel h\u00f6her gerankt werden als ihre tats\u00e4chliche Relevanz.Algorithmus[edit] Erweiterung der Wurzelmenge in eine BasismengeBeim HITS-Algorithmus besteht der erste Schritt darin, die relevantesten Seiten f\u00fcr die Suchanfrage abzurufen. Dieses Set hei\u00dft die Wurzelsatz und kann erhalten werden, indem die von einem textbasierten Suchalgorithmus zur\u00fcckgegebenen Top-Seiten verwendet werden. EIN Basisset wird generiert, indem das Root-Set mit allen Webseiten, die von ihm verlinkt sind, und einigen Seiten, die darauf verweisen, erweitert wird. Die Webseiten im Basissatz und alle Hyperlinks zwischen diesen Seiten bilden ein fokussiertes Unterdiagramm. Die HITS-Berechnung wird nur auf diesem durchgef\u00fchrt fokussierter Untergraph. Laut Kleinberg besteht der Grund f\u00fcr die Konstruktion eines Basissatzes darin, sicherzustellen, dass die meisten (oder viele) der st\u00e4rksten Autorit\u00e4ten enthalten sind.Autorit\u00e4ts- und Hub-Werte werden in einer gegenseitigen Rekursion zueinander definiert. Ein Autorit\u00e4tswert wird als Summe der skalierten Hubwerte berechnet, die auf diese Seite verweisen. Ein Hub-Wert ist die Summe der skalierten Autorit\u00e4tswerte der Seiten, auf die er verweist. Einige Implementierungen ber\u00fccksichtigen auch die Relevanz der verlinkten Seiten. Der Algorithmus f\u00fchrt eine Reihe von Iterationen durch, die jeweils aus zwei grundlegenden Schritten bestehen:Autorit\u00e4tsupdate: Aktualisieren Sie die jedes Knotens Autorit\u00e4tsbewertung gleich der Summe der Hub-Scores von jedem Knoten, der darauf zeigt. Das hei\u00dft, ein Knoten erh\u00e4lt eine hohe Autorit\u00e4tsbewertung, indem er von Seiten verlinkt wird, die als Informations-Hubs erkannt werden.Hub-Update: Aktualisieren Sie die jedes Knotens Hub-Score gleich der Summe der Autorit\u00e4tsbewertungen von jedem Knoten, auf den es zeigt. Das hei\u00dft, einem Knoten wird eine hohe Hub-Punktzahl verliehen, indem er mit Knoten verkn\u00fcpft wird, die als Autorit\u00e4ten in diesem Bereich gelten.Der Hub-Score und Authority-Score f\u00fcr einen Knoten wird mit dem folgenden Algorithmus berechnet:Beginnen Sie damit, dass jeder Knoten einen Hub-Score und einen Autorit\u00e4ts-Score von 1 hat.F\u00fchren Sie die Autorit\u00e4tsaktualisierungsregel ausF\u00fchren Sie die Hub-Aktualisierungsregel ausNormalisieren Sie die Werte, indem Sie jeden Hub-Score durch die Quadratwurzel der Summe der Quadrate aller Hub-Scores dividieren und jeden Authority-Score durch die Quadratwurzel der Summe der Quadrate aller Authority-Scores dividieren.Ab dem zweiten Schritt nach Bedarf wiederholen.HITS ist wie Page und Brins PageRank ein iterativer Algorithmus, der auf der Verkn\u00fcpfung der Dokumente im Web basiert. Es gibt jedoch einige wesentliche Unterschiede:Sie ist abfrageabh\u00e4ngig, dh die aus der Linkanalyse resultierenden (Hubs and Authority) Scores werden von den Suchbegriffen beeinflusst;Als logische Folge wird es zur Abfragezeit und nicht zur Indexierungszeit mit dem zugeh\u00f6rigen Leistungseinbu\u00dfen ausgef\u00fchrt, das die Verarbeitung zur Abfragezeit begleitet.Es wird nicht h\u00e4ufig von Suchmaschinen verwendet. (Obwohl ein \u00e4hnlicher Algorithmus von Teoma verwendet wurde, das von Ask Jeeves\/Ask.com \u00fcbernommen wurde.)Es berechnet zwei Scores pro Dokument, Hub und Autorit\u00e4t, im Gegensatz zu einem einzelnen Score;Es wird auf einer kleinen Teilmenge von “relevanten” Dokumenten (einem “fokussierten Untergraphen” oder Basissatz) verarbeitet, nicht auf allen Dokumenten, wie es bei PageRank der Fall war.Im Detail[edit]Um das Ranking zu beginnen, lassen wir einduTh(P)=1{displaystyle mathrm {auth} (p)=1} und hduB(P)=1{displaystyle mathrm {hub} (p)=1} f\u00fcr jede Seite P{displaystyle p}. Wir betrachten zwei Arten von Updates: Autorit\u00e4tsaktualisierungsregel und Hub-Aktualisierungsregel. Um die Hub-\/Autorit\u00e4tsbewertungen jedes Knotens zu berechnen, werden wiederholte Iterationen der Autorit\u00e4tsaktualisierungsregel und der Hubaktualisierungsregel angewendet. Eine k-stufige Anwendung des Hub-Autorit\u00e4tsalgorithmus beinhaltet das k-malige Anwenden der Autorit\u00e4tsaktualisierungsregel und dann der Hub-Aktualisierungsregel.Autorit\u00e4tsaktualisierungsregel[edit]F\u00fcr jeden P{displaystyle p}, wir aktualisieren einduTh(P){displaystyle mathrm {auth} (p)} zu einduTh(P)=\u03a3Q\u2208PT\u00d6hduB(Q){displaystyle mathrm {auth} (p)=displaystyle sum nolimits_{qin P_{mathrm {to}}}mathrm {hub} (q)} wo PT\u00d6{displaystyle P_{mathrm {to}}} sind alle Seiten, die auf eine Seite verlinken P{displaystyle p}. Das hei\u00dft, die Autorit\u00e4tsbewertung einer Seite ist die Summe aller Hub-Bewertungen der Seiten, die darauf verweisen.Regel f\u00fcr Hub-Updates[edit]F\u00fcr jeden P{displaystyle p}, wir aktualisieren hduB(P){displaystyle mathrm {Hub} (p)} zu hduB(P)=\u03a3Q\u2208PFR\u00d6meinduTh(Q){displaystyle mathrm {hub} (p)=displaystyle sum nolimits_{qin P_{mathrm {from}}}mathrm {auth} (q)} wo PFR\u00d6m{displaystyle P_{mathrm {von} }} ist alle seiten welche seite P{displaystyle p} Links zu. Das hei\u00dft, der Hub-Score einer Seite ist die Summe aller Autorit\u00e4tsbewertungen der Seiten, auf die sie verweist.Normalisierung[edit]Die endg\u00fcltigen Knotenwerte der Hub-Autorit\u00e4t werden nach unendlichen Wiederholungen des Algorithmus bestimmt. Da die direkte und iterative Anwendung der Hub Update Rule und Authority Update Rule zu abweichenden Werten f\u00fchrt, ist es notwendig, die Matrix nach jeder Iteration zu normalisieren. Somit werden die aus diesem Prozess erhaltenen Werte schlie\u00dflich konvergieren.Pseudocode[edit]G\u00a0:= set of pagesfor each page p in G do p.auth = 1 \/\/ p.auth is the authority score of the page p p.hub = 1 \/\/ p.hub is the hub score of the page pfor step from 1 to k do \/\/ run the algorithm for k steps norm = 0 for each page p in G do \/\/ update all authority values first p.auth = 0 for each page q in p.incomingNeighbors do \/\/ p.incomingNeighbors is the set of pages that link to p p.auth += q.hub norm += square(p.auth) \/\/ calculate the sum of the squared auth values to normalise norm = sqrt(norm) for each page p in G do \/\/ update the auth scores p.auth = p.auth \/ norm \/\/ normalise the auth values norm = 0 for each page p in G do \/\/ then update all hub values p.hub = 0 for each page r in p.outgoingNeighbors do \/\/ p.outgoingNeighbors is the set of pages that p links to p.hub += r.auth norm += square(p.hub) \/\/ calculate the sum of the squared hub values to normalise norm = sqrt(norm) for each page p in G do \/\/ then update all hub values p.hub = p.hub \/ norm \/\/ normalise the hub valuesDie Hub- und Autorit\u00e4tswerte konvergieren im obigen Pseudocode.Der folgende Code konvergiert nicht, da die Anzahl der Schritte, f\u00fcr die der Algorithmus ausgef\u00fchrt wird, begrenzt werden muss. Eine M\u00f6glichkeit, dies zu umgehen, w\u00e4re jedoch, die Hub- und Autorit\u00e4tswerte nach jedem “Schritt” zu normalisieren, indem jeder Autorit\u00e4tswert durch die Quadratwurzel der Summe der Quadrate aller Autorit\u00e4tswerte geteilt wird und jeder Hubwert durch die Quadratwurzel der Summe der Quadrate aller Hubwerte. Dies ist, was der obige Pseudocode tut.Nicht konvergierender Pseudocode[edit]G\u00a0:= set of pagesfor each page p in G do p.auth = 1 \/\/ p.auth is the authority score of the page p p.hub = 1 \/\/ p.hub is the hub score of the page pfunction HubsAndAuthorities(G) for step from 1 to k do \/\/ run the algorithm for k steps for each page p in G do \/\/ update all authority values first p.auth = 0 for each page q in p.incomingNeighbors do \/\/ p.incomingNeighbors is the set of pages that link to p p.auth += q.hub for each page p in G do \/\/ then update all hub values p.hub = 0 for each page r in p.outgoingNeighbors do \/\/ p.outgoingNeighbors is the set of pages that p links to p.hub += r.authSiehe auch[edit]Verweise[edit]Externe Links[edit]"},{"@context":"http:\/\/schema.org\/","@type":"BreadcrumbList","itemListElement":[{"@type":"ListItem","position":1,"item":{"@id":"https:\/\/wiki.edu.vn\/wiki28\/#breadcrumbitem","name":"Enzyklop\u00e4die"}},{"@type":"ListItem","position":2,"item":{"@id":"https:\/\/wiki.edu.vn\/wiki28\/2021\/08\/30\/hits-algorithmus-wikipedia\/#breadcrumbitem","name":"HITS-Algorithmus \u2013 Wikipedia"}}]}]