[{"@context":"http:\/\/schema.org\/","@type":"BlogPosting","@id":"https:\/\/wiki.edu.vn\/all2pl\/wiki27\/rozroznij-jaro-winkler-wikipedia\/#BlogPosting","mainEntityOfPage":"https:\/\/wiki.edu.vn\/all2pl\/wiki27\/rozroznij-jaro-winkler-wikipedia\/","headline":"Rozr\u00f3\u017cnij Jaro-Winkler-Wikipedia","name":"Rozr\u00f3\u017cnij Jaro-Winkler-Wikipedia","description":"before-content-x4 Artyku\u0142 w Wikipedii, Free L’Encyclop\u00e9i. after-content-x4 . Odleg\u0142o\u015b\u0107 jar-winkler mierzy podobie\u0144stwo mi\u0119dzy dwoma ci\u0105gami znak\u00f3w. Jest to wariant zaproponowany","datePublished":"2020-02-15","dateModified":"2020-02-15","author":{"@type":"Person","@id":"https:\/\/wiki.edu.vn\/all2pl\/wiki27\/author\/lordneo\/#Person","name":"lordneo","url":"https:\/\/wiki.edu.vn\/all2pl\/wiki27\/author\/lordneo\/","image":{"@type":"ImageObject","@id":"https:\/\/secure.gravatar.com\/avatar\/44a4cee54c4c053e967fe3e7d054edd4?s=96&d=mm&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/44a4cee54c4c053e967fe3e7d054edd4?s=96&d=mm&r=g","height":96,"width":96}},"publisher":{"@type":"Organization","name":"Enzyklop\u00e4die","logo":{"@type":"ImageObject","@id":"https:\/\/wiki.edu.vn\/wiki4\/wp-content\/uploads\/2023\/08\/download.jpg","url":"https:\/\/wiki.edu.vn\/wiki4\/wp-content\/uploads\/2023\/08\/download.jpg","width":600,"height":60}},"image":{"@type":"ImageObject","@id":"https:\/\/wikimedia.org\/api\/rest_v1\/media\/math\/render\/svg\/eb8baad278d51283e0ef3c99898d583cf2c8a8fd","url":"https:\/\/wikimedia.org\/api\/rest_v1\/media\/math\/render\/svg\/eb8baad278d51283e0ef3c99898d583cf2c8a8fd","height":"","width":""},"url":"https:\/\/wiki.edu.vn\/all2pl\/wiki27\/rozroznij-jaro-winkler-wikipedia\/","wordCount":7599,"articleBody":" (adsbygoogle = window.adsbygoogle || []).push({});before-content-x4Artyku\u0142 w Wikipedii, Free L’Encyclop\u00e9i. (adsbygoogle = window.adsbygoogle || []).push({});after-content-x4. Odleg\u0142o\u015b\u0107 jar-winkler mierzy podobie\u0144stwo mi\u0119dzy dwoma ci\u0105gami znak\u00f3w. Jest to wariant zaproponowany w 1999 roku przez Williama E. Winklera, wynikaj\u0105cy z Odleg\u0142o\u015b\u0107 roku (1989, Matthew A. Jaro), kt\u00f3ry jest stosowany g\u0142\u00f3wnie w wykrywaniu duplikat\u00f3w. Wynik jest standaryzowany tak, aby mie\u0107 miar\u0119 mi\u0119dzy 0 a 1, wi\u0119c 0 reprezentuje brak podobie\u0144stwa i 1, r\u00f3wno\u015b\u0107 kana\u0142\u00f3w por\u00f3wnywanych. (adsbygoogle = window.adsbygoogle || []).push({});after-content-x4Ta miara jest szczeg\u00f3lnie odpowiednia do leczenia kr\u00f3tkich \u0142a\u0144cuch\u00f3w, takich jak nazwy lub has\u0142a. Odleg\u0142o\u015b\u0107 Jaro mi\u0119dzy kana\u0142ami S 1{DisplayStyle S_ {1}} I (adsbygoogle = window.adsbygoogle || []).push({});after-content-x4S 2{DisplayStyle S_ {2}} jest zdefiniowany przez: dj= 13(m|s1|+m|s2|+m\u2212tm){DisplayStyle d_ {j} = {frac {1} {3}} po lewej ({frac {m} {| s_ {1} |}}+{frac {m} {| s_ {2} |}}+{frac {M-T} {M}} right)} Lub: |si|{DisplayStyle | S_ {i} |} to d\u0142ugo\u015b\u0107 sznurka znaku si{DisplayStyle S_ {i}} ; M {DisplayStyle M} to liczba odpowiadaj\u0105ce znaki (patrz poni\u017cej); T {DisplayStyle T} to liczba Transpozycje (patrz poni\u017cej). Dwie identyczne postacie S 1{DisplayStyle S_ {1}} i S 2{DisplayStyle S_ {2}} s\u0105 rozwa\u017cane korespondenci Je\u015bli ich odleg\u0142o\u015b\u0107 (tj. R\u00f3\u017cnica mi\u0119dzy ich pozycjami w odpowiednich kana\u0142ach) nie przekracza: \u230amax(|s1|,|s2|)2\u230b– Pierwszy {displayStyle leftlfloor {frac {max (| s_ {1} |, | s_ {2} |)} {2}} Rightrfloor -1} . Liczb\u0119 transpozycji uzyskuje si\u0119 przez por\u00f3wnanie I -. odpowiedni z S 1{DisplayStyle S_ {1}} Z posta\u0107 i odpowiedni z S 2{DisplayStyle S_ {2}} . Liczba razy te znaki s\u0105 r\u00f3\u017cne, podzielone przez dwa, daje liczb\u0119 Transpozycje . Metoda wprowadzona przez Winklera u\u017cywa Wsp\u00f3\u0142czynnik przedrostka P {DisplayStyle P} kt\u00f3ry promuje \u0142a\u0144cuchy, zaczynaj\u0105c od przedrostka d\u0142ugo\u015bci \u2113 {DisplayStyle ELL} (z \u2113 \u2264 4 {DisplayStyle ell leq 4} ). Bior\u0105c pod uwag\u0119 dwa kana\u0142y S 1{DisplayStyle S_ {1}} I S 2{DisplayStyle S_ {2}} , ich odleg\u0142o\u015b\u0107 od Jaro-Winkler D w{DisplayStyle D_ {w}} Wsch\u00f3d : dw= dj+ ( \u2113 P ( Pierwszy – dj) ) {DisplayStyle d_ {w} = d_ {j}+(ell p (1-d_ {j})} Lub : Lub dwa kana\u0142y S 1{DisplayStyle S_ {1}} Martha I S 2{DisplayStyle S_ {2}} Marhta . Przygotujemy ich Tabela korespondencyjna . Tutaj maksymalna odleg\u0142o\u015b\u0107 wynosi 6\/2 – 1 = 2. W \u017c\u00f3\u0142tych skrzynkach poni\u017cszej tabeli zarejestrujemy si\u0119 zatem 1, gdy znaki s\u0105 identyczne (istnieje korespondencja ) i 0 w przeciwnym razie: M A R T H A M Pierwszy 0 0 0 0 0 A 0 Pierwszy 0 0 0 0 R 0 0 Pierwszy 0 0 0 H 0 0 0 0 Pierwszy 0 T 0 0 0 Pierwszy 0 0 A 0 0 0 0 0 Pierwszy M = 6 {DisplayStyle M = 6} (liczba 1 w tabeli) |s1|= 6 {DisplayStyle | S_ {1} | = 6} |s2|= 6 {DisplayStyle | S_ {2} | = 6} Postaci korespondenci s\u0105 {m, a, r, t, h, a} s1{DisplayStyle S_ {1}} i {m, a, r, h, t, a} s2{DisplayStyle S_ {2}} . Rozwa\u017caj\u0105c te uporz\u0105dkowane zestawy, mamy zatem 2 pary (t\/h i h\/t) znak\u00f3w korespondenci R\u00f3\u017cne, dwa p\u00f3\u0142-przenoszenie. Sk\u0105d T = 22= Pierwszy {DisplayStyle t = {frac {2} {2}} = 1} Odleg\u0142o\u015b\u0107 Jaro to: dj= 13(66+66+6\u221216)= 0,944 {DisplayStyle d_ {j} = {frac {1} {3}} po lewej ({frac {6} {6}}+{frac {6} {6}}+{frac {6-1} {6}} prawy prawy ) = 0 {,} 944} Odleg\u0142o\u015b\u0107 jaro-winklera z P = 0 W Pierwszy {DisplayStyle p = 0 {,} 1} z prefiksem d\u0142ugo\u015bci \u2113 = 3 {DisplayStyle ell = 3} staje si\u0119 dw= 0,944 + ( 3 \u00d7 0 ,Pierwszy ( Pierwszy – 0,944 ) ) = 0,961 {DisplayStyle D_ {w} = 0 {,} 944+ (3Times 0 {,} 1 (1-0 {,} 944)) = 0 {,} 961} Z kana\u0142ami S 1{DisplayStyle S_ {1}} Dwayne I S 2{DisplayStyle S_ {2}} Duane znale\u017ali\u015bmy : M = 4 {DisplayStyle M = 4} |s1|= 6 {DisplayStyle | S_ {1} | = 6} |s2|= 5 {DisplayStyle | S_ {2} | = 5} T = 0 {DisplayStyle t = 0} Odleg\u0142o\u015b\u0107 Jaro to: dj= 13(46+45+4\u221204)= 0,822 {DisplayStyle d_ {j} = {frac {1} {3}} po lewej ({frac {4} {6}}+{frac {4} {5}}+{frac {4-0} {4}} po prawej stronie ) = 0 {,} 822} Z Jaro-Winkler z \u2113 = Pierwszy {DisplayStyle ell = 1} : dw= 0,822 + ( Pierwszy \u00d7 0 ,Pierwszy ( Pierwszy – 0,822 ) ) = 0 ,84 {DisplayStyle D_ {w} = 0 {,} 822+ (1Times 0 {,} 1 (1-0 {,} 822)) = 0 {,} 84} Z kana\u0142ami S 1{DisplayStyle S_ {1}} Dixon I S 2{DisplayStyle S_ {2}} Dicksonx , otrzymujemy: D I X O N D Pierwszy 0 0 0 0 I 0 Pierwszy 0 0 0 C 0 0 0 0 0 K 0 0 0 0 0 S 0 0 0 0 0 O 0 0 0 Pierwszy 0 N 0 0 0 0 Pierwszy X 0 0 0 0 0 Obliczamy maksymaln\u0105 odleg\u0142o\u015b\u0107 dla kryterium korespondencji \u230amax(|s1|,|s2|)2\u230b– Pierwszy = \u230a 82\u230b – Pierwszy = 3 {displayStyle leftlfloor {frac {max (| s_ {1} |, | s_ {2} |)} {2}} rightrfloor -1 = lfloor {frac {8} {2}} rfloor -1 = 3} 3} . M = 4 {DisplayStyle M = 4} (Zar\u00f3wno X to jest korespondent nie, poniewa\u017c s\u0105 daleko od wi\u0119cej ni\u017c 3 znak\u00f3w) |s1|= 5 {DisplayStyle | S_ {1} | = 5} |s2|= 8 {DisplayStyle | S_ {2} | = 8} T = 0 {DisplayStyle t = 0} Odleg\u0142o\u015b\u0107 Jaro: dj= 13(45+48+4\u221204)= 0,767 {DisplayStyle d_ {j} = {frac {1} {3}} po lewej ({frac {4} {5}}+{frac {4} {8}}+{frac {4-0} {4}} po prawej stronie ) = 0,767} Odleg\u0142o\u015b\u0107 jaro-winklera z \u2113 = 2 {DisplayStyle ell = 2} : dw= 0,767 + ( 2 \u00d7 0 ,Pierwszy ( Pierwszy – 0,767 ) ) = 0,813 {DisplayStyle D_ {w} = 0 {,} 767+ (2Times 0 {,} 1 (1-0 {,} 767)) = 0 {,} 813} (W) Jaro, M. A., ‘ Post\u0119py w rekordowej metodologii \u0142\u0105cz\u0105cej zastosowanie do spisu powszechnego Tampa Florida z 1985 r. \u00bb W Journal of the American Statistical Society W tom. 84, N O 406, 1989 W P. 414-420 (W) Jaro, M. A., ‘ Probabilistyczne powi\u0105zanie du\u017cego pliku danych zdrowia publicznego \u00bb W Statystyki w medycynie W tom. 14, 1995 W P. 491-498 ( Czytaj online ) (W) Winkler, W. E., ‘ Stan powi\u0105zania rekord\u00f3w i aktualne problemy badawcze \u00bb W Statystyki dzia\u0142u dochod\u00f3w, publikacja us\u0142ug przychod\u00f3w wewn\u0119trznych R99\/04 W 1999 ( Czytaj online ) (W) Winkler, W. E., ‘ Przegl\u0105d powi\u0105za\u0144 rekord\u00f3w i aktualnych kierunk\u00f3w bada\u0144 \u00bb W Seria raport\u00f3w badawczych, RRS W 2006 ( Czytaj online ) (adsbygoogle = window.adsbygoogle || []).push({});after-content-x4"},{"@context":"http:\/\/schema.org\/","@type":"BreadcrumbList","itemListElement":[{"@type":"ListItem","position":1,"item":{"@id":"https:\/\/wiki.edu.vn\/all2pl\/wiki27\/#breadcrumbitem","name":"Enzyklop\u00e4die"}},{"@type":"ListItem","position":2,"item":{"@id":"https:\/\/wiki.edu.vn\/all2pl\/wiki27\/rozroznij-jaro-winkler-wikipedia\/#breadcrumbitem","name":"Rozr\u00f3\u017cnij Jaro-Winkler-Wikipedia"}}]}]