[{"@context":"http:\/\/schema.org\/","@type":"BlogPosting","@id":"https:\/\/wiki.edu.vn\/all2pl\/wiki27\/model-wektorowy-wikipedia\/#BlogPosting","mainEntityOfPage":"https:\/\/wiki.edu.vn\/all2pl\/wiki27\/model-wektorowy-wikipedia\/","headline":"Model wektorowy – Wikipedia","name":"Model wektorowy – Wikipedia","description":"before-content-x4 Artyku\u0142 w Wikipedii, Free L’Encyclop\u00e9i. after-content-x4 I Model wektorowy (Czasami nazwany Semantyka wektorowa ) to algebraiczna metoda reprezentowania dokumentu","datePublished":"2019-03-01","dateModified":"2019-03-01","author":{"@type":"Person","@id":"https:\/\/wiki.edu.vn\/all2pl\/wiki27\/author\/lordneo\/#Person","name":"lordneo","url":"https:\/\/wiki.edu.vn\/all2pl\/wiki27\/author\/lordneo\/","image":{"@type":"ImageObject","@id":"https:\/\/secure.gravatar.com\/avatar\/44a4cee54c4c053e967fe3e7d054edd4?s=96&d=mm&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/44a4cee54c4c053e967fe3e7d054edd4?s=96&d=mm&r=g","height":96,"width":96}},"publisher":{"@type":"Organization","name":"Enzyklop\u00e4die","logo":{"@type":"ImageObject","@id":"https:\/\/wiki.edu.vn\/wiki4\/wp-content\/uploads\/2023\/08\/download.jpg","url":"https:\/\/wiki.edu.vn\/wiki4\/wp-content\/uploads\/2023\/08\/download.jpg","width":600,"height":60}},"image":{"@type":"ImageObject","@id":"https:\/\/wikimedia.org\/api\/rest_v1\/media\/math\/render\/svg\/add78d8608ad86e54951b8c8bd6c8d8416533d20","url":"https:\/\/wikimedia.org\/api\/rest_v1\/media\/math\/render\/svg\/add78d8608ad86e54951b8c8bd6c8d8416533d20","height":"","width":""},"url":"https:\/\/wiki.edu.vn\/all2pl\/wiki27\/model-wektorowy-wikipedia\/","wordCount":2320,"articleBody":" (adsbygoogle = window.adsbygoogle || []).push({});before-content-x4Artyku\u0142 w Wikipedii, Free L’Encyclop\u00e9i. (adsbygoogle = window.adsbygoogle || []).push({});after-content-x4I Model wektorowy (Czasami nazwany Semantyka wektorowa ) to algebraiczna metoda reprezentowania dokumentu maj\u0105cego na celu rozliczenie semantyki, zaproponowan\u0105 przez Gerarda Saltona w latach siedemdziesi\u0105tych [[[ Pierwszy ] . Jest u\u017cywany w wyszukiwaniu informacji, w szczeg\u00f3lno\u015bci w zakresie bada\u0144 dokumentalnych, klasyfikacji lub filtrowania danych. Ten model pierwotnie dotyczy\u0142 dokument\u00f3w tekstowych i zosta\u0142 rozszerzony od czasu innych rodzaj\u00f3w tre\u015bci. Pierwszym przyk\u0142adem u\u017cycia tego modelu jest inteligentny system. (adsbygoogle = window.adsbygoogle || []).push({});after-content-x4Model wektorowy jest matematycznym przedstawieniem tre\u015bci dokumentu, zgodnie z podej\u015bciem algebraicznym. Zestaw dokument\u00f3w jest s\u0142ownictwem, w tym warunki indeksowania. S\u0105 to zazwyczaj najwa\u017cniejsze s\u0142owa rozwa\u017canego korpusu: nazwy wsp\u00f3lne, nazwy w\u0142a\u015bciwe, przymiotniki … Mog\u0105 by\u0107 bardziej skomplikowanymi konstrukcjami, takimi jak wyra\u017cenia lub jednostki semantyczne. Ka\u017cdy element s\u0142ownictwa jest powi\u0105zany z pojedynczym dowolnym indeksem. Ka\u017cda zawarto\u015b\u0107 jest zatem reprezentowana przez wektor W , kt\u00f3rego wymiar odpowiada wielko\u015bci s\u0142ownictwa. Ka\u017cdy element W I wektor W sk\u0142ada si\u0119 z wagi zwi\u0105zanej z ko\u0144cem indeksu I i pr\u00f3bka tekstu. Prostym przyk\u0142adem jest identyfikacja W I liczba wyst\u0105pie\u0144 terminu I W pr\u00f3bce tekstowej. Sk\u0142adnik wektora reprezentuje zatem wag\u0119 s\u0142owa I {DisplayStyle i} W dokumencie. Jednym z najcz\u0119\u015bciej u\u017cywanych wzor\u00f3w wa\u017cenia jest TF-IDF. (adsbygoogle = window.adsbygoogle || []).push({});after-content-x4Bior\u0105c pod uwag\u0119 wektor reprezentacj\u0119 korpusu dokument\u00f3w, mo\u017cemy wprowadzi\u0107 poj\u0119cie przestrzeni wektorowej na przestrzeni dokument\u00f3w w j\u0119zyku naturalnym. Dochodzimy do koncepcji matematycznej blisko\u015bci mi\u0119dzy dokumentami. Wprowadzaj\u0105c odpowiednie miary podobie\u0144stwa, mo\u017cemy okre\u015bli\u0107 ilo\u015bciowo semantyczn\u0105 blisko\u015b\u0107 mi\u0119dzy r\u00f3\u017cnymi dokumentami. Miary podobie\u0144stwa s\u0105 wybierane zgodnie z aplikacj\u0105. Powszechnie stosowan\u0105 miar\u0105 jest podobie\u0144stwo cosinus, kt\u00f3re polega na ilo\u015bciowym kwantyfikacji podobie\u0144stwa mi\u0119dzy dwoma dokumentami poprzez obliczenie cosinusu mi\u0119dzy ich wektorami. Blisko\u015b\u0107 \u017c\u0105dania Q {DisplayStyle Q} do dokumentu D 1{DisplayStyle D_ {1}} W ten spos\u00f3b zostanie podany przez: sa\u0142ata \u2061 \u03b1= d1\u22c5q\u2016d1\u2016\u2016q\u2016{DisplayStyle Cost {alpha} = {frac {frac {d_ {1}} cdot mathbf {q}} {lewy | mathbf {d_ {1}} w prawo | lewy | Mathbf {q} w prawo |}}}}}}} Utrzymuj\u0105c Cosinusa, wyra\u017camy podobie\u0144stwo. W szczeg\u00f3lno\u015bci warto\u015b\u0107 zerowa wskazuje, \u017ce \u017c\u0105danie jest \u015bci\u015ble ortogonalne do dokumentu. Fizycznie odzwierciedla to brak wsp\u00f3lnych s\u0142\u00f3w mi\u0119dzy Q {DisplayStyle Q} I D 1{DisplayStyle D_ {1}} . Ponadto miara ta nie jest wra\u017cliwa na standard wektor\u00f3w, wi\u0119c nie uwzgl\u0119dnia d\u0142ugo\u015bci dokument\u00f3w. Zalet\u0105 podobie\u0144stwa cosinus jest to, \u017ce mo\u017ce on skutecznie skorzysta\u0107 z odwr\u00f3conej implementacji indeksu, pod warunkiem, \u017ce dokumenty s\u0105 r\u00f3wnie\u017c indeksowane. Ka\u017cdy niezale\u017cnie od elementu \u017c\u0105dania Q {DisplayStyle Q} Pozwala znale\u017a\u0107 potencjalnie istotne dokumenty, a produkt skalarny (licznik podobie\u0144stwa Cosinus) jest jednocze\u015bnie obliczany przez akumulacj\u0119 \u201eonline\u201d. R\u00f3wnie skuteczn\u0105 alternatyw\u0105 jest obliczenie kwadratu standardu L2 mi\u0119dzy Q {DisplayStyle Q} I D 1{DisplayStyle D_ {1}} Wyra\u017cone przez: \u2016 q\u2212d1\u201622= \u2016 q\u201622+ \u2016 d1\u201622– 2 d1\u22c5 q{DisplayStyle | Mathbf {q-d_ {1}} | _ {2}^{2} = | Mathbf {q} | _ {2}^{2}+| mathbf {d_ {1}} | _ {2} ^{2} -2mathbf {d_ {1}} cdot mathbf {q}} Takie podej\u015bcie w zale\u017cno\u015bci od tych samych wielko\u015bci, co podobie\u0144stwo cosinus, obliczanie za pomoc\u0105 wdra\u017cania odwrotnego jest r\u00f3wnie skuteczne. W\u015br\u00f3d istniej\u0105cych aplikacji mo\u017cemy zacytowa\u0107: Kategoryzacja: automatycznie grupowanie dokument\u00f3w w predefiniowanych kategoriach. Klasyfikacja: Bior\u0105c pod uwag\u0119 zestaw dokument\u00f3w, automatycznie okre\u015bla kategorie, kt\u00f3re umo\u017cliwi\u0105 oddzielenie dokument\u00f3w w najlepszy mo\u017cliwy spos\u00f3b (kategoryzacja nie nadzorowana). Badania dokument\u00f3w: Znajd\u017a dokumenty, kt\u00f3re najlepiej spe\u0142niaj\u0105 \u017c\u0105danie (co robi wyszukiwarka); \u017b\u0105danie u\u017cytkownika jest uwa\u017cane za dokument, przet\u0142umaczony na wektor i w por\u00f3wnaniu z wektorami zawartymi w korpusie indeksowanych dokument\u00f3w. Filtr: klasyfikuj dokumenty w locie w predefiniowanych kategoriach (na przyk\u0142ad zidentyfikuj spam na podstawie podejrzanej liczby wyst\u0105pienia s\u0142owa \u201epenis\u201d w e -mailu i wysy\u0142aj go automatycznie do kosza). Model wektorowy jest stosunkowo prosty do zrozumienia (algebra liniowa) i jest \u0142atwy do wdro\u017cenia. Umo\u017cliwia to do\u015b\u0107 skuteczne znalezienie dokument\u00f3w w nieustrukturyzowanym korpusie (wyszukiwanie informacji), jego skuteczno\u015b\u0107 zale\u017cna od du\u017cej cz\u0119\u015bci jako\u015bci reprezentacji (s\u0142ownictwo i schemat wa\u017cenia). Reprezentacja wektorowa umo\u017cliwia r\u00f3wnie\u017c korespondencj\u0119 dokument\u00f3w z niedoskona\u0142ym \u017c\u0105daniem. Obejmuje to r\u00f3wnie\u017c kilka ogranicze\u0144, kt\u00f3re dla niekt\u00f3rych zosta\u0142y poprawione przez udoskonalenia modelu. W szczeg\u00f3lno\u015bci ten model zak\u0142ada, \u017ce \u200b\u200bwarunki reprezentatywne s\u0105 niezale\u017cne. Zatem w tek\u015bcie kolejno\u015b\u0107 s\u0142\u00f3w nie jest brana pod uwag\u0119. W najprostszej wersji nie bierze r\u00f3wnie\u017c pod uwag\u0119 synonim\u00f3w ani morfologii tre\u015bci. Bibliografia [[[ modyfikator |. Modyfikator i kod ] Powi\u0105zane artyku\u0142y [[[ modyfikator |. Modyfikator i kod ] (adsbygoogle = window.adsbygoogle || []).push({});after-content-x4"},{"@context":"http:\/\/schema.org\/","@type":"BreadcrumbList","itemListElement":[{"@type":"ListItem","position":1,"item":{"@id":"https:\/\/wiki.edu.vn\/all2pl\/wiki27\/#breadcrumbitem","name":"Enzyklop\u00e4die"}},{"@type":"ListItem","position":2,"item":{"@id":"https:\/\/wiki.edu.vn\/all2pl\/wiki27\/model-wektorowy-wikipedia\/#breadcrumbitem","name":"Model wektorowy – Wikipedia"}}]}]