Aalys Earley – Wikipedia

Posted on May 28, 2019 by lordneo

before-content-x4

W teorii języków, Algorytm Earleya jest algorytmem analizy syntaktycznej dla gramatyk niekonstkalnych opisanych po raz pierwszy przez Jaya Earleya ^{[[[ Pierwszy ]}. Jak algorytmy CYK i Glr , Algorytm Earleya oblicza wszystkie możliwe analizy zdania (i nie tylko jedna z tych analiz). Opiera się na dynamicznym programowaniu.

after-content-x4

Możemy zbudować analizator Earley dla dowolnej gramatyki niekonstkalnej. Biega w czasie sześciennym (o (n ³), Lub N jest długością łańcucha wejściowego). W przypadku gramatyki nieobsługiwej analiza Earley przeprowadzana jest w czasie kwadratowym (n (n ²)).

Rozważ gramatykę niekonstologiczną, a także łańcuch wejściowy długości

{DisplayStyle n}

$n$ odnotowany

{DisplayStyle A_ {1} … a_ {n}}

${displaystyle a_{1} ... a_{n}}$ . Analiza według algorytmu Earley ma na celu rozpoznanie łańcucha, a zatem stwierdzenie, czy łańcuch jest częścią języka generowanego przez gramatykę.

Table of Contents

Przedmioty Earley et Table Earley [[[ modyfikator |. Modyfikator i kod ]

Algorytm Earleya manipuluje Przedmioty Earley , nazywany prosto rzeczy . Pozycja to dane:

after-content-x4

Zauważona zasada produkcji gramatyki ${DisplayStyle S Rightarrow Alpha}$
Indeks startowy ${DisplayStyle i}$
wskaźnik pozycji we właściwej części reguły, która jest reprezentowana przez a punkt .

Reprezentujemy element w formularzu

{DisplayStyle (A Rightarrow Alpha Bullet Beta, i)}

${displaystyle (A rightarrow alpha bullet beta ,i)}$ , Lub

{DisplayStyle 0leq Ileq n}

${displaystyle 0leq ileq n}$ .

Zasada algorytmu [[[ modyfikator |. Modyfikator i kod ]

Mamy stół

{DisplayStyle T}

$T$ sztywny

{DisplayStyle n+1}

$n+1$ gdzie przechowujemy zestawy przedmiotów Earleya, gdzie

{DisplayStyle n}

$n$ jest długością łańcucha wejściowego.

Obliczenia zaczyna się od

{DisplayStyle t [0]}

${displaystyle T[0]}$ zawierające elementy formularza

{DisplayStyle (s prawy Bullet Alpha, 0)}

${displaystyle (S rightarrow bullet alpha ,0)}$ Lub

{DisplayStyle s}

$S$ jest aksjomat gramatyki i

{DisplayStyle S Rightarrow Alpha}

${displaystyle S rightarrow alpha }$ jest zasadą produkcyjną. Przedmiot

{DisplayStyle (s prawy Bullet Alpha, 0)}

${displaystyle (S rightarrow bullet alpha ,0)}$ Reprezentuje sytuację, w której nic nie zostało rozpoznane, ale gdzie staramy się rozpoznać aksjomat od początku łańcucha wejściowego. Następnie wykonujemy krok 0, 1, …, do kroku n.

Cel kroku

{DisplayStyle J}

$j$ ma obliczyć, aby przechowywać w tabeli

${DisplayStyle t [j]}$

${displaystyle T[j]}$ , wszystkie przedmioty

{DisplayStyle (A Rightarrow Alpha Bullet Beta, i)}

${displaystyle (A rightarrow alpha bullet beta ,i)}$ Jak na przykład

{DisplayStyle A_ {i} … a_ {j}}

${displaystyle a_{i} ... a_{j}}$ jest rozpoznawany przez

{DisplayStyle Alpha}

$alpha$ .

Na scenie

{DisplayStyle J}

$j$ , obliczamy

${DisplayStyle t [j]}$

${displaystyle T[j]}$ z tabel

${DisplayStyle t [0], Dots, t [j-1]}$

${displaystyle T[0],dots ,T[j-1]}$ Nasety, w kolejności trzech operacji:

Czytanie (skaner po angielsku). Operacja odczytu jest przeprowadzana ${DisplayStyle Jgeq 1}$
Prognoza (predyktor w języku angielskim). I przedmiot z formularzy ${DisplayStyle (A Rightarrow Alpha Bullet Bbeta, i)}$
Ukończenie (pełne w języku angielskim) . I przedmiot z formularzy ${DisplayStyle (pocisk alfa prawej, i)}$

Analiza się powiódła, jeśli tabela

{DisplayStyle t [n]}

${displaystyle T[n]}$ Zawiera element w formie

{displayStyle (s praweArrow Alpha Bullet, 0)}

${displaystyle (S rightarrow alpha bullet ,0)}$ , Lub

{DisplayStyle S Rightarrow Alpha}

${displaystyle S rightarrow alpha }$ jest produkcją.

Rozważ kolejną gramatykę wyrażeń arytmetycznych:

{DisplayStyle s}

$S$ jest aksjomat gramatyki.

Przeanalizujmy łańcuch wejściowy

{DisplayStyle A+A}

${displaystyle a+a}$ . Następnie uzyskujemy następujące tabele. Zwrócimy uwagę „P:” Operację prognostyczną; „C:” Operacja ukończenia i „L:” Operacja czytania.

W kroku 0 obliczanie zaczyna się od

{DisplayStyle (Srightarrow Bullet E, 0)}

${displaystyle (Srightarrow bullet E,0)}$ . Następnie nasycimy operacją prognostyczną.

{DisplayStyle t [0]}

	${displaystyle Srightarrow bullet E}$	${displaystyle ,,0}$
P:	${displaystyle Erightarrow bullet E+N}$	${displaystyle ,,0}$
P:	${displaystyle Erightarrow bullet E-N}$	${displaystyle ,,0}$
P:	${displaystyle Erightarrow bullet N}$	${displaystyle ,,0}$
P:	${displaystyle Nrightarrow bullet N*F}$	${displaystyle ,,0}$
P:	${displaystyle Nrightarrow bullet N/F}$	${displaystyle ,,0}$
P:	${displaystyle Nrightarrow bullet F}$	${displaystyle ,,0}$
P:	${displaystyle Frightarrow bullet a}$	${displaystyle ,,0}$
P:	${displaystyle Frightarrow bullet -F}$	${displaystyle ,,0}$
P:	${displaystyle Frightarrow bullet +F}$	${displaystyle ,,0}$
P:	${displaystyle Frightarrow bullet (E)}$	${displaystyle ,,0}$

W kroku 1 otrzymujemy

{DisplayStyle Color {Red} (frightarrow Abullet, 0)}

${displaystyle color {Red}(Frightarrow abullet ,0)}$ przez operację czytania. Operacja przewidywania nic nie wytwarza, ponieważ wskaźnik położenia znajduje się na końcu właściwej części. Przedmiot

{DisplayStyle Color {Red} (frightarrow Abullet, 0)}

${displaystyle color {Red}(Frightarrow abullet ,0)}$ jest używany przez operację zakończenia do uzyskania

{DisplayStyle Color {Red} (nrightarrow fbullet, 0)}

${displaystyle color {Red}(Nrightarrow Fbullet ,0)}$ , Następnie

{DisplayStyle Color {Red} (erightarrow nbullet, 0)}

${displaystyle color {Red}(Erightarrow Nbullet ,0)}$ itd. do nasycenia operacji zakończenia.

{DisplayStyle t [1]}

L:	${displaystyle color {Red}Frightarrow abullet }$	${displaystyle color {Red},,0}$
C:	${displaystyle color {Red}Nrightarrow Fbullet }$	${displaystyle color {Red},,0}$
C:	${displaystyle color {Red}Erightarrow Nbullet }$	${displaystyle color {Red},,0}$
C:	${displaystyle Nrightarrow Nbullet *F}$	${displaystyle ,,0}$
C:	${displaystyle Nrightarrow Nbullet /F}$	${displaystyle ,,0}$
C:	${displaystyle color {Red}Srightarrow Ebullet }$	${displaystyle ,,0}$
C:	${displaystyle Erightarrow Ebullet +N}$	${displaystyle ,,0}$
C:	${displaystyle Erightarrow Ebullet -N}$	${displaystyle ,,0}$

W kroku 2 otrzymujemy

{DisplayStyle (Erightarrow E+Bullet N, 0)}

${displaystyle (Erightarrow E+bullet N,0)}$ czytając operację. Jak

{DisplayStyle n}

$N$ jest tuż po indeksie pozycji w pierwszej linii

{DisplayStyle t [2]}

${displaystyle T[2]}$ , dodajemy wszystkie zasady

{displayStyle (nrightarrow alpha)}

${displaystyle (Nrightarrow alpha )}$ W prognozie, z indeksem 2, który jest bieżącym wskaźnikiem pozycji.

{DisplayStyle t [2]}

L:	${displaystyle Erightarrow E+bullet N}$	${displaystyle ,,0}$
P:	${displaystyle Nrightarrow bullet N*F}$	${displaystyle ,,2}$
P:	${displaystyle Nrightarrow bullet N/F}$	${displaystyle ,,2}$
P:	${displaystyle Nrightarrow bullet F}$	${displaystyle ,,2}$
P:	${displaystyle Frightarrow bullet a}$	${displaystyle ,,2}$
P:	${displaystyle Frightarrow bullet -F}$	${displaystyle ,,2}$
P:	${displaystyle Frightarrow bullet +F}$	${displaystyle ,,2}$
P:	${displaystyle Frightarrow bullet (E)}$	${displaystyle ,,2}$

W kroku 3 czytamy

{DisplayStyle f}

$F$ , więc uzupełniamy

{DisplayStyle (Nrightarrow Bullet F, 2)}

${displaystyle (Nrightarrow bullet F,2)}$ z

{DisplayStyle t [2]}

${displaystyle T[2]}$ W

{displayStyle (nrightarrow fbullet, 2)}

${displaystyle (Nrightarrow Fbullet ,2)}$ . Jest więc zasada

{displayStyle (nrightarrow fbullet, 2)}

${displaystyle (Nrightarrow Fbullet ,2)}$ Tak więc zasada

{DisplayStyle (Erightarrow E+Bullet N, 0)}

${displaystyle (Erightarrow E+bullet N,0)}$ kończy się w

{DisplayStyle (Erightarrow e+nbullet, 0)}

${displaystyle (Erightarrow E+Nbullet ,0)}$ .

Nasyczymy przez zakończenie.

{DisplayStyle t [3]}

L:	${displaystyle color {Red}Frightarrow abullet }$	${displaystyle color {Red},,2}$
C:	${displaystyle color {Red}Nrightarrow Fbullet }$	${displaystyle color {Red},,2}$
C:	${displaystyle color {Red}Erightarrow E+Nbullet }$	${displaystyle color {Red},,0}$
C:	${displaystyle Nrightarrow Nbullet *F}$	${displaystyle ,,2}$
C:	${displaystyle Nrightarrow Nbullet /F}$	${displaystyle ,,2}$
C:	${displaystyle color {Red}Srightarrow Ebullet }$	${displaystyle color {Red},,0}$
C:	${displaystyle Erightarrow Ebullet +N}$	${displaystyle ,,0}$
C:	${displaystyle Erightarrow Ebullet -N}$	${displaystyle ,,0}$

Jak

{DisplayStyle Color {Red} (Srightarrow Ebullet, 0)}

${displaystyle color {Red}(Srightarrow Ebullet ,0)}$ jest w

{DisplayStyle t [3]}

${displaystyle T[3]}$ , słowo wejście jest rozpoznawane.

Złożoność espace [[[ modyfikator |. Modyfikator i kod ]

Albo

{DisplayStyle i}

$I$ Liczba osobnych elementów w indeksie bliskiego startu. Można to zwiększyć przy użyciu wielkości gramatyki: dla każdego elementu w gramatyce wskaźnik pozycji może mieć skończoną liczbę przestrzeni i dla każdej z tych pozycji uzyskujemy inny element. Otrzymujemy

{DisplayStyle i}

$I$ Licząc te elementy. W praktyce sprowadza się to do liczenia liczby możliwych lokalizacji symbolu

{DisplayStyle Bullet}

$bullet$ W zasadach produkcji gramatyki. W poprzednim przykładzie mamy zatem

{DisplayStyle i = 34}

${displaystyle I=34}$ .

Przy stole

{DisplayStyle t [j]}

${displaystyle T[j]}$ , każdy z

{DisplayStyle i}

$I$ elementy mogą pojawiać się z indeksem start pomiędzy

{DisplayStyle 0}

${displaystyle 0}$ I

{DisplayStyle J}

$j$ . Więc jest najwyżej

{DisplayStyle I. (j+1)}

${displaystyle I.(j+1)}$ elementy w tabeli

{DisplayStyle t [j] .J}

${displaystyle T[j].j}$ jest zwiększony przez

{DisplayStyle n}

$n$ Lub

{DisplayStyle n}

$n$ to rozmiar słowa wejściowego. Podsumowując

{DisplayStyle I. (j+1)}

${displaystyle I.(j+1)}$ Dla

{DisplayStyle J}

$j$ z

{DisplayStyle 0}

${displaystyle 0}$ ma

{DisplayStyle n}

$n$ , otrzymujemy

{DisplayStyle I. (n+1). (N+2)/2}

${displaystyle I.(n+1).(n+2)/2}$ Elementy co najwyżej w tabelach. Złożoność w przestrzeni jest zatem w O (N²).

Złożoność w czasie (sprawa ogólna) [[[ modyfikator |. Modyfikator i kod ]

Zbadajmy złożoność czytania operacji, prognozy i ukończenia na stole

{DisplayStyle t [j]}

${displaystyle T[j]}$ :

Czytanie analizuje elementy

{DisplayStyle t [j-1]}

${displaystyle T[j-1]}$ każdy w stałym czasie. Biorąc pod uwagę wielkość

{DisplayStyle t [j-1]}

${displaystyle T[j-1]}$ , operacja odczytu jest wykonywana w

{DisplayStyle o (j)}

${displaystyle O(j)}$ . Prognozy działa na każdym z elementów już obecnych w stałym czasie. Po odczytaniu liczba obecnych elementów jest w

{DisplayStyle o (j)}

${displaystyle O(j)}$ Dlatego przewidywanie jest wykonywane w

{DisplayStyle o (j)}

${displaystyle O(j)}$ . Ukończenie działa na każdym obecnym elemencie w czasie w zależności od wielkości tabeli, do której powraca jej indeks startowy. W najgorszym przypadku mogą być ograniczone do jednej drogi każdej z poprzednich tabel, co daje złożoność O (J²).

Podsumowując te złożoności

{DisplayStyle n}

$n$ Tabele, otrzymujemy złożoność w ostatnim czasie w O (n ³).

Złożoność w czasie (gramatyka non-ambiguë) [[[ modyfikator |. Modyfikator i kod ]

Które stawiają złożoność w O (n ³) była działaniem ukończenia. Teraz, jeśli gramatyka nie jest ambiguel, istnieje tylko jeden sposób na uzyskanie każdego elementu i rozmiar tabeli

{DisplayStyle t [j]}

${displaystyle T[j]}$ Po zakończeniu

{DisplayStyle o (j)}

${displaystyle O(j)}$ . Więc każdego z tych elementów można było uzyskać tylko w czasie

{DisplayStyle o (j)}

${displaystyle O(j)}$ . Następnie uzyskujemy, podsumowując złożoność w czasie w O (N²).

Analiza Earleya można wykonać za pomocą Acykliczny wykres zorientowany wejście ^{[[[ 4 ]}Zamiast ciąg znaków. Umożliwia to ustalenie kilku słów jako bardziej zwarty sposób, a także analizowanie kilku słów w tym samym czasie, dzięki czemu jest bardziej skuteczny. Tabele tabel są następnie wskaźnikami odpowiadającymi topologicznemu sortowaniu wykresu. Ponadto dla węzła indeksu J, operacja odczytu już nie używa

{DisplayStyle t [j-1]}

${displaystyle T[j-1]}$ więcej

{DisplayStyle t [k]}

${displaystyle T[k]}$ gdzie k jest wskaźnikiem węzła nadrzędnego badanego węzła.

after-content-x4

Aalys Earley – Wikipedia

Przedmioty Earley et Table Earley [[[ modyfikator |. Modyfikator i kod ]

Zasada algorytmu [[[ modyfikator |. Modyfikator i kod ]

Złożoność espace [[[ modyfikator |. Modyfikator i kod ]

Złożoność w czasie (sprawa ogólna) [[[ modyfikator |. Modyfikator i kod ]

Złożoność w czasie (gramatyka non-ambiguë) [[[ modyfikator |. Modyfikator i kod ]

Recent Posts

Recent Comments

Archives

Categories

Meta