Algoritmo Smith -Waterman -Wikipedia、LA Enciclopedia free

彼 スミスウォーターマンアルゴリズム これは、生物学的配列（DNA、RNA、またはタンパク質）の局所整列を実行するための認識された戦略です。言い換えれば、いくつかのシーケンス間で同様の領域を決定します。

SWアルゴリズムは、1981年にTemple SmithとMichael Watermanによって提案されました。 ^{[ 初め ]}これは、動的プログラミングアルゴリズムの使用に基づいているため、使用される特定のスコアシステム（置換マトリックスなど）に関して、局所アライメントが最適であることを確認するという望ましい特性があります。

いくつかのシーケンスを調整するための基本的な代替品は、ローカルアライメントとグローバルアライメントです。

グローバルアライメントは、各シーケンスに各シンボル（または残基）を整列させることを目的としています。この戦略は、整列するシーケンスが非常に類似しており、ほぼ同じサイズである場合に特に役立ちます。対照的に、アライメントするシーケンスに大きな違いがある場合、ローカルアライメントはより有用ですが、類似性の領域があると疑われています。

ショーン

{displaystyle a = a_ {1} a_ {2} … a_ {n}}

${displaystyle A=a_{1}a_{2}...a_{n}}$ と

{displaystyle b = b_ {1} b_ {2} … b_ {m}}

${displaystyle B=b_{1}b_{2}...b_{m}}$ 整列する2つの生物学的配列、その長さは

{displaystyle n}

$n$ と

{displaystyle m}

$m$ それぞれ。 2つの要素間の類似性スコア

{displaystyle a}

$a$ と

{displaystyle b}

$b$ によって与えられます

{displaystyleS（a、b）}

${displaystyle s(a,b)}$ 。長さの排除ごとに

{displaystyle k}

$k$ ペナルティが割り当てられます

{displaystylew_ {k}}

${displaystyle W_{k}}$ 。

類似性が非常に高いセグメントをいくつか見つけるには、マトリックスが構築されています ${displaystyle h}$
各値 ${displaystyle h_ {ij}}$
最大の類似性でセグメントのペアを回復するために、の逆トラッキングが最大要素から実行されます ${displaystyle h}$

Table of Contents

アルゴリズムの複雑さ [ 編集します ]

Smith-Watermanアルゴリズムには、一時的な複雑さがあります

{displaystyle o（nm^{2}）}

after-content-x4

${displaystyle O(nm^{2})}$ の空間的な複雑さ

{displaystyle o（nm）}

${displaystyle O(nm)}$ 。これは、ブルートフォースアプローチに関する計算コストの大幅な減少を表しています。

{displaystyle o（n^{3} m^{3}）}

${displaystyle O(n^{3}m^{3})}$ それらが存在するからです

{displaystyle {binu {n} {2}}}}

${displaystyle {binom {n}{2}}}$ と

{displaystyle {binom {m} {2}}}

${displaystyle {binom {m}{2}}}$ のサブケンス

{displaystyle a}

$A$ と

{displaystyle b}

$B$ それぞれ。ただし、その複雑さは、Needleman-Wunschアルゴリズムの複雑さと比較して不利な点を表しています。 ^{[ 2 ]}それは線形の複雑さを持っています。特にの価値の場合

{displaystyle m}

$m$ 非常に大きいです。それが、線形実行時間がある代替案が開発された理由です ^{[ 3 ]} ^{[ 4 ]}その他は、に関して線形空間的な複雑さを備えています

after-content-x4

{displaystyle n}

$n$ 。 ^{[ 5 ]}

例 [ 編集します ]

ショーン

{displaystyle a}

$A$ ：aaggct y

{displaystyle b}

$B$ ：AACCCG類似性スコアに合わせて2つのシーケンスは、次の関係によって与えられます。

{displaystyle s（a_ {i}、b_ {j}）= {begin {cases}+1、quad a_ {i} = b_ {j} \ -1、quad a_ {i} neq b_ {j} end {cases}}}}}

${displaystyle s(a_{i},b_{j})={begin{cases}+1,quad a_{i}=b_{j}\-1,quad a_{i}neq b_{j}end{cases}}}$ 。

スコアマトリックスは初期化されます

{displaystyle 0}

${displaystyle 0}$ 最初の列と最前列のすべての要素について。
次に、すべての句読点が間に計算されます

{displaystyle a_ {i}}

$a_{{i}}$ と

{displaystyle b_ {j}}

${displaystyle b_{j}}$ 、から始まる

{displaystyle a_ {1}}

${displaystyle a_{1}}$ と

{displaystyle b_ {1}}

${displaystyle b_{1}}$ 、次のマトリックスに黄色で示されます。

	a	a	c	c	c	g
	0	0	0	0	0	0
a	初め
a
g
g
c
t

すべての値が計算されると、緑で示される最大スコアで要素が求められます。

	a	a	c	c	c	g
	0	0	0	0	0	0
a	初め	初め	0	0	0	0
a	初め	2	初め	0	0	0
g	0	初め	初め	0	0	初め
g	0	0	0	0	0	初め
c	0	0	初め	初め	初め	0
t	0	0	0	0	0	0

最後に、の最適なローカルアライメントを回復するため

{displaystyle a}

$A$ と

{displaystyle b}

$B$ その要素から、値のある要素に到達するまで追跡が実行されます

{displaystyle 0}

${displaystyle 0}$ 。

	a	a	c	c	c	g
	0	0	0	0	0	0
a	初め	初め	0	0	0	0
a	初め	2	初め	0	0	0
g	0	初め	初め	0	0	初め
g	0	0	0	0	0	初め
c	0	0	初め	初め	初め	0
t	0	0	0	0	0	0

この例から生じるアライメントは、各シーケンスの最初の2つの要素のみを整列することです。

勝負を受けて立つ
||
勝負を受けて立つ

ギャップによるペナルティ [ 編集します ]

線形ペナルティ [ 編集します ]

穴のペナルティは、インデルのスコア、つまり挿入または排除を決定するのに役立ちます。 Smith-Watermanアルゴリズムは、ペナルティがあるホールの長さを延長するために線形ペナルティを使用します。

{displaystylew_ {k}}

${displaystyle W_{k}}$ 長さのみに依存します

{displaystyle k}

$k$ 穴とコストの

{distrastaStyle w_ {1}}

${displaystyle w_{1}}$ 単一のスペースホールの：

{displaystyle w_ {k} = kw_ {1}}

${displaystyle W_{k}=kw_{1}}$ 。

凸状のくぼみ [ 編集します ]

ウォーターマン ^{[ 6 ]}彼は、さらに柔軟なペナルティシステムを提案しました。穴の開始と延長のコストが一定である関連ホールモデルとは異なり、

{displaystyleu}

$u$ と

{displaystyle v}

$v$ それぞれ、凸穴のペナルティでは、その長さが増加するにつれて穴を延長するコストが減少します。

{displaystyle w_ {k+1} -w_ {k} leq w_ {k} -w_ {k-1}}

${displaystyle W_{k+1}-W_{k}leq W_{k}-W_{k-1}}$ 。

Algoritmo Smith -Waterman -Wikipedia、LA Enciclopedia free

アルゴリズムの複雑さ [ 編集します ]

例 [ 編集します ]

ギャップによるペナルティ [ 編集します ]

線形ペナルティ [ 編集します ]

関連穴 [ 編集します ]

凸状のくぼみ [ 編集します ]

参照してください [ 編集します ]

参照 [ 編集します ]

外部リンク [ 編集します ]

Recent Posts

Recent Comments

Archives

Categories

Meta