はてなブログトップ

Suffix Array

このタグでブログを書く

言葉の解説

ネットで話題

関連ブログ

Suffix Array

(コンピュータ)

【さふぃっくすあれい】

文字列 T[0..n] に対する部分文字列 P[0..m] の探索を O(m lg n) で可能とするデータ構造。

文字列 T[0..n] における全部分文字列の出現位置を配列 SA[0..n] に保持し、SA を T に対して辞書式順にソートした配列 (接尾辞配列 = Suffix Array) を利用する。

例として "abracadabra" という文字列を考える。abracadabra の部分文字列の出現位置を列挙すると

0  => abracadabra
1  => bracadabra
2  => racadabra
3  => acadabra
4  => cadabra
5  => adabra
6  => dabra
7  => abra
8  => bra
9  => ra
10 => a

となる。この出現位置を、辞書式順にソートする

10 => a
7  => abra
0  => abracadabra
3  => acadabra
5  => adabra
8  => bra
1  => bracadabra
4  => cadabra
6  => dabra
9  => ra
2  => racadabra

ソートの結果得られた [ 10, 7, 0, 3, 5, 8, 1, 4, 6, 9, 2 ] という配列が SA である。"abracadabra" に対する部分文字列検索は、SA と元テキストを使った二分探索により実装できる。

Suffix Array を利用すると部分文字列を高速に検索することができるが

大規模なデータから Suffix Array を構築するには、その大規模なデータにおける部分文字列をすべて保持する必要がある (空間コスト)
大規模データから Suffix Array を構築するには大規模なソートを行う必要がある (時間コスト)

という二点の課題がある。この課題を解決するための方法はこれまで様々なものが提案されており、前者に対しては Suffix Array に特化したソートアルゴリズム、後者に対しては圧縮全文索引などを利用するなどの手法が提案されている。

このタグの解説について

この解説文は、すでに終了したサービス「はてなキーワード」内で有志のユーザーが作成・編集した内容に基づいています。その正確性や網羅性をはてなが保証するものではありません。問題のある記述を発見した場合には、お問い合わせフォームよりご連絡ください。

ネットで話題

もっと見る

154ブックマーク Burrows Wheeler Transform と Suffix Array - naoyaのはてなダイアリー

naoya-2.hatenadiary.org

129ブックマーク suffix array 更新履歴 2004/01/07 　O(N) 構築アルゴリズム三種追加（Ko &Alulu, Kim & al., Karkkainen & Sanders) Suffix Arrayは、最近注目を集めているデータ構造です。その理由として、 (1)大規模なデータに対して、高速に検索、情報抽出を行うことができる (2)BWTとしてデータ圧縮に用いることができる。ことが挙げられます。...

homepage3.nifty.com

85ブックマーク Algorithm - Suffix Array を JavaScript で再発明してみた : 404 Blog Not Found

dankogai.livedoor.blog

83ブックマーク横着プログラミング第9回: sary: Suffix Array のライブラリとツール最終更新日: 2002-12-18 (公開日: 2002-12-18) Unix Magazine 誌に 2002年1月号から 2003年2月号にかけて連載していた記事の元の原稿です。私にフローチャートだけを見せて、テーブルは見せないとしたら、私はずっと煙に巻かれたままになるだろう。逆にテーブルが見せてもらえるなら、フローチャートはたいてい必要...

77ブックマークはてなブックマークFirefox拡張, JavaScript で IS 法による Suffix Array 構築 - naoyaのはてなダイアリー

naoya-2.hatenadiary.org

47ブックマーク [を] Suffix Array の解説文書のリンク集 Suffix Array の解説文書のリンク集 2006-04-10-3 [Algorithm] Suffix Array について解説している日本語による文書のうち、 Webで閲覧できるもののリンク集。随時更新予定。 - 用語解説: Suffix Array (PDF) via http://nais.to/~yto/tools/sufary/ - Suffix Array の解説 in D論 (PDF) via http://nais.to/~yto/tools/...

38ブックマーク [を] Suffix Array の解説文書のリンク集

32ブックマーク sary: a suffix array library and tools What is sary? sary is a suffix array library and tools. It provides fast full-text search facilities for text files on the order of 10 to 100 MB using a data structure called a suffix array. It can also search specific fields in a text file by assigning index points to those fields. Table of Cont...

sary.sourceforge.net

32ブックマーク Suffix Array を作る - SA-IS の実装 Suffix Array は今若者の間で人気のデータ構造です．マイ suffix array を実装することで，オシャレ度がアップしてモテ系になり，女子力も上がると言われています．その中でも今特に，手軽でクールな SA-IS (アルファベットサイズ固定の下で線形時間で省メモリで suffix array が作れる今最強のアルゴリズム) の実装が...

blog.beam2d.net