NEWS

PFIの最新のニュースをおとどけします

2007年3月5日 12:00:00

高速なゲノム解析処理を1台のPCで実現する全文検索エンジン『Sedue Flex』を発表


報道関係者各位 プレスリリース
2007年 3月 5日
株式会社 Preferred Infrastructure

高速なゲノム解析処理を1台のPCで実現する全文検索エンジン
『Sedue Flex』

有限会社Preferred Infrastructure(本社:東京都練馬区、代表取締役:西川 徹)は、最先端の文字列検索アルゴリズムを利用し、曖昧検索処理を高速に実現 する検索エンジン『Sedue Flex』を発表いたします。

■概要

今回発表する『Sedue Flex』は、ゲノムや音声データなどの検索に必要とされる 「曖昧全文検索」を、最新のアルゴリズムを利用することにより高速に処理可能 な検索エンジンです。本検索エンジンを利用することにより、従来であればスーパーコンピュータ級の処理能力を必要としていたゲノム解析などを1台~数台の PC上で高速に処理することが可能です。

■特徴

『Sedue Flex』は、弊社が開発した全文検索技術『Sedue』をベースにし、文字列の欠落やミスマッチありの場合でも高速検索を可能にした全文検索エンジンです。本エンジンでは、10%~20%の誤りを許した全文検索を、ギガバイト級のデー タに対しても数ミリ秒~数秒のオーダーで検索することが可能です。

今回開発したエンジンは、どのような長さの文字列に対しても曖昧検索を可能にしているため、従来手法では実現できなかった高度なゲノム解析処理やノイズを 含んだデータに対する検索を実現可能にしています。特に、ゲノム解析において は従来手法では困難であった、50塩基程度の短い長さの塩基配列に対するミス マッチあり(一部の文字が異なる)・ギャップあり(一部の文字が欠落・追加し ている)の検索も可能です。

本エンジンに利用している「圧縮全文索引」方式は、従来の検索方式では扱うことが難しい任意長の長さの文字列に対しても、非常に高速に検索を行うことが可能です。その技術と今回新たに開発した曖昧検索アルゴリズムを融合することに より、従来ではスーパーコンピュータ級の性能が必要であった検索処理を、1台のPCで実現することが可能とします。

■用途・動作環境

本エンジンは、ゲノム解析、ノイズの含まれたデータに対する検索などの高速・高度な曖昧検索機能を必要とするユーザーを対象にしています。

Sedue Flexが動作する環境は、Linux(Fedora Core 4/5/6及びCentOS 3/4で動作確認済み)となります。

本件に関する詳しい情報はこちらまで