高速塩基配列検索ソフトウェアGGGenomeパッケージ版を提供開始

核酸医薬品やゲノム編集のオフターゲット検索を自社内で高速かつ的確に実施可能に

株式会社レトリバ(本社:東京都新宿区、代表取締役 河原一哉、以下レトリバ)は、高速塩基配列検索ソフトウェア「GGGenome(ゲゲゲノム)※1パッケージ版」を2020年3月25日より提供開始します。
GGGenomeパッケージ版は、大学共同利用機関法人情報・システム研究機構 データサイエンス共同利用基盤施設 ライフサイエンス統合データベースセンター(以下DBCLS)の提供するGGGenomeウェブ版と同様の塩基配列検索を自社内のコンピュータ上で実施することが出来ます。
■「GGGenomeパッケージ版」についての詳細はこちら
https://gggenome.retrieva.jp/

従来のウェブ版は、配列の検索がDBCLSの保有するサーバ上で実行されるため、製薬企業等が秘匿情報を含む配列を検索することが情報管理の面で難しいという問題がありました。そこで、同様の検索を企業の保有するコンピュータ上で実行可能な「GGGenomeパッケージ版」を開発しました。

GGGenomeパッケージ版は、従来のウェブ版と同等のソフトウェアをコンテナ型仮想化技術であるDockerを用いてポータブルSSD内にパッケージ化したものです。オフライン環境でも利用できるため、検索内容の漏洩を防止することが可能です。
従来のウェブ版に設定されている制限(検索可能なミスマッチ・挿入・欠失の制限、ヒット件数の制限、検索実行時間の制限)が大幅に緩和されており、使用するコンピュータの性能に応じてより詳細な解析を実施することが出来ます。
また、従来のウェブ版は塩基配列データベースの更新にともない検索結果が変化する場合がありますが、GGGenomeパッケージ版はソフトウェアとデータベースのバージョンを固定することができるため、過去の検索結果をいつでも再現できるというメリットがあります。あわせて、大量の検索を自動化する支援スクリプトとその活用例も提供されます。

 さらにGGGenomeパッケージ版(創薬基本パック)には、創薬研究に必要なヒト、カニクイザル、マーモセット、マウスの転写産物(mRNAおよびpre-mRNA)のデータベースとして理化学研究所の整備する創薬に資する霊長類のオミックスデータベースD3G※2が含まれており、すぐに検索を実施することが可能です。

※1 GGGenomeは大学共同利用機関法人情報・システム研究機構の登録商標です。
※2 D3G: Database for Drug Development based on Genome & RNA sequences. https://d3g.riken.jp/

■製品の特長
  1. ミスマッチや挿入欠失を含む塩基配列の検索をPC上で見落としなく高速に実行
  2. 核酸医薬品やゲノム編集のオフターゲット候補サイトの検索に最適
  3. ヒトおよび実験動物の塩基配列をすぐに検索可能な「創薬パック」を提供
 

【参考】GGGenomeウェブ版とパッケージ版の比較

  GGGenomeウェブ版 GGGenomeパッケージ版
検索の秘匿性 一般のウェブサービスと同(HTTPSによる暗号化あり) オフラインで検索可能なため検索内容の漏洩を防止可能
検索可能なミスマッチ・挿入・欠失の制限 検索する配列長の25%まで 制限なし*
ヒット件数の制限 100,000件 10,000,000件*
検索実行時間の制限 30秒 1,800秒*
検索可能な塩基配列データベース 公開されたデータベースのみ 独自のデータベースを追加可能(オプション)
利用形態 https://GGGenome.dbcls.jp/
より無償で利用可能**
レトリバよりパッケージを購入しPCに導入して利用

* 実際に検索可能な範囲は使用するコンピュータの性能により異なります。
** DBCLSの公開するウェブ版は商用・非商用を問わず無償で自由に利用できます。


■GGGenomeについて
GGGenomeは、ゲノムや転写産物などの塩基配列を簡便かつ高速に検索することのできるソフトウェアです。
ウェブブラウザ上で利用できるツールとしてDBCLSより公開されており、商用・非商用を問わず無償で自由に利用することができます(GGGenomeウェブ版https://GGGenome.dbcls.jp/)。
内部の文字列検索エンジンをレトリバが開発しており、ゲノムや転写産物などの塩基配列データから生成した接尾辞配列(suffix array)およびFM-indexとよばれる検索インデックスを、高速な補助記憶装置であるSSD上に配置することにより、高速で見落としのない検索を実現しています。

■関連リリース
・DBCLS「高速塩基配列検索ソフトウェアGGGenomeパッケージ版の商用化について」(2020年3月25日)https://dbcls.rois.ac.jp/ja/2020/03/25/post1.html
・理化学研究所 「創薬に資する霊長類のオミックスデータベースD3Gの公開-ヒト・非ヒト霊長類のゲノムなどの高品質データを提供-」(2020年3月25日)https://www.riken.jp/pr/news/2020/20200325_2/

会社情報
【株式会社レトリバについて】
株式会社レトリバは「AI技術でコトバの森を活用し、企業の生産性向上に貢献する」をミッションに、自然言語処理、機械学習、深層学習をコアテクノロジーとした検索・分類・抽出を行うソリューションを提供しております。
所在地:東京都新宿区西新宿2-1-1 新宿三井ビル36階
代表者:代表取締役 河原 一哉
資本金:12億73百万円(資本準備金含む)
事業内容:自然言語処理及び機械学習を用いたソフトウェアの研究・開発・販売・導入およびサポート
コーポレートサイト:https://retrieva.jp/

【本リリースに関するお問い合わせ先】
株式会社レトリバ
製品企画部 広報 市原
E-mail: pr@retrieva.jp
このプレスリリースには、メディア関係者向けの情報があります。

メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。
※内容はプレスリリースにより異なります。

  1. プレスリリース >
  2. 株式会社レトリバ >
  3. 高速塩基配列検索ソフトウェアGGGenomeパッケージ版を提供開始