NECソフトがカリフォルニア大学と共同でバイオインフォ向け開発環境を製品化

シュー教授と共同開発、複数DBを自然語で統合検索

 2003.02.14−NECソフトは13日、米カリフォルニア大学アーバイン校のフィリップ・シュー教授と共同で、バイオ/メディカル分野のデータ解析やデータベース(DB)検索をコンピューターの専門知識なしに簡単に行えるようにする新しい技術を開発、アプリケーション開発ツール「SemanticObjects」(セマンティックオブジェクツ)として製品化し、4月1日から販売を開始すると発表した。さまざまなDBや知識、ツールを統合して扱え、日常会話に近い自然言語で複雑な検索処理を簡単に実行できるのが特徴。同社では、この技術を利用したインテグレーションビジネスを推進し、3年間で5億円の売り上げを計画している。

 今回の「セマンティックオブジェクツ」(SO)は、Javaベースのオブジェクトリレーショナル型アプリケーション開発ツールで、シュー教授が考案した“COMPOSE言語”(コンポーズ言語)と呼ばれる中間言語が中核になっている。一般的には、検索の対象とするDBのデータ構造やテーブル名に関する情報を知ったうえで、SQLなどのDB専用言語に関する専門知識を用いて検索式を作成する必要があるが、SOではこのCOMPOSE言語が仲立ちをするため、例えば利用者は「月に2回以上来院し、60才以上で、平均血圧が120以上の患者のリストがほしい」といった自然な言葉でデータの照会を行うことが可能になる。

 COMPOSE言語は、一種の仮想的なオブジェクトを定義し、そこに対して条件を付与して検索をかけることができるため、アプリケーションを開発したり利用したりする際に実際のデータがどこに存在しているかをあらためて意識する必要がない。複数の異なるDBを串刺し検索することも容易。プラグインの形でオラクルやSQLサーバー、PostgreSQL、MySQL、XMLなどのデータソースに対応している。

 また、SOは知識ベースを構築し統合する“ナレッジデザイナー”機能を備えている。if〜then型のルールを登録しておいて、医療診断などの補助的な情報源となる知識情報システムを実現できる。COMPOSE言語を介して知識を引き出せるので、自然語での利用が可能。

 さらに、COMPOSE言語によって各種の解析ソフトなどのツール群を統合することもできる。具体的には、遺伝子の相同性検索プログラムであるBLASTのインターフェースを備えており、例えば「抗ガン剤を1週間以上投与した患者」といった条件で臨床データを解析する際に、遺伝子情報のBLAST検索を業務ワークフローに則した自然な形で実行することが可能になるという。

 今回のSOの製品化に当たっては、シュー教授がCOMPOSE言語の仕様づくりとプロトタイプ開発を行い、NECソフトがそれらを実装して製品に仕上げた。著作権は両者にあり、日本ではNECソフトが独占的に事業化するが、米国ではシュー教授自身が専門ベンダーを設立して事業を行う。NECソフトはSOをアプリケーション構築ツールとして利用し、個別の要望に対応したカスタム型のシステムインテグレーション(SI)サービスを提供していく計画。一方のシュー教授サイドでは専門特化したソリューションパッケージを組み上げて提供するなどの事業案も温めているようだ。

 国内においては、とくに遺伝子などの基礎研究を臨床に応用することを目的とした“トランスレーショナルリサーチ”分野の機関などに対して採用を呼びかけていく。シュー教授は「当面のターゲットはバイオ/メディカル分野になるが、SOのインテリジェント性はいろいろな方面に応用が可能であり、今後ともNECソフトと共同で開発を進め、将来的にはあらゆる分野を包含できる製品に発展させたい」と述べた。NECソフトの永島武執行役員は「当社は今回のSOをもって本格的にバイオIT関連ビジネスに乗り出すことになる。SOはこの事業における中核技術として大きく育てていくつもりだ」と話す。