フィールドレポート

データを洞察するためのツール

BY Nancy Cohen   翻訳 三重野 研一

METAグループの見解:
OLAPのルール

 METAグループのDonald MacTavish氏は,Intercon Systems社のAvi Shatz氏のような人達と同じ考えを持っている.
 すなわち,データウェアハウスの成功を規定する基準は,企業が有しているデータの量の多さにあるのではなく,企業のデータの活用の仕方にあるとする見解である.MacTavish氏は,伝統的なSQLクエリによる照会の弱点を早々に指摘する.

DMacTavish.JPG (5571 バイト) 

傾向としては,次のように言える.
OLAPは,伝統的なSQLのレポーティングツールを凌駕し,データウェアハウスに蓄えられた情報の活用と分析のための最も有効な方法となるだろう」
――Don MacTavish, META Group―

 

略歴
Donald MacTavish氏は,METAグループのApplication Delivery Strategies部門のシニアリサーチアナリスト.同氏の専門分野は,OLAP・データマイニング・マネジメントレポーティング・データマート関連のテクノロジーに関するもの.METAグループに入る前は,大企業に対するコンサルティング活動に従事し,Cognos社ではビジネスインテリジェンスに関する有力アナリストであった.

 「情報という資産を統合整理する仕事に本格的に取り組み始めると,企業は,トレンドやパターンというものを探し始めることになる.これを実現するために,企業は,効果的なビジネスインテリジェンスツールを必要とする.そして,統合されたビュー,データの強力な抽出力,データの変換力,データの整理力,といったものを,企業は得ようとするようになるのである」と,MacTavish氏は語る.
 最初のハードル:「企業においては,セールス関連の情報や製造情報,さらにはマーケティング情報といったいろいろな情報が大量にキャビネットに入れられていて,いつでも誰でも何かを作り出せるような状態になってはいる」と,MacTavish氏は言う.
 ここで問題になるのは,何を,どのツールで作り上げるのかということである.MacTavish氏は,方法を,OLAPタイプの分析と標準的なSQLクエリによる照会レポートの2つに絞った上で,次のように述べている.「問題は,標準的なSQLクエリによる照会レポートでは,企業で必要とされる情報の多くのタイプが得られないことである」
 MacTavish氏の考えによれば,競争上の優位を得るために必要な素材に大量のデータを変えるキーとして,OLAPは今後,優位に立つものになるという.同氏は,「データウェアハウス分野で,OLAPは強力な競争相手となる」と,述べている.
 「OLAPは,伝統的なSQLのレポーティングツールを凌駕し,データウェアハウスに蓄えられた情報の活用と分析のための最も有力な方法となる傾向にある.情報活用のためのOLAPツールの大規模な展開を予測している.また,主要な展開方法としてWebも十分考えられるところだ」
 OLAP分野における最も大きな変化は,OLAP戦争の終わりである.例えば,ROLAP対MOLAPなどといったものである.「OLAPベンダーのほとんどは,自分達の製品を,ハイブリッドなOLAPのアプローチへと進展させて来た.バーチャルキューブ,キューブ同士のドリル(cube-to-cube drill)能力,データベースにドリルバックできる(drill back to database)能力などといった特徴を見ることができる」制限付きながらも,企業内でのデータマイニングの余地はあると,MacTavish氏は考えている.
 「データマイニングがふさわしい分野もあるだろう.パターンを見つけ分析する目的で大量の過去のデータを調べる時などに,データマイニングを使うことは可能であろう.ユーザーがOLAPによってあるトレンドを取り出し,そのトレンドが何千もの顧客に影響を及ぼすことが分かれば,ユーザーは,パターンを発見するためのデータマイニング技術,例えば,デシジョンツリーや予測手法といったものを活用しようとするだろう.しかしながら,データマイニングは大量のデータ向きとは思われない」
 OLAPに関する技術であれデータマイニングに関する技術であれ,ともに密接に関連しながら,淘汰がなされるとMacTavish氏は述べる.「1998年から2000年にかけて,METAグループでは,ユーザー側にある種の混乱が生じるだろうと予想している.精度の粗い情報を対象とする分野であれば,データマイニング技術は普及する可能性はある」と,同氏は語る.
 データウェアハウスの構築にも適するようSQL Server 7をレベルアップさせる待望のPlatoエンジンに関して,競争上の主要なインパクトは価格にあるとMacTavish氏は言う(訳者注:PlatoとSQL Server7の関係については『BackOffice Magazine』日本語版1998年6月号pp.130-131を参照されたい).「OLAPサーバーは,数千ドルで販売されてきた.OLAPサーバーのベンダーは,今後は,価格以外で自分達を差別化する方法を考えなくてはならなくなるだろう.その結果,製品の差異化がさらに図られることが期待されるし,アプリケーション分野においても差異化が図られることが期待されるのである」

Intercon社のDATA SET:
大量データのためのSQL

 エルサレムで,知識の発見に関して驚くべきことを行っているのは誰であるのかを知るためだけにエルサレムに行くのなら,長期の滞在を予定する必要はない.エルサレムほど知識を誇るところであっても,知識の発見に関して驚くべきことを試しているのは誰であるのかに対する回答として,みんなの指先が,イスラエル政府の敷地を見渡せる位置にある従業員数20名の小さな民間企業を指し示すだろう.この企業が,Intercon Systems社である.同社の創設者でもあり社長でもあるAvi Shatz氏は,2つの基本的な問題に基づく一連のソフトウェア製品を開発した.2つの基本的な問題とは,「20GBものテキストをどう扱うのか」と「20GBものテキストを誰がうまく処理できるのか」である.
 Shatz氏は,解答を見出す上で,ふさわしい経歴の持ち主であった.民間企業を起こすまでは,Shatz氏はイスラエル政府のコンピュータセンターの最高責任者を務めていた.このコンピュータセンターでは,同氏は,大規模かつ先進的なシステムの設計に従事していた.また,大量のデータを処理する上では,同氏の専門知識が活用されてきた.この経歴を生かし,Shatz氏は,もともとは1つの業界をターゲットとしたソフトウェアを開発することで,氏自身の事業を築いたのである.もともとターゲットとした1つの業界は,販売構造や研究開発(R&D),政府の承認手続きといった性質から,体系化されていない大量のデータの管理や処理と知識のマイニングに,かなり依存している.この業界とは,製薬業界のことである.
 例えば,Intercon社のDynaStratは,医師の処方履歴を細分化した上でモデル化し,そのモデルを修正して,販売の推論を立てたり予測をしたりすることに利用される.Intercon社の別のツールであるDynaTactは,データウェアハウス向け多次元システムである.同製品は,例えば患者の実態的人口統計や売上げといったような種々の要因について,多種多様な分析上の切り口を提供してくれる.Intercon社のDynaSearchは,大規模データベースに「ファジーサーチ(Fuzzy Search)」によりアクセスすることができる.「ファジー(Fuzzy)」という言葉は,Shatz氏の将来計画にとって意味の無いことではない.Shatz氏は,Intercon社が垂直的な産業で優勢な地位を占めている現状から脱したいと考えている.そして将来は,「20GBものテキストをどう扱うのか」とか「20GBものテキストを誰がうまく処理できるのか」という問題意識をShatz氏が抱いた時と同様,20GBのデータを効果的かつ即時的に処理することの価値を認識しつつある企業が増えている中で,そうした企業に対してもIntercon社を役立たせたい,とShatz氏は計画を練っているのである.
 「Intercon社では,体系化されていない膨大な量のデータを管理・処理するという問題を解決するための一連のツールやテクノロジとして,DataSetという製品を開発した.このためにまた,当社は,新しいタイプのグラフィカルインターフェースも開発した.この新しいタイプのグラフィカルインターフェースを,当社はDynaGraphと名付けた」と,Shatz氏は語る.「巨大な製薬業向けデータベースに取り組んでいる過程で,当社は,データウェアハウスへの新しいアクセス方法を発見したのである.この新しいアクセス方法を取り入れた製品を,Fuzzy-SQLと呼んでいる.Fuzzy-SQLは,大規模なデータベースへの高速アクセスを可能にする.これは,伝統的なインデックスによる方法では解決できなかったものである」
 Shatz氏は,価値ある知識を探し出そうとする際に直面する,いわゆる現実の問題と対峙してきた.すなわち,問うべき適切な質問を知る,ということである.「触れれば答えてくれるといったグラフィカルインターフェースを,当社は思い付いた.情報それ自体が,問うべき質問を教えてくれるのである.このようなグラフィカルインターフェースをサポートするためには,データベース上に何らかのツールを開発し設定する必要があった.これがFuzzy-SQLである」
 飛躍的な前進である点は,スピード,大規模データベースを有効に活用する能力,見つけ出そうとしているものを正確には知らなくても適切な質問が得られる能力.Shatz氏は,次のような例をあげている.「例えば,ある人の名前を1千万人の中から探し出そうとしている場合を考えてみよう.フルネームが分からないかもしれない.思い出せない文字があるかもしれない.文字を間違えていたり,文字の順番を間違えていたりするかもしれない.例え,そうであったとしても,探し出そうとしていた人物の名前を見つけ出せるのである」
 注目すべきホットなプロダクトはDataSetツールだと言う.DataSetは,知的資産ウェアハウス構築システムないしは知的資産マイニングシステムとして位置付けられる.「知的資産の候補になりそうなものや知的資産に近しいと思われるもののリストを作成するということと,無秩序な生のテキストの中を進み知的資産を取り出す能力があるかどうかということは,全く別のことだ.DataSetは,RDBMSのコンセプトを,体系的に整理されていないテキストにまで拡張するがゆえに,重要なものとなる可能性がある」と,Shatz氏は述べている.
 新しいGUI,Fuzzy-SQL,その他の多くの特徴,こうした点からShatz氏は,商業上の成功も期待している.たとえ万一商業上の成功が危ういものであったとしても,少なくとも「マイニング」自体の画期的な前進は間違いないであろう.
 DataSetは現在,Windows 95で利用できる.DataSetのWindows NT版は,今年の6月に発表されることになっている.

会社紹介
会社:Intercon Systems社
市場:データ主導の製薬業界向け知的資産マイニングソフトウエア
ホットなプロダクト:Intercon社の新製品DataSet
使命:垂直的市場を超え,あらゆるタイプの業界や企業で,生のテキストをデータに溢れる鋭い洞察や知的資産に変えることを促進する
躍進:Fuzzy SQL


Arbor社のESSBASE:
大量データのためのOLAP

 カリフォルニア州Sunnydaleに本社を置くArbor Software社の見解は,経営管理者層のレベルに留まらず,大企業の仕事の場における日常の現実にまで踏み込んだものだ.大手企業においても,ビジネス戦線にいるマネージャは自分達自身で情報を活用することが,ますます奨励されている状況にある.こうした状況が漸増傾向にあるため,Arbor社の名声は所期の成果を上げている.
 同社が主張する名声とは,経営管理者層向けのレポーティング・分析・計画立案のためのOLAPベースのテクノロジである.
 Arbor社は,Essbase OLAP Serverおよびデータウェアハウス関連アプリケーション用のEssbaseプロダクトファミリーを販売している.データウェアハウス関連アプリケーション用のEssbaseプロダクトファミリーには,分析・予算・予測といったアプリケーションが含まれる.「OLAPにより,ビジネスユーザーは,直接,情報の分析結果を得ることができる」と,Arbor Software社のプロダクトマーケティング担当取締役であるDan Druker氏は語る.
 OLAPは,オンラインアナリティカルプロセッシング(on-line analytical processing)の略である.データを洞察するためのOLAPアプローチは,OLAPの多次元構造をもたらした.この多次元構造は,膨大な量の明細レコードを要約できる構造となっている.そして,このOLAPの多次元構造のおかげで,経営管理者は,キーとなるトレンドや当該トレンドを引き起こした原因を,明確にすることができるのである.
 「ビジネスは絶えず変化している.昔は,専任のアナリストが始終情報を分析していた.今はといえば,企業内では誰もが情報を分析している」と,Druker氏は述べている.
 Druker氏は,SQLの後に画期的なものがあるということを新聞・雑誌などの各種メディアに認識させたいと考えている:「企業は,SQLや300通りのテーブルジョインの仕方をユーザーが知る必要が無くなるまで,テクノロジの向上を求めている.迅速な意思決定の必要性という点に関しては,OLAP Serverは,照会が行われた際,短いレスポンスタイムで応じている.スピードの速さゆえに,ユーザーはデータと対話することができるのである.ユーザーはまた,さまざまな切り口を設定することも可能である」
 Druker氏はまた,Web上でのOLAPソリューションに対するビジネスの関心が高まっていることにも注目している.
 Arbor社のEssbase Web Gatewayは,イントラネットやエクストラネット,インターネット上の標準的なWebブラウザを通して,Arbor社のEssbase OLAP Serverを読み書きすることができるものとなっている.多種多様なOLAP Serverからのデータも,企業をいわば串刺しにする形で,結合し一体化した上で,単一のWeb対応アプリケーションに格納することが可能だ.つまり,情報の集合体を形成することになるのである.
 「The OLAP Report」の著者としては第一人者であるNigel Pendse氏は,「今までのところでは,Web上のOLAPに関しては,実例はそれほど無く,まだまだ話だけといったところだ」と述べている.
 Pendse氏の言うところによれば,Web上のOLAPに関心を示す企業は多く,また,多くのOLAPベンダーは興味深い話をいろいろと語るが,「イントラネット上でのOLAPアプリケーションで実績のあるものはほとんど無いし,ましてや,エクストラネットやインターネット上でのOLAPアプリケーションの実績などほとんど無い」のである.
 Pendse氏は,読み書きができるものなどほとんど無い,ということも付け加えている.Essbase Web Gatewayを展開している多くの企業があるということを「現在確認中である」と,Pendse氏は述べている.
 Arbor社のEssbaseおよびEssbase Web GatewayユーザーであるBell Canada社は,Arbor社の2製品を使った統合型データウェアハウスを評価した結果,7つの旧システムのうち,置き換えが終了した1つのシステムに関してだけでも,少なくとも100万ドルが節約できたとしている.

会社紹介
会社:Arbor Software社
市場:OLAPソフトウエアのベンダー
ホットなプロダクト:Essbaseプロダクトファミリー;Essbase OLAP Server
関係:Essbaseは,Microsoft社のWindows NT上で稼働
画期的なこと:Essbase OLAP Server 5が,本年の早い時期に出荷開始

出典 BackOffice Magazine June 1998, pp.89-91.
(c)1998 BACKOFFICE MAGAZINE by PennWell Publishing Company.

1998年12月号掲載