情報検索の枠を超え、ビジネスに新たな示唆を与えるコグニティブ検索

情報検索の枠を超え、ビジネスに新たな示唆を与えるコグニティブ検索

 昨今のエンタープライズサーチはAIの搭載により、ビジネスに新たな知見をもたらす「コグニティブ検索」へと進化を遂げました。

 これはエンタープライズサーチの果たす役割が、もはや検索エンジンとして情報を一括検索するだけでは、ユーザーのニーズを満たせなくなってきたからです。

 探し出した情報から、埋もれた知見の引き出しまで期待が高まっているのです。


 はたしてコグニティブ検索は、人の代わりに情報を解釈して、ユーザーにアクションを提案することができるのでしょうか?

 また、高度な検索と分析能力を備えたコグニティブ検索を、業務課題に即して適切に導入、運用するためのポイントとは何でしょうか?


 そこで当記事では、代表的なコグニティブ検索プラットフォーム「Sinequa」の機能をたどり、コグニティブ検索によってユーザーのニーズを満たして、その利用価値を最大化するための導入と運用のポイントを解説します。




▼目次
1. コグニティブ検索のおさらい
2. コグニティブ検索プラットフォームSinequaでできること
3. 業務にコグニティブ検索を定着させるためのポイントは?





1. コグニティブ検索のおさらい

 約20年前に、インターネット上の情報を探す技術として検索エンジンが開発されました。

 現在、GoogleやYahooなどの検索エンジンは、誰もが日常的に使うほど身近なツールとなりました。

 この検索エンジンに入力されたキーワードに対する全文検索を、企業内の情報検索にも応用するために、開発されたのがエンタープライズサーチです。

 エンタープライズサーチは、企業が保有する文書管理や社内ポータル、メールシステムなど複数の社内システムを横断した、情報検索を可能にします。

 しかし社内情報のシステム化が進むにつれ、検索により膨大な情報が得られるようになります。そのため検索結果には、キーワードを含んでいるだけで、無関係な情報が含まれることもあります。

 そこから必要な情報を選別するプロセスが、生産性を低下させます。

 そこで膨大な結果を拾ってくるだけでなく、情報の意味を理解した上で、内容を抽出する高度な検索技術こそ、生産性の向上に繋がると考えられるようになりました。


 このように、エンタープライズサーチを基盤として、誕生したのがコグニティブ検索の技術です。


 コグニティブ検索とは、人工知能(AI)を駆使し、情報検索する際に、ユーザーによる検索の意図を理解し、関連性の高い情報を提示する技術です。

 コグニティブ検索は、従来型である検索エンジンの枠を超えて、必要な情報を迅速に検索するだけでなく、業務プロセス変革のヒントをもたらす可能性も秘めています。


Sinequa
図 1. コグニティブ検索概要図





 従来の検索エンジンと一線を画すコグニティブ検索は、構造化データだけでなく非構造化データの分析も可能です。

 世の中のデータの80~90%を占めている非構造化データで典型的な例は、文書に含まれるテキストデータです。

 数値や値などノーマライズされた構造化データからだけでは、結論に至った過程や原因などの文脈までは分かりません。

 しかし、文書内のテキストを解釈することで、結論の裏に隠されている重要な事実に気づくことができます。

 テキストの解読を可能にするのが、自然言語処理(NLP:Natural Language Processingの略)です。

 さらに機械学習も組み合わせることで、トレーニングデータを学習し、検索の意図に応じた関連性の高い情報が抽出され、ユーザーの適切な判断を支援します。



Sinequa
図 2. コグニティブ検索の要素






 エンタープライズサーチが「コグニティブ検索」へと進化した経緯については、以下より解説をご覧いただけます。


関連記事を読む







2. コグニティブ検索プラットフォームSinequaでできること

 コグニティブ検索プラットフォームSinequaは、自然言語処理の研究機関としてスタートした仏Sinequa社により開発されました。

 エンタープライズサーチ黄金期の2000年初頭に設立された同社は、当初Sinequaをエンタープライズサーチプラットフォームとして提供していました。

 しかし前述のように、情報検索だけでは物足りなく感じるユーザーが増えるにつれ、知見をもたらすインサイトエンジンのニーズが高まりました。

 これを受けて、同社が強みとしていた自然言語処理の活用により、コグニティブ検索プラットフォームへと発展させたのが、現在のSinequaです。


 Sinequaの機能は、下図に示される5つの要素で構成されています。



Sinequa

図 3. Sinequaプラットフォームの5つの要素




2-1. Content:複数のデータソースからデータを収集

 この機能は、本質的にエンタープライズサーチシステムが果たす役割です。

 エンタープライズサーチというと、文書管理システムなど企業内部の文書データを検索する印象が強いかもしれません。

 しかしSinequaは、SaaSやインターネット上の情報、自社ファイルサーバー、Eメールシステム、業務アプリケーション、データベース、データレイク、ビジネスインテリジェンス(BI)など、約200種類のデータソースに接続可能なコネクターが標準装備されています。

 そのため、企業内外に存在する複数のデータソースを横断した情報検索により、視点を広げた調査や考察に役立てることができます。

 しかもデータのコピーや移行をすることなく、データソースに直接接続するため、常に最新の情報が収集できます。


 「情報検索だけでは物足りない」 -このような考えが広まる一方で、検索機能は軽視できないのです。

 それは、コグニティブ検索による高度な分析は、品質の高い情報ありきだからです。

 常に鮮度の高い情報に基づいたデータを検索できる仕組みになっているかどうか。これがコグニティブ検索で効果を上げるためカギを握っています。



2-2. Meaning:自然言語処理によるテキスト文書の解釈

 ここからが、コグニティブ検索の真価を発揮する技術です。

 Sinequaのコネクターを介してあらゆるデータソースから収集されたデータは、自然言語処理(NLP)により解読されます。

 テキストデータの解読が困難なのは、文書が異なる言語で記述されているからです。さらに同じ言語でも、同じ意味を表現するのに、多くの表現方法があります。

 それが、関連情報の抽出を困難にしています。


 自然言語処理(NLP)は、先ず言語を特定し、文章中の単語の品詞をタグ付けし、各単語がどのような役割をしているか分類していくことで、人の知能に近い解釈を行います。



Sinequa

図 4. Sinequaの自然言語処理





 Sinequaは文章中の企業名や人名、地名を自動認識し、インデックス化します。



Sinequa

図 5. 日本語認識例(地名)





 またSinequaの自然言語処理(NLP)は、言葉同士の意味の類似度を距離で示したデータベースを持っています。

 これにより、文書間の類似度が自動的に認識され、文書が特徴付けられます。

 下記の様な解釈が加わるので、ユーザーの意図に近い文書を検索で探せるようになるのです。

  • このドキュメントでは何がいいたいのか?
  • このドキュメントしか含まれない特徴的な情報ななにか?
  • ユーザーが意図したクエリは含まないが、このドキュメントも恐らく役立つのではないか




2-3. Learning:機械学習アルゴルズムによる課題解決

 前段階で、自然言語処理(NLP)により文書の意味を抽出しました。

 次に、特徴付けられた文書に対し、特定の課題に対するルールの適用により、解決策を提示させるといった応用が可能になります。

 これを実現するのが、Sinequaに搭載された機械学習専用のアルゴリズムです。



 機械学習には、Sinequaのコネクターを介して得たシステムのデータは全て、インプットとして使用できます。

 モデルの検討時に必要なトレーニングデータとして利用できるため、企業内の蓄積された文書情報を有効活用できるのです。



Sinequa
図 6. 機械学習アルゴリズムによる課題解決




 機械学習を用いた代表的なビジネスアプリケーションには、文書の分類や、お客様の声などメッセージの感情分析、文書から従業員の得意分野を類推するエキスパート検索などがあります。

 ユーザーごとに検索の意図をくみ取り、課題解決に繋がる情報をサジェストするーつまり検索のパーソナライゼーションが実現するのです。



2-4. プレゼンテーション:検索と表示のインターフェースをデザイン

 コグニティブ検索による高度な分析結果を、ユーザーにどのように分かりやすく表示させるかは、とても重要なポイントです。

 コグニティブ検索の利用目的が、業務に特化している場合は特に、検索結果を目的に合った形式にカスタマイズすると効果的です。


 Sinequaには、標準機能で表示画面のインターフェースが提供されています。

 推奨しているアプローチは、導入の第一段階では、標準機能に近い表示画面で運用開始することです。

 そして運用が軌道に乗ってきたら、よりユーザーに特化したインターフェースにするため、より高度にカスタマイズを施すといった段階的なアプローチを進めています。



Sinequa

図 7. Sinequa標準インターフェースを用いた検索結果の表示画面




Sinequa

図 8. 表示画面を高度にカスタマイズした例
(特定の製品に関する360°View:製品カタログや価格、サプライヤー、主要顧客などの情報が、製品を起点として一望できる)




2-5. External Services:外部システムとの連携

 Sinequaの標準機能に加え、APIで様々な外部システムと連携できます。

 これにより、Thomson ReutersのIntelligent Taggingや科学的オントロジーSciBiteの導入、言語分析、動画の音声テキスト化など、活用の幅が広がります。






3. 業務にコグニティブ検索を定着させるためのポイントは?

 コグニティブ検索システムの導入は、企業の情報資産の価値を最大化させるための、壮大なデータ活用戦略といっても過言ではありません。

 企業内の情報検索システムは、長期的に使用されることが多く、業務への速やかな定着が、企業の生産性向上を促します。

 導入後は、ROIなど企業としての投資対効果だけでなく、エンドユーザ―にとって満足度の高いシステムをとことん追求していくこともまた、運用の成功には欠かせません。



3-1. 将来を見据えた段階的なアプリケーション構築

 コグニティブ検索は、社内ポータルなど様々な業務アプリケーションに組み込むことで、業務に特化した検索アプリケーションを構築できます。


Sinequa




 一般的にコグニティブ検索は、「集めた膨大な情報から、新しい知見を発見したい」というナレッジの探索に向いています。

 その一方で、一定のルールに基づいた文書の分類をするセキュリティ対策やコンプライアンス対応の利用事例も多くあります。

 そのため製薬や製造業など新製品を研究開発している業界や、過去に蓄積された情報からより適切な判断・分類を要するコンサルティングや法律事務所、また顧客サービスの改善がビジネスに大きな影響を与える金融業界などは、コグニティブ検索の威力を発揮しやすい分野といえるでしょう。


 しかしコグニティブ検索は高度な検索と分析を行うため、導入初期から業務に深く根ざしたアプリケーションを設計するのは、少々目標が高すぎるかもしれません。

 エンタープライズサーチを起点とした、業務ニーズに応じたカスタムアプリケーションへのスケールアップをお薦めしています。


 エンタープライズサーチは単一の検索インターフェースにより、アプリケーションを切り替えては、クレデンシャルを何度も再入力するなどの作業で無駄な時間を省くことができます。

 それだけで生産性が向上し、エンタープライズサーチに対する従業員のロイヤルティが促進されます。



 特に製薬など研究開発が行われる業界では、エンタープライズサーチによって、情報収集や知識の発見に必要な時間やリソースが減るため、大きなメリットが得られます。



3-2. 機械学習の適用を見極める

 機械学習アルゴリズムは、ユーザーの欲しいデータをより迅速に見つけ出することで検索をパーソナライズ、ユーザーのサーチエクスペリエンスを向上させます。


Sinequa




 個々のユーザーが検索する意図は、ユーザーごとに異なります。

 それぞれの意図を理解し、検索をパーソナライズし、レコメンドするという重要な役割を果たします。

 これにより、検索エクスペリエンスが向上するため、ユーザーにとって手放せないツールになります。



 しかしSinequaを用いた検索には必ずしも機械学習を必要とせず、エンタープライズサーチと自然言語処理の機能だけで実行可能です。

 そのため機械学習は、状況に応じて適用するか否かについて、選択可能なのです。



 それは機械学習には、十分な量と高品質なトレーニングデータや、事象に対する結果が定義された経験則がなければ、効果を得にくいからです。

 そのため、コグニティブ検索の導入当初から、機械学習を必須で運用しなければならないと考える必要はありません。



前項で述べた、先ずはエンタープライズサーチとして運用開始し、徐々により特化したビジネスアプリケーションへと発展させる運用を推奨しているのは、機械学習の適用可否にも大いに関連しているのです。



3-3. PoCを有効活用する

 ユーザーにとって満足度の高いシステムを提供するには、業務課題を的確に捉えたシステム構築と、運用開始後はユーザーからの要望に対する柔軟なサポート体制が必須となります。

 Sinequaのシステム構築では、製品を開発するSinequa社と、Sinequaの実装・導入に携わるシステムインテグレーターが連携して、顧客企業のシステムを構築します。

 しかし、適切なシステム構築には、顧客企業での導入推進役が、いかに適切に自社の課題を分析した上で、目指すべきデータ活用の将来像を描けるかが、肝になります。

 そのためには、先ず自社にどのようなデータが存在しているか知ることが重要です。

 それから特定した課題を解決する、エンタープライズサーチまたはコグニティブ検索のシステム選定をします。



 しかし、この課題に対する目標と評価基準を設定し、そこから最適なシステムを選定するのは容易ではありません。

 そこでシステムインテグレーターとして、本番導入前にPoCプロジェクトの実施を推奨しております。



 PoCを通じて、業務に即した課題に対する運用をシミュレートできるため、評価項目に対し、システムがどのように解決するかの見極めに役立ちます。

 SinequaのPoC実施の進め方については、以下よりご覧いただけます。

関連記事を読む






 このように、コグニティブ検索の導入では、最初から完璧を目指して最終目標に到達しようとするのではなく、企業の成長に寄り添うように、徐々にスケールアップしていくことが、運用を定着させるポイントとなります。

 次回は、いよいよ業界別のコグニティブ検索の運用事例について紹介いたします。



 Sinequa の詳細については、以下よりご覧いただけます。

関連記事を読む

著者プロフィール

著者アイコン
宮脇浩子
伊藤忠テクノソリューションズ株式会社在職中 | 1. 現在の担当業務 : 記事執筆を中心としたWebマーケティング全般 | 2. これまでの担当業務 : カスタマーサポートエンジニア、プリセールスエンジニア | 3. 趣味 : 料理、ピアノ | 4. 好物 : 激辛料理 | 5. 座右の銘 : 学ぶのに遅すぎることはない