Knowledgeocean
ナレッジオーシャン

Knowledgeocean

Knowledgeocean

あらたな知識を発掘する
簡単テキストマイニング

Knowledgeoceanとは
Knowledgeoceanの特徴

インタラクティブで分かりやすい分析画面

分析業務は決まった手順による分析より、手作業や分析担当者の経験と勘に基づく部分が主要なところを占める傾向にあります。特に文書の分析(テキストマイニング)では、微妙な言い回しやニュアンスの違いなど、機械的に処理するのが難しい領域のため、仮説を検証する際にもそれなりの経験と勘が必要でした。
Knowledgeoceanは、インタラクティブな分析画面により分析の思考を止めないように設計されています。

20年を超える実績と弛まぬ進化

分析データの汎用性

TXTもしくはCSV形式のテキストデータであれば、どのような分野のデータでも分析可能です。また、分析結果をCSV形式ファイルで出力でき、表計算ソフトl等への読み込みや再利用、また、他システムへの組み込みや試行が容易です。

20年を超える実績と弛まぬ進化

辞書チューニング機能

分析用途・テキストデータの内容により、専門語や不要語・同義語といったユーザ辞書を作成可能です。
また、ユーザ定義品詞機能では、商品シリーズ毎や、担 当部門名など、好きなカテゴリを品詞と同様の扱いで定義できます。辞書のチューニングにより、より精度が高く、目的にあった分析ができます。また、ユーザ やチーム毎で利用する辞書を変えて分析することが可能です。また、辞書のチューニングを支援するクレンジング機能やKWIC表示機能が標準で利用可能です。

20年を超える実績と弛まぬ進化

メンテナンスの容易なCS構成

Webベースのサーバークライアント構成により、ユーザはネットワークを通じて簡単に分析サーバを利用可能です。
ログインユーザにより分析データやユーザ辞書を個別に保持できますので、個人毎・研究グループ共通といったアカウントを作成し利用できます。

20年を超える実績と弛まぬ進化
Knowledgeoceanのテキストマイニングプロセス

FUNCTION
Knowledgeoceanの主な機能

コンセプト抽出機能

自由記述された文章から、コンセプトといわれる言葉(名詞、動詞、形容詞といった単語や、名詞+動詞などの何がどうしたといった概念語)を抽出し、出現文書数・出現頻度により重み付けを行います。
文書中にどのような言葉がよく使われているのか、といった全体的な傾向をつかむことができます。また、ある特定のコンセプトに着目し、ある言葉が含まれる文章はどんな傾向にあるのか、といった分析も可能です。コンセプト抽出方法は、目的に合わせて「主要語抽出」「概念抽出」の切り替えが可能です。

コンセプト抽出機能

主要語抽出

名詞、動詞、形容詞といった、単体の単語を抽出します。
(例:「PC」「買う」「格好いい」)

主要語抽出

概念抽出

何がどうした、といった概念が抽出できます。また、概念抽出のルールを設定する「ナレッジオーシャン辞書ツール」により、名詞のみ、動詞のみ、といった抽出したい品詞の設定や、抽出後に「否定」や「疑問」といった属性を付与するかどうかの設定などができます。
(例:「格好いいPC」「(要求)買う」「(否定)好き」)
※概念抽出では、奈良先端科学技術大学院大学情報科学研究科自然言語処理学講座で開発された形態素解析システム「茶筌(ChaSen)」を使用しています。

主要語抽出

抽出結果の表示

抽出されたコンセプトは、何回(Term Frequency)、何文書に(Document Frequency)出現するかにより重要度を算出しているため、統計的な分析も可能となります。コンセプト抽出の結果はCSV出力することが可能です。

コンセプト一覧画面(主要語抽出)

・コンセプト一覧
重要度の高い順に並んでいます。重要度は「DF」出現文書数、「TF」出現回数を元に算出しています。

※DF:Document Frequency
※TF:Term Frequency

・文書一覧
コンセプト一覧で選択されているコンセプトを含む文書を一覧表示します。文書IDのクリックで、文書の属性を含む全情報を参照することができます。

主要語抽出

コンセプト一覧画面(概念抽出)

概念抽出では、検索ボックスに「要求」「疑問」「否定」の属性を入力し、コンセプトを検索することができます。
「要求」を検索し、「パソコンを[要求]買う」を選択した例となっています。
概念抽出では、品詞を選択しコンセプトを絞り込むことができます。

主要語抽出

コンセプト比較(新出コンセプト抽出)

PC_Question1(PWD)とPC_Question2(PWD)を比較し、PC_Question2(PWD)にのみ出現しているコンセプトを抽出する例です。

主要語抽出

コンセプト共起抽出機能

コンセプト抽出で抽出されたコンセプトファイルから、ユーザ指定の”コンセプトの距離”をもとにコンセプトの共起ファイルを作成し、各コンセプト同士の相関関係をグラフやネットワーク図により視覚的に表示します。

コンセプト共起ファイル参照

コンセプトを選択し、共起関係にあるコンセプト一覧を表示します。
共起コンセプト一覧では、共起度(選択したコンセプトの距離内にいくつ出現しているか)の高い順で表示されます。

主要語抽出

コンセプト共起ネットワーク図

コンセプトを選択し、共起関係にあるコンセプトをネットワーク図で表示します。ネットワーク図では線の太さで共起度を表しています。

主要語抽出

コンセプト共起比較図

選択した複数の評価コンセプトと共起するコンセプトとの共起度を比較します。
(例: 評価コンセプトを「商品A」「商品B」「商品C」とし、共起コンセプトを「品質が良い」「値段が安い」「デザインが良い」で比較した場合は、各商品ごとにどのような評価がされているか、といった情報を得ることができます。)

主要語抽出

類似文書分析

自由記述された文書群をコンセプトの出現傾向からパターン分類することで、どのようなパターンの文書が多いのかといった傾向を把握することができます。
例えば、消費者からの問合せについて分析を行い、頻繁に発生している問合せを知ることで、FAQ等の作成に役立てることができます。

コンセプト抽出機能

コンセプト共起抽出機能

コンセプト抽出で抽出されたコンセプトファイルから、ユーザ指定の”コンセプトの距離”をもとにコンセプトの共起ファイルを作成し、各コンセプト同士の相関関係をグラフやネットワーク図により視覚的に表示します。

分類カテゴリファイルの編集&参照

ユーザ指定のカテゴリ分類を定義&参照を行います。
コンセプト抽出結果のコンセプト一覧を利用し、ユーザ定義のカテゴリグループを編集することが可能です。同義語や削除語などの辞書情報を参照するため、コンセプトの有り、無しによる検索的な分類ではなく、目的に合った分類が可能です。

主要語抽出

分類結果ファイルの参照

分類結果の参照を行います。
分類カテゴリファイルのカテゴリ情報を元に分析ファイルを分類した結果を参照することができます。

主要語抽出

類似文書検索

検索元の文字列(文章)と類似する文章を検索することが可能です。該当する文書は、類似度が付与されます。

辞書ファイル メンテナンス

ユーザ辞書のダウンロード・アップロードをGUIで行えますので、各ユーザはエクスプローラで自分の編集したい辞書ファイルを探す手間が無くなり作業の効率化にも繋がります。

主要語抽出

ユーザ辞書ツール

ユーザ辞書ツールは、テキストマイニング分析を行う上で非常に重要なツールとなります。 テキストマイニング分析を各ユーザで行う際には、自社特有の表現や単語(製品名などの固有名詞)をKnowledgeoceanに単語と認識してもらわなくてはなりません。また、”データナレッジ”や”データ・ナレッジ”など本来同じ意味の単語を同義語とみなす作業が発生します。
ユーザ辞書ツールはそのような作業を各ユーザで簡単に行なえる仕組みをご提供します。コンセプトのドラッグ&ドロップや、その他操作性向上の為の工夫を追加しております。

主要語抽出

ユーザ辞書選択機能

目的毎に作成した複数のユーザ辞書の切り替えをメイン画面上で行う事が出来ます。この機能により辞書の切替が容易になりますので、多目的の分析もスムーズに行う事が可能です。

主要語抽出

PRICE
価格

Knowledgeoceanは提供する機能に応じた2種類のエディションを、サーバー版とデスクトップ向けで提供しています。年間保守サービスへのご加入が必要となります。ライセンス価格の20%が保守サービスの年額となります。

ライセンス ライセンス費用 年間保守サービス 初年度合計
Professional for Server ¥3,800,000 ¥760,000 ¥4,560,000
Basic for Server ¥2,400,000 ¥480,000 ¥2,880,000
Professional for スタンドアロン ¥1,800,000 ¥360,000 ¥2,160,000
Basic for スタンドアロン ¥1,200,000 ¥240,000 ¥1,440,000

ENVIRONMENT
動作環境

サーバー環境
OS Microsoft Windows Server 2008/2008 R2
Microsoft Windows Server 2012/2012 R2
Microsoft Windows 7/ 8 /10 ※2
アプリケーションサーバー 選択したオペレーティングシステムに標準付属のインターネット
インフォメーションサービス(IIS)
推奨スペック CPU 2コア以上
メモリ 4GB以上
ハードディスク プログラム用:1GB以上
データ用:文書数、添付するファイル数に依存します。
クライアント環境
OS Microsoft Windows 7 / 8 / 10
ブラウザ 選択したオペレーティングシステムでサポートされるMicrosoft Internet Explorer(9、10、11)
※ Windows10では、Internet Explorer 11でのみ動作します。
Microsoft Edgeには対応していません。