特許テキストマイニング機能の基本的な画面構成は下図となります。基本的な使い方としては左側にプロットされた特許検索結果の母集団を回転させながら平面的、時系列的に俯瞰しつつ特許群を分析することができます。特許検索母集団はテキストマイニングにより特許の文献内容が近い特許ほど近くにプロットされるように描画されます。
これまで100件〜300件程度の本検索結果(いわゆる要精査特許)は特許出願日・特許公開日順に一件ずつ見て行かなければならず特許検索結果を俯瞰・分析するには経験をもっている人でも大変手間と時間のかかる作業でした。特に、特許閲覧途中に「前に似たような特許文献を読んだなぁ...」といった場合は、それまでに読んだ特許を再度読み直して、似た特許文献を探し出して、類似特許間の関連性・相違点を比較しながら読み進める必要があり単純な新規性調査ならまだしも、高々300件程度の文献であっても他社の技術や出願動向を把握する場合には非常に手間がかかっていました。
特許テキストマイニング機能は、特許検索結果コントロールのMENUから「可視化」を選択することにより利用することができます。
文献の分布状況は、上、左に配置されたスライダーを移動させることにより三次元的(奥行きは出願日順にプロットしています)に把握することができます。
各点は1特許文献に対応しており、マウスを載せることにより特許文献の概要を確認することができます。
各特許文献はテキストマイニング技術による計算の結果「文書内容が類似する特許文献」ほど近くに配置されますが、パテント・インテグレーションの計算する特許文献の単語空間の次元は時には数万次元にも及ぶため適切に平面(二次元)にプロットできない場合がしばしばあります。パテント・インテグレーションは数万次元空間における二つの特許の類似度(距離)に応じて特許群毎に特許をクラスタリング(自動分類)する機能を備えています。各クラスタには自由に色を割り当てることが可能です。例えば、殆ど同じ観点のクラスタには同じ色を配色することにより作業効率が高めることができます。
また、チェックボックスをはずすことにより点を消すことができます。不要な点を消去することにより、注目したクラスタの解析がしやすくなります。
クラスタリング情報も考慮することにより、高次元空間においてテキストマイニング技術により計算された特許文献の類似度の理解を助けます。
クラスタ数は、特許文献に含まれる観点の度合いに応じて自動的に算出します。多様な観点が含まれている特許検索結果母集団ほぼ多くのクラスタに分類されます。
特許テキストマイニング機能ではクラスタ毎、特許出願人毎、特許発明者毎にしおりをまとめて設定することができます。しおりの設定は、コントロールパネルに列挙されたコンボボックスを操作することにより設定することができます。例えば、クラスタ4に「候補」しおりを設定してみましょう。
しおりが設定されました。
しおりを設定することにより、「一覧表示機能」などから「候補」しおりを設定した特許文献をフィルタリングすることができます。これを利用することにより、特許検索時に関連性の低い特許文献のスクリーニング(ノイズ除去)を行ったり、関連性の高い特許文献のみをピックアップすることができます。
また、しおりが付された特許文献の特許分類の付与状況を「特許分類 表」で一覧することができます。この機能を使うことにより、例えば特許予備検索結果から簡単に検索対象の特許分類を特定することができます。また、特定した特許分類を特許分類ブックマークへ登録することにより、本検索の検索式を組み立てるときに利用することができます。
テキストマイニング機能によりプロットされた各特許文献から、複数の特許文献を簡単にまとめて選択し、しおり、レーティングおよびブックマークなどの属性情報をまとめて設定したり、一括閲覧や特許ダウンロードをすることもできます。
複数の特許文献は「シフトキーを押したままマウスによりドラッグ&ドロップ」をすることにより、まとめて選択することができます。また、上部の「解除」ボタンをクリックすることにより、すべての選択状態を解除することができます。解除ボタンには、選択されている特許文献の個数が併せて表示されます。
選択された特許文献は輪郭線が太く表示されます。
画面上の適当な位置で右クリックすると、選択された特許文献へまとめて適用できる処理の一覧がメニュー表示されます。具体的には、選択された特許文献のみをまとめて一括閲覧や特許閲覧でまとめて閲覧したり、特許ダウンロードにより各種フォーマットで保存したり、レーティング、ブックマークやしおりをまとめて設定することができます。
選択を解除するには、上部に配置された「解除」ボタンをクリックします。