テキストマイニング - 基礎と応用
Fouad Sabry
Tradutor Kei Imano
Editora: 10億人の知識があります [Japanese]
Sinopse
テキスト マイニングとは テキスト データ マイニング (TDM) またはテキスト分析とも呼ばれるテキスト マイニングは、テキストから有用な情報を抽出する技術です。 関連用語には、テキスト データ マイニング (TDM) やテキスト分析などがあります。 この用語の定義の 1 つによれば、これは「さまざまな文書リソースから情報を自動的に抽出することによって、これまで知られていなかった新しい情報をコンピューターによって発見すること」です。 ウェブサイト、書籍、電子メール、レビュー、記事などはすべて、利用できる文書の例です。 通常、高品質の情報を取得する最善の方法は、統計的パターン学習などの方法を使用してパターンと傾向を構築することです。 Hothoらによると、 (2005) によると、テキスト マイニングの 3 つの異なる視点を区別することができます。 これらの観点は、情報抽出、データ マイニング、およびデータベースでの知識発見 (KDD) として知られるプロセスです。 テキスト マイニングでは、多くの場合、入力されたテキストを構造化し、構造化されたデータ内のパターンを特定し、最後にマイニング プロセスの結果を評価して解釈するプロセスが必要になります。 テキスト マイニングについて議論するとき、「高品質」という用語は通常、関連性、新規性、および興味の概念の組み合わせに関連します。 テキストの分類、テキストのクラスタリング、概念/エンティティの抽出、詳細な分類の生成、センチメント分析、ドキュメントの要約、エンティティ関係モデリングはすべて、典型的なテキスト マイニング アクティビティの例です。 メリット (I) 次のトピックに関する洞察と検証: 第 1 章: テキスト マイニング 第 2 章: 自然言語処理 第 3 章: データ マイニング 第 4 章: 情報抽出 第 5 章: 意味的類似性 第 6 章: 非構造化データ 第 7 章: 生物医学テキスト マイニング 第 8 章: 感情分析 第 9 章: 単語の埋め込み 第 10 章: ソーシャル メディア マイニング (II) テキスト マイニングに関する一般のよくある質問に答える。 (III) 多くの分野でのテキスト マイニングの実際の使用例。 (IV) 17 の付録 テキスト マイニング テクノロジーを 360 度完全に理解できるよう、各業界の 266 の新興テクノロジーを簡潔に説明します。 本書の対象者 プロフェッショナル 大学生、大学院生、愛好家、趣味人、あらゆる種類のテキスト マイニングの基本的な知識や情報を超えたいと考えている人。