テキストマイニング

tmパッケージを使って何ができるか、考えてみる

Wikipediaの英語版を対象にしてみる 辞書はあった方がよい Mathematicsの記事一覧がアルファベット別にアクセス可能(Aの場合)なので、これをとってきて全部登録する? そのうえで、これらの記事を全部アクセス対象にする? 文書の単位としては、記事を1単位…

テキストマイニング

RのパッケージtmについてのJournal of Statistical Softwareの記事はこちら その記事がまとめている、テキストマイニングツールの主な機能は 1 Preprocess: データの前処理 2 Associate: 関連解析(共起検出) 3 Cluster: ドキュメントのクラスタリング 4 Summ…

ぱらぱらめくる『Rによるテキストマイニング入門』

こちらの学習過程のグラフ化のために相当量の基礎用語を取り込むのに使えそう Rによるテキストマイニング入門作者: 石田基広出版社/メーカー: 森北出版発売日: 2008/12/16メディア: 単行本(ソフトカバー)購入: 26人 クリック: 342回この商品を含むブログ (…

ぱらぱらめくる『高速文字列解析の世界』

高速文字列解析の世界――データ圧縮・全文検索・テキストマイニング (確率と情報の科学)作者: 岡野原大輔出版社/メーカー: 岩波書店発売日: 2012/12/27メディア: 単行本購入: 15人 クリック: 324回この商品を含むブログ (5件) を見る 1 文字列解析の今 文字列…