tm

tmパッケージを使って何ができるか、考えてみる

Wikipediaの英語版を対象にしてみる 辞書はあった方がよい Mathematicsの記事一覧がアルファベット別にアクセス可能(Aの場合)なので、これをとってきて全部登録する? そのうえで、これらの記事を全部アクセス対象にする? 文書の単位としては、記事を1単位…

テキストマイニング

RのパッケージtmについてのJournal of Statistical Softwareの記事はこちら その記事がまとめている、テキストマイニングツールの主な機能は 1 Preprocess: データの前処理 2 Associate: 関連解析(共起検出) 3 Cluster: ドキュメントのクラスタリング 4 Summ…