2013-02-08 tmパッケージを使って何ができるか、考えてみる R tm テキストマイニング Wikipediaの英語版を対象にしてみる 辞書はあった方がよい Mathematicsの記事一覧がアルファベット別にアクセス可能(Aの場合)なので、これをとってきて全部登録する? そのうえで、これらの記事を全部アクセス対象にする? 文書の単位としては、記事を1単位とするのもあり、だが、パラグラフを1単位とするのもあり、だろう。文を単位とするのはありだろうか?