2010-01-01から1年間の記事一覧

ブログ中のRのソース

プログラム中のRのソースの引用を、Rのソースっぽくしてみた。

単語-文書行列の作成(不要語を取り除く)

R

[R]単語-文書行列の作成の続き。よく考えたら、「する」とかは不要語なので、不要語を取り除いたバージョンを考えてみた。 setwd("C:\\RW\\LSIMatrix") library('RMeCab') #--csvファイルの読み込み data <- read.csv("ankt.csv",header = T) user <- data[,…

データの読み込み

R

Rでデータの読み込み→dataframe型といえば、"read.table"関数とか"read.csv"関数とかある。一度整理しておく。1.縦横きっちりデータが入っている場合 表頭と表側がある場合 表頭と表側がある場合が一番簡単で、"read.table"関数がそのまま使える。 data1 <- …

libraryのインストール先の設定

R

こちらのブログ→http://cse.niaes.affrc.go.jp/miwa/ja/R/packages/index.htmlを拝見して、libraryの場所の固定方法が分かった(参考にさせていただきありがとうございます。)Eclipse上で同じことができないかと試してみたところ、次のようにすればよいことが…

作業スペースの保存と読み込み

R

機械学習には「訓練フェーズ」と「テストフェーズ」があるが、このフェーズがプログラム中で分かれていないと結構面倒である(特に訓練に時間がかかる場合)。その場合はRのGUI上では「ファイル→作業スペースの保存」でいいのだが、Eclipseを介してRのスクリプ…

ワーキングディレクトリの設定

R

Rでファイルを扱うときに困るのが「パス」である。絶対パスを使って write.csv(data,"C:\\RW\\test.csv") くらいならまだいけそうだが、仕事上プロジェクトフォルダを分けておきたいとかそういった場合には、絶対パスだとファイル名が長くなって何かと面倒で…

単語-文書行列の作成

R

RMeCabが導入できたら、単語-文書行列を作ってみる。こんなデータ(ankt.csv)があったとする。 ユーザ,アンケート 2010-001,私はご飯を食べた。 2010-002,私は歯を磨いた。 2010-003,私は犬と散歩した。 以下が単語-文書行列の作成ソース。 setwd("C:\\RW\\LS…

RMeCabの導入

R

MeCabとは形態素解析器の一つで、辞書編集が結構楽である。RMeCabはMeCabをR上から使えるようにしたもの。以下が導入方法。 MeCabの導入:http://sourceforge.net/projects/mecab/files/から、MeCab-win32をダウンロードし、インストールする。 RMeCabの導入…