R

欠測データの補完(調査観察データの統計科学 2.2節)

R

「調査観察データの統計科学」 http://www.amazon.co.jp/dp/4000069721/ の2.2節「欠測のメカニズム」にあった、例2.3「ランダムな欠測としての選抜効果」の例をRで試してみた。本書P31の定数の決め方だと、P32のグラフのようにならないので、を求めるときの…

Rによる非線形計画問題

R

統計ソフトRのRsolnpパッケージを使って、2次式制約のもと2次式の最適化を行った。 制約が2次式なので、2次計画法を解くパッケージである"quadprog"は利用できない。今回の例題はこちら。 minimize subject to Lagrangeの未定乗数法なり、円が接する状態を幾…

Rによる2次計画法

R

今回は久しぶりにRの話題。 2次計画問題を解くのに、Rの"quadprog"パッケージを使うことにした。 例題は東工大の水野先生のサイト↓ http://www.me.titech.ac.jp/~mizu_lab/text/pdf-file/LP9-QP-problem.pdf例題では制約が等式制約である。だがquadprogで扱…

単語-文書行列の作成(不要語を取り除く)

R

[R]単語-文書行列の作成の続き。よく考えたら、「する」とかは不要語なので、不要語を取り除いたバージョンを考えてみた。 setwd("C:\\RW\\LSIMatrix") library('RMeCab') #--csvファイルの読み込み data <- read.csv("ankt.csv",header = T) user <- data[,…

データの読み込み

R

Rでデータの読み込み→dataframe型といえば、"read.table"関数とか"read.csv"関数とかある。一度整理しておく。1.縦横きっちりデータが入っている場合 表頭と表側がある場合 表頭と表側がある場合が一番簡単で、"read.table"関数がそのまま使える。 data1 <- …

libraryのインストール先の設定

R

こちらのブログ→http://cse.niaes.affrc.go.jp/miwa/ja/R/packages/index.htmlを拝見して、libraryの場所の固定方法が分かった(参考にさせていただきありがとうございます。)Eclipse上で同じことができないかと試してみたところ、次のようにすればよいことが…

作業スペースの保存と読み込み

R

機械学習には「訓練フェーズ」と「テストフェーズ」があるが、このフェーズがプログラム中で分かれていないと結構面倒である(特に訓練に時間がかかる場合)。その場合はRのGUI上では「ファイル→作業スペースの保存」でいいのだが、Eclipseを介してRのスクリプ…

ワーキングディレクトリの設定

R

Rでファイルを扱うときに困るのが「パス」である。絶対パスを使って write.csv(data,"C:\\RW\\test.csv") くらいならまだいけそうだが、仕事上プロジェクトフォルダを分けておきたいとかそういった場合には、絶対パスだとファイル名が長くなって何かと面倒で…

単語-文書行列の作成

R

RMeCabが導入できたら、単語-文書行列を作ってみる。こんなデータ(ankt.csv)があったとする。 ユーザ,アンケート 2010-001,私はご飯を食べた。 2010-002,私は歯を磨いた。 2010-003,私は犬と散歩した。 以下が単語-文書行列の作成ソース。 setwd("C:\\RW\\LS…

RMeCabの導入

R

MeCabとは形態素解析器の一つで、辞書編集が結構楽である。RMeCabはMeCabをR上から使えるようにしたもの。以下が導入方法。 MeCabの導入:http://sourceforge.net/projects/mecab/files/から、MeCab-win32をダウンロードし、インストールする。 RMeCabの導入…