Hatena::ブログ(Diary)

shakezoの日記 このページをアンテナに追加 RSSフィード

2011-12-05

Rでデータサンプリングを行う

大規模データを分析する場合、小規模なデータでテストを行うことがよくあります。今回はRで指定した行数だけランダムサンプリングする方法メモしておきます。

サンプリングするデータのID(行)をsample関数を使用してランダムに決定します。

sampleはベクトルを返すので、このベクトルサンプリングしたいデータセットの行に指定すればサンプリングできます。



 data(iris)
 sampleNum<-sample(nrow(iris),100)#irisのデータ数以下の数値を100個ランダムに選択
 
 iris_sub<-iris[sampleNum,] #sampleNumに対応する行のみを取得
	


 sprintf("iris=%d",nrow(iris)) #150
 sprintf("iris_sub=%d",nrow(iris_sub)) #100



スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト


画像認証

トラックバック - http://d.hatena.ne.jp/shakezo/20111205/1323101861
リンク元