2018/09/03 Last update
このページは R: データフレームの取り扱い @本家UBサイト に恒久的に移転しました。このページもネット上に残っていますが、最新の情報はリンク先を参照して下さい。
R では,取り扱う数値はデータフレームというものの中に格納されていると考える。
2 次元で表されるベクトルなどのデータを,R ではデータフレーム data frame という。外見は行列と同じであるが,各行,各列が必ずラベルをもち,ラベルによる操作が可能である点が普通の行列と異なる(1)。
Blood type | Body weight | |
1 | A | 65 |
2 | A | 59 |
3 | B | 45 |
data frame は,たとえば左の表のようなデータから作成することができる。
data frame では,1行が1つのサンプルとして認識される(1)。また,左の表で Blood type は A, B, O, AB が要素になり得る名義尺度であり,Body weight は比率尺度であるが,これはOKである。
手打ちでこの表のデータフレームを B というワークスペース内に作成するときは,Blood_type と Body_weight をそれぞれ1次元のデータとして作り,それを結合する。
> B1=c("A","A","B")
> B2=c(65,59,45)
とする。一発で作りたいときは,
> B=data.frame(Blood_type=c("A","A","B"), Body_weight=c(65,59,45))
である。うまくデータフレームが作れていれば,
> B
で上の表が表示されるはずである。なお,> summary(B) で体重の平均値など,このデータフレームの簡単な解析結果もみることができる。
注意点
Mac では,データファイルにしたい領域をラベルも含めてコピーした後に,
> C=read.table(pipe("pbpaste"))
とすればよい。または,1行目をヘッダーにするというオプションを加えて
> C=read.table(pipe("pbpaste"),header=TRUE)
注意点
Windows R version 3.1.2 では,Error in read.table(pipe("pbpaste")) : no lines available in input というエラーが出てしまう。
Excel を .csv で別名保存し,> A=read.csv('filename') で読み込むことができる(3)。 Windows R 3.1.2 で有効なことを確認(4-5-2015)。 filename には .csv を含める必要がある。