データフレームのメモ

慣れの問題だと思うが、正直な話、Rのデータフレームの仕様はどうもしっくりこない。直感的に「こうだ!」と思って書くと、たいてい期待した動作にならないのでイライラする。そうやって苦労しつつ気づいた Tips をメモしておく。

テーブル全体に散在する「データなし」をNAに置換するには、

 df[df=="データなし"]<-NA

ただし、NA は R の中の条件判断で特別扱いをされる。例えば、

df[df$Age > 50, ]

としたときに、Age が NA のものもヒットしてきて、大変うっとうしい。とりあえず、NA じゃなくて -9999 などにしておくのが良さそう。