r4ds 9 欠損値 na.rm

集約関数は、欠損値を計算して、欠損値として出力してしまう。

flights %>% 
  group_by(year, month, day) %>% 
  summarise(mean = mean(dep_delay))
→うまくいかない

集約関数は、na.rmを取る

flights %>% 
  group_by(year, month, day) %>% 
  summarise(mean = mean(dep_delay, na.rm = TRUE))
→うまくいく

あるいは、先に取り除くでもよい

not_cancelled <- flights %>% 
  filter(!is.na(dep_delay), !is.na(arr_delay))

not_cancelled %>% 
  group_by(year, month, day) %>% 
  summarise(mean = mean(dep_delay))
→うまくいく

Follow me!