r4ds_13_Missing values
library(dplyr)
library(tidyverse)
# 異常値を欠損値に置き換える
diamonds2 <- diamonds %>%
mutate(y = ifelse ...
r4ds 12 Visualising distributions 分布の可視化
library(dplyr)
library(tidyverse)
# 分布の可視化
# カテゴリカル変数では棒グラフを使う
ggplot(data = diamonds)+geom_bar(map ...
r4ds11 Exploratory Data Analysis
Exploratory Data Analysis
A value is ...
A variable is a quantity, quality, or property that you can measure.
A value is ...
r4ds 10 script
コンソールで実験→スクリプトで保存
File メニューからnew file R script
または、
Ctrl-Shift-N
現在のR式を実行するには、Ctrl+Enter
全体を実 ...
r4ds 9 欠損値 na.rm
集約関数は、欠損値を計算して、欠損値として出力してしまう。
flights %>% group_by(year, month, day) %>% summarise(mean = mean(dep_delay))→う ...
r4ds 8 pipe
距離と平均遅延時間の関係を目的地ごとに調べたい。
by_dest <- group_by(flights, dest)
> delay <- summarise(by_dest,
+ co ...
r4ds 7 summarize
The last key verb is summarise(). It collapses a data frame to a single row:
summarise(flights, delay = mean(dep_d ...
R 統合開発環境
統合開発環境
①explaratory ビジネス向き
②JASP 研究向き
Rで始めるデータサイエンス⑥新しい変数を作る。
小さいデータセットを作る
flights_sml <- select(flights, *変数を選ぶ
year:day, *yearからdayの間まで
ends_with(“delayR ...
Rで始めるデータサイエンス⑤宿題
flights {nycflights13} R Documentation
Flights data
Description
On-time data for all flights that departe ...