Rで始めるデータサイエンス②グラフを書く

2019年5月22日

散布図
ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy))

ggplot(data = mpg)
mpgのデータを使います。

geom_point
散布図を書きます

引数はmappinng=(aes(x=))
を使って、変数を指定します。

一般化するとこんな感じ
ggplot(data = <DATA>) + 
  <GEOM_FUNCTION>(mapping = aes(<MAPPINGS>))

点の色分けする

ggplot(data = mpg) + 
  geom_point(mapping = aes(x = displ, y = hwy, color = class))
点の大きさ分けをする
ggplot(data = mpg) + 
  geom_point(mapping = aes(x = displ, y = hwy, size = class))

透過度を分ける

ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy, alpha = class))
形を分ける 6種類まで ggplot(data = mpg) + geom_point(mapping = aes(x = displ, y = hwy, shape = class))


変数にかかわらず設定を変える。()の外側
ggplot(data=mpg)+geom_point(mapping=aes(x=displ, y=hwy), color=”blue”)

層別解析できますよ。

ggplot(data = mpg) + 
  geom_point(mapping = aes(x = displ, y = hwy)) + 
  facet_wrap(~ class, nrow = 2) 複数のカテゴリかる変数でもできますよ。
ggplot(data = mpg) + 
  geom_point(mapping = aes(x = displ, y = hwy)) + 
  facet_grid(drv ~ cyl)

列だけで作りますよ。
ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy)) +
facet_grid(. ~ cyl)

近似曲線を描きます?
ggplot(data = mpg) +
+ geom_smooth(mapping = aes(x = displ, y = hwy))

LINEタイプを、クラスごとに変更
ggplot(data = mpg) +
geom_smooth(mapping = aes(x = displ, y = hwy, linetype=drv))

色を変更
ggplot(data = mpg) +
geom_smooth(mapping = aes(x = displ, y = hwy, color=drv))

凡例を消す
ggplot(data = mpg) +
geom_smooth(mapping = aes(x = displ, y = hwy, color=drv), show.legend=FALSE)

2つを合体
ggplot(data = mpg) +
geom_point(mapping = aes(x = displ, y = hwy)) +
geom_smooth(mapping=aes(x=displ, y=hwy))

先にデータを定義すると
ggplot(data = mpg, mapping = aes(x = displ, y = hwy))+geom_smooth()+geom_point()

Follow me!