(1) \(K\)平均クラスタリング
演習のためのシミュレーションデータを作成する。
set.seed(2021-11-09) ## seedの値 は変えてもよい
<- matrix(rnorm(60 * 2), ncol = 2)
X 1:20, 1] <- X[1:20, 1] + 3
X[1:20, 2] <- X[1:20, 2] - 4
X[21:40, 1] <- X[21:40, 1] - 2
X[21:40, 2] <- X[21:40, 2] - 3
X[colnames(X) <- c("x1", "x2")
<- as_tibble(X) D2
このデータは、1行から20行がグループ1、21行から40行がグループ2、41行から60行がグループ3として生成されている。
(2) 階層的クラスタリング
Slack で配布した info3_hw03.csv
を次のようにして読み込み、以下の問に答えなさい。
<- read.csv("data/info3_hw03.csv", row.names = 1) myd2
このデータは、SSDSE(教育用標準データセット)2021年版 の SSDSE-C の一部で、各都道府県の県庁所在地における緑茶 (green)、紅茶 (black)、コーヒー (coffee) の消費データである。
info3_hw03_YourName.pdf
(YourName
は自分の名前に変えること)echo = TRUE
を設定し、Rコードも表示したファイルを提出すること。