(1) \(K\)平均クラスタリング
演習のためのシミュレーションデータを作成する。
set.seed(2021-11-09) ## seedの値 は変えてもよい
X <- matrix(rnorm(60 * 2), ncol = 2)
X[1:20, 1] <- X[1:20, 1] + 3
X[1:20, 2] <- X[1:20, 2] - 4
X[21:40, 1] <- X[21:40, 1] - 2
X[21:40, 2] <- X[21:40, 2] - 3
colnames(X) <- c("x1", "x2")
D2 <- as_tibble(X) このデータは、1行から20行がグループ1、21行から40行がグループ2、41行から60行がグループ3として生成されている。
(2) 階層的クラスタリング
Slack で配布した info3_hw03.csv を次のようにして読み込み、以下の問に答えなさい。
myd2 <- read.csv("data/info3_hw03.csv", row.names = 1)このデータは、SSDSE(教育用標準データセット)2021年版 の SSDSE-C の一部で、各都道府県の県庁所在地における緑茶 (green)、紅茶 (black)、コーヒー (coffee) の消費データである。
info3_hw03_YourName.pdf (YourName は自分の名前に変えること)echo = TRUE を設定し、Rコードも表示したファイルを提出すること。