課題

R のISLR パッケージに含まれる Weekly データを使い、以下の分析を行いなさい(この課題は、James, Witten, Hastie, Tibshirani 2018の演習問題 4.7 (10) [ pp.160-161] に基づく)。

このデータは、R でlibrary(ISLR)を実行してパッケージを読み込んだ後 に、data(Weekly) とすれば使える。データの詳細は ?Weekly で確認でき る。

このデータは市場の動きを21年間にわたり週毎に記録したもので、Direction という変数が Up ならその週の利益が上がったことを、Downなら利益が下がったことを示している。

  1. 統計量を計算したりグラフを描いたりすることによってWeekly データの特徴を把握し、何らかのパタンが見いだせるかどうか確認しなさい。
  2. Direction を応答変数、Lag1Lag5 の5つのラグと Volume の計6つの変数を説明変数としてロジスティック回帰を実行しなさい。
  3. 混同行列を作成し、分類に対してさまざまな評価指標を計算することで、ロジスティック回帰がどのような誤りを犯しているか確認しなさい。
  4. ROC曲線を描き、AUCを求めなさい。
  5. 1990年から2008年までのデータを訓練(学習)用、2009年と2010年のデータを検証(テスト)用として分割し、訓練用データで学習した後に、上の3と4を検証用データを用いて実行し、分類性能を評価しなさい。
  6. 5を最近傍法(\(k=1\)\(k\)最近傍法)で実施し、ロジスティック回帰の結果と比較しなさい。
  7. ロジスティック回帰のモデルを変更したり、\(k\)最近傍法の\(k\)の値を調整したりすることによって、5や6よりも分類性能が良いモデルを見つけなさい。

注意



授業の内容に戻る