パッケージの読み込み

Q15-1

Rds形式の衆院選データ (hr-data.Rds) を読み込み、「HR」というデータフレーム名を付ける。 手元にない場合はまずダウンロードする。

データが正しく読み込めたか確認する。

## Observations: 8,803
## Variables: 22
## $ year       <int> 1996, 1996, 1996, 1996, 1996, 1996, 1996, 1996, 199...
## $ ku         <chr> "aichi", "aichi", "aichi", "aichi", "aichi", "aichi...
## $ kun        <int> 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, ...
## $ status     <fct> 現職, 元職, 現職, 新人, 新人, 新人, 新人, 現職, 元職, 新人, 新人, 新人, 新人,...
## $ name       <chr> "KAWAMURA, TAKASHI", "IMAEDA, NORIO", "SATO, TAISUK...
## $ party      <chr> "NFP", "LDP", "DPJ", "JCP", "others", "kokuminto", ...
## $ party_code <int> 8, 1, 3, 2, 100, 22, 99, 8, 1, 3, 2, 10, 100, 99, 2...
## $ previous   <int> 2, 3, 2, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 1, 3, ...
## $ wl         <fct> 当選, 落選, 落選, 落選, 落選, 落選, 落選, 当選, 落選, 復活当選, 落選, 落選, 落...
## $ voteshare  <dbl> 40.0, 25.7, 20.1, 13.3, 0.4, 0.3, 0.2, 32.9, 26.4, ...
## $ age        <int> 47, 72, 53, 43, 51, 51, 45, 51, 71, 30, 31, 44, 61,...
## $ nocand     <int> 7, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8, 8, 7, 7, ...
## $ rank       <int> 1, 2, 3, 4, 5, 6, 7, 1, 2, 3, 4, 5, 6, 7, 8, 1, 2, ...
## $ vote       <int> 66876, 42969, 33503, 22209, 616, 566, 312, 56101, 4...
## $ eligible   <int> 346774, 346774, 346774, 346774, 346774, 346774, 346...
## $ turnout    <dbl> 49.2, 49.2, 49.2, 49.2, 49.2, 49.2, 49.2, 51.8, 51....
## $ exp        <int> 9828097, 9311555, 9231284, 2177203, NA, NA, NA, 129...
## $ expm       <dbl> 9.828097, 9.311555, 9.231284, 2.177203, NA, NA, NA,...
## $ vs         <dbl> 0.400, 0.257, 0.201, 0.133, 0.004, 0.003, 0.002, 0....
## $ exppv      <dbl> 28.341505, 26.851941, 26.620462, 6.278449, NA, NA, ...
## $ smd        <fct> 当選, 落選, 落選, 落選, 落選, 落選, 落選, 当選, 落選, 落選, 落選, 落選, 落選,...
## $ party_jpn  <chr> "新進党", "自民党", "民主党", "共産党", "その他", "国民党", "無所属", "新...

filter()select()を使って、2009年の衆院選データだけを切り取り、分析で使う変数 (voteshare, expm, previous) だけを指定して「hr2012」というデータフレーム名を付ける。

summary() を使って記述統計を確認する。

##    smd         previous           expm         
##  落選:839   Min.   : 0.000   Min.   : 0.01002  
##  当選:300   1st Qu.: 0.000   1st Qu.: 1.79454  
##             Median : 0.000   Median : 4.80944  
##             Mean   : 1.722   Mean   : 6.11818  
##             3rd Qu.: 3.000   3rd Qu.: 9.10911  
##             Max.   :16.000   Max.   :25.35407  
##                              NA's   :15

Q15-1-2

小選挙区での当落 (smd) を縦軸、過去の当選回数 (previous) を横軸にとった散布図を描く。

過去の当選回数と小選挙区の当落との間には正の相関があることが確認できる。

Q15-1-3

ロジスティック回帰分析を実行する。有意水準は5% (0.05) に設定する。

## 
## Call:
## glm(formula = smd ~ previous + expm, family = binomial(link = "logit"), 
##     data = hr2012)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -2.9529  -0.6047  -0.5201   0.6106   2.0006  
## 
## Coefficients:
##             Estimate Std. Error z value Pr(>|z|)
## (Intercept) -2.02049    0.13138 -15.379  < 2e-16
## previous     0.31908    0.03674   8.685  < 2e-16
## expm         0.04977    0.01803   2.761  0.00576
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 1300.1  on 1123  degrees of freedom
## Residual deviance: 1092.6  on 1121  degrees of freedom
## AIC: 1098.6
## 
## Number of Fisher Scoring iterations: 4

previousとexpmとう二つの変数の\(p\)値がどちらも0.05より小さいので、これらの変数の係数の推定値が統計的 に有意であることがわかる。 しかし、このままでは係数の意味がわかりにくい。
様々な工夫をすることによって、結果を読み解く作業が必要である。

Q15-1-4

上で推定した結果を式にまとめる。 \[ \widehat{当選確率}_i = \frac{1}{1 + \exp[-(-2.02 + 0.32\cdot 当選回数_i + 0.05\cdot 選挙費用_i)]} \]