# 第１章　仮説
# 第２節　単回帰分析
# 福元健太郎

# データ（スポーツ振興政策と健康）の読み込み
# データは中川馨氏作成（2008年度受講生、本人了承済み）
データ <- read.csv("sports.csv", header=T)

# データの表示（関連する列のみ）
データ[,c("都道府県","社会体育施設数","可住地面積","県民一人当たりの国民医療費")]

# 変数の直接参照
attach(データ)

# 変数の作成
可住地面積当たりの社会体育施設数 <- 社会体育施設数/可住地面積

# 散布図(plot)の作成
plot(可住地面積当たりの社会体育施設数,県民一人当たりの国民医療費,main="スポーツ振興政策が充実するほど人々の健康は改善する")

# 県民一人当たりの国民医療費を可住地面積当たりの社会体育施設数で説明する単回帰分析
# glmはGeneralized Linear Model（一般線形モデル）の略
回帰分析結果 <- glm(県民一人当たりの国民医療費~可住地面積当たりの社会体育施設数)

# 係数や有意水準の要約(summary)
summary(回帰分析結果)

# 回帰直線
# y=a+bxをabline(a,b)で描くのでablineか
回帰係数 <- 回帰分析結果$coef
回帰係数
回帰係数[1]
回帰係数[2]
abline(回帰係数[1],回帰係数[2])

# 平均値の比較との関係
社会体育施設数平均値 <- mean(可住地面積当たりの社会体育施設数)
社会体育施設数平均値以上 <- as.integer(可住地面積当たりの社会体育施設数 >= 社会体育施設数平均値)

回帰分析結果2 <- glm(県民一人当たりの国民医療費~社会体育施設数平均値以上)
summary(回帰分析結果2)
mean(県民一人当たりの国民医療費[社会体育施設数平均値以上==0])
mean(県民一人当たりの国民医療費[社会体育施設数平均値以上==1])
mean(県民一人当たりの国民医療費[社会体育施設数平均値以上==1])-mean(県民一人当たりの国民医療費[社会体育施設数平均値以上==0])

回帰係数2 <- 回帰分析結果2$coef
plot(社会体育施設数平均値以上,県民一人当たりの国民医療費,main="スポーツ振興政策が充実するほど人々の健康は改善する")
abline(回帰係数2[1],回帰係数2[2])



