統計分析セミナー
■目的・内容
統計分析のユーザーからディヴェロッパーになることが本セミナーの目標です。
米国に行ってICPSRなどで勉強するのではなく日本で勉強しても、一流の国際学術誌に掲載された論文の統計分析を理解し、ひいては自ら作った統計モデルを用いた論文を掲載することを目指します。全体を5部構成とし、統計のフリーウェアであるRを用います。
第1部:数学的基礎
統計モデルを組む上で最低限必要な数学(確率、行列、微積分、等)を短期間で学びます。
教材:
"Math (P)refresher for Political Scientists" (Harvard University, 2012)
参考文献:教材8頁の1-3。
DeGroot, Morris H. 1986. Probability and Statistics. Addison-Wesley.
第2部:通常の回帰分析
最も基本的な通常の回帰分析のプログラムを(出来合いのコマンドを使うのではなく、自分で通常最小二乗法と最尤法で)実装し、モンテ・カルロ・シミュレーションにより振る舞いを確かめます。漸近論などの証明はしません。
教材:Faraway, Julian. 2005. Linear Models with R. Chapman and Hall/CRC Press.
[Book Website]
[The R commands used in text]
第3部:統計的モデリング
データ発生過程をモデル化し、データからパラメータを推定する統計モデルを組み、それを実装します。具体的なテーマは受講者の関心に合わせて2,3選ぶ予定ですが、例えば、頑健推定、離散データ、セレクション・モデル、生存分析などが考えられます。
教材:Faraway, Julian. 2006. Extending Linear Model with R: Generalized Linear, Mixed Effects and Nonparametric Regression Models. Chapman and Hall/CRC Press.
[Book Website]
[The R commands used in text]
参考文献:Box-Steffensmeier, Janet M., and Bradford S. Jones. 2004. Event History Modeling: A Guide for Social Scientists Cambridge University Press.
第4部:ベイズ統計
今日の社会科学の最先端を理解するためには、ベイズ統計は必須です。主たる目標はマルコフ連鎖モンテ・カルロ(MCMC)を理解し実装することですが、カルマン・フィルタなどの状態空間モデル、隠れマルコフ・モデルなども、できれば扱いたいと考えています。
教材:Gill, Jeff. 2008. Bayesian Methods: A Social and Behavioral Sciences
Approach. Second Edition. Chapman and Hall/CRC Press. [Book Website]
参考文献:Gelman, Andrew, John B. Carlin, Hal S. Stern, and Donald B. Rubin. 2013. Bayesian Data Analysis. Third Edition. Chapman and Hall/CRC Press.
Gelman, Andrew, and Jennifer Hill. 2007. Data Analysis Using Regression and Multilevel/Hierarchical Models. Cambridge University Press.
WinBUGS(これまでポピュラーだったので過去のスクリプトは多いが開発は終了)
OpenBUGS(今まさに開発中)
JAGS
第5部:因果推論
ここ十年ほど政治学においても厳密な因果推論を行うことが求められるようになってきています。Rubinモデル、実験、RDD、操作変数法、マッチング、などについて学びます。Rによる実装はあまりしない予定です。最後に論文を書く道具(LaTeX, beamer, bibtex, Endnote等)を紹介して、セミナーを終えたいと思います。
教材:Angrist, Joahua D., and Jorn-steffen Pischke. 2008. Mostly Harmless Econometrics: An Empiricist's Companion. Princeton University Press.(ヨシュア・アングリスト&ヨーン・シュテファン・ピスケ(大森義明・田中隆一・野口晴子・小原美紀訳)『「ほとんど無害」な計量経済学 応用経済学のための実証分析ガイド』(エヌティティ出版、2013年))
参考文献:Dunning, Thad. 2012. Natural Experiments in the Social Sciences: A Design-Based Approach. Cambridge University Press.
■日程
毎月原則として隔週で水曜日の10:00-12:00に開講します。場所は学習院 大学
(地図)です(部屋は受講者にお知らせしました)。今のところは次のような予定を立てていますが、進行状況を見て随時柔軟に変更します。
第1部:数学的基礎
2013年5月29日
Prefresher, Lecture 1-5 スクリプト6月12日
Prefresher, Lecture 6-9 スクリプト
第2部:通常の回帰分析
6月26日
Faraway (2005) chs. 1-3. スクリプト7月10日
Faraway (2005) chs. 4-6. スクリプト
第3部:統計的モデリング
7月24日
Faraway (2006) Appendix A, chs. 2, 3. スクリプト
beta-binomial distribution
beta function
Poisson distribution
negative binomial distribution
gamma distribution
gamma function
8月7日
Faraway (2006) chs. 5-7. スクリプト
Multinomial logit(特にAs a latent-variable modelの部分)
Multinomial probit
9月4日
生存分析を扱います。 Bradford Jones の Event History Modeling: A Guide for Social Scientists WEB PAGE にある
Lecture Notes for Presentation at University of Auckland, 31 May 2005の Extended Lecture Notes for Short Courseのpp. 1-23, 44-49, 57-61(余力のある人は、これ以外の箇所(STATAの実例)も)と
Application TutorialsのTutorial 8: Competing Risks (and a little split pop.)のpp.7-10
を予習してきてください。
スクリプトはこちら
参考文献:Box-Steffensmeier and Jones (2004)9月18日
Matt Golderの Methods IV: Advanced Quantitative Analysis にある
Week 12 Tobit Modelsと
Week 13 Selection Modelsおよび
Zeileis, Achim, Christian Kleiber, and Simon Jackman. "Regression Models for Count Data in R"のpp. 6-8
を予習してきてください。
スクリプトはこちら
第4部:ベイズ統計
10月2日
Gill (2008), chs. 1-2.
教科書のサイトから A zip file with all code and data in the bookを落として解凍してください。
chapter01フォルダのgibbs.exponential.sにp. 32のスクリプト、(なぜか)chapter03フォルダのconsensus.sにp. 70のスクリプトがあるので、実行してください。
その後この圧縮フォルダを解凍して、その中のoct2.rを実行してください。
10月30日
Gill (2008), ch. 3.
教科書のスクリプトの改訂版
11月13日
Gill (2008), chs. 4 and 9 (secs. 1-3).
スクリプト
WinBUGS(これまでポピュラーだったので過去のスクリプトは多いが開発は終了)
OpenBUGS(今まさに開発中)
11月27日
Gill (2008), chs. 9 (secs. 4-9) and 10.
スクリプト(ch10フォルダの中は、p431.txtの前半(431頁のコード)をJAGSで実行するか、もしくは後半をRで実行すると、405頁の表1とほぼ同じ結果が得られます。sales.bugは403頁のBUGSのモデル・ファイルです)
12月11日
Brandt, Patrick T., John T. Williams, Benjamin O. Fordham and Brian Pollins. 2000. "Dynamic Modeling for Persistent Event-Count Time Series." American Journal of Political Science 44(4): 823-43. [paper] [R script]
Martin, Andrew D., and Kevin M. Quinn. 2002. "Dynamic Ideal Point Estimation via Markov Chain Monte Carlo for the U.S. Supreme Court, 1953-1999" Political Analysis 10(2): 134-53. [paper] [score]
Park, Jong Hee. 2010. "Structural Change in the U.S. Presidents' Use of Force Abroad." American Journal of Political Science 54(3): 766-82. [paper]
第5部:因果推論
12月25日
Angrist and Pischke (2008), chs. 1-3.
データをMHE Data Archive, Dehejia and Wahba (1999)から落としてください。
再現と再分析(matching)のRスクリプトはこちら。2014年1月15日
Angrist and Pischke (2008), ch. 4.1月22日
Angrist and Pischke (2008), chs. 5-8.
R script of Moulton factor
最終回
2月12日
英語論文を書く方法
参考文献American Political Science Association, Committee on Publications. 2006. Style Manual for Political Science. American Political Science Association.LaTeX
Beck, Neal, Jeff Gill, Gary King, and Jonathan Nagler. 2011. "Instructions for Authors on Reporting Quantitative Analysis."
King, Gary. 1995. "Replication, Replication." PS: Political Science and Politics 28: 443–99.
King, Gary. 2006. "Publication, Publication." PS: Political Science and Politics 39: 119–25.
インストールの仕方の例
ソース・ファイルのサンプルbeamerやポスターを含む。fukumoto_tex.tex, fukumoto_beamer.tex, poster/fukumoto_poster.texをそれぞれLaTeXでコンパイルすると、同梱した同じ名前のpdfファイルが生成されます。texファイルとpdfファイルを比べれば、やり方が大体分かると思いますので、適宜中身をいじってみてください(自分の名前に変えるなど)。文献管理・論文作成支援ソフトENDNOTEからbibファイルを生成
several style/bibliography files used in political science (apsr_fs.bst, pa.bst, jop.sty and pa.sty)
■その他
事前に教材を読んできていただき、セミナーは質疑応答の時間とします。講義はしません。
セミナーにはできればパソコンを持参することが望ましいです。
このセミナーは、私が指導する(勤務先以外の大学の)院生のために企画したものを、それ以外の方も受講できるようにしたものです。従って、当該院生を優先する運営がなされます。
どなたでも受講することができます。が、何らかの統計ソフトで出来合いのコマンドを使って何度も回帰分析をした経験がある人、を想定してセミナーを進めます。
受講を希望する方は、電子メールで福元(Kentaro.Fukumotoあっとまあくgakushuinどっとえーしーどっとじぇーぴー)までお申し出ください。
受講料は不要です。
途中から受講しても、途中でやめても、構いません。
このサイトは随時更新します。
■受講前に準備するべきこと
Rをインストールして下さい(例えば、下のRに関連するサイトを参照。最新版でなくても構わないので、既に済みの人は改めてする必要はありません。第4部までは基本的なことしかしませんので)。
Rstudioをインストールして下さい(同上)。
Rで(またはRstudioで)farawayパッケージをインストールして下さい。
(例えば福元の授業サイトにある序章の)データとスクリプトをダウンロードして、Rで(またはRstudioで)スクリプトを実行してください。
以上ができない場合は、巷の入門書で独習してくるか、受講生同士で教え合ってきてください。
■統計フリーウェアRに関連するサイト
公式サイト
日本のミラーサイト
RjpWiki
R による統計処理
統計処理ソフトウェアRについてのTips
Rについてわからないことは、大体ネットで検索すれば済んでしまいますが、それでも次の本はレファレンスとして有用です。
間瀬茂.2007.『Rプログラミングマニュアル』数理工学社.