統計学の現状と今後

星

[著書]

  • Time Series Analysis: Nonstationary and Noninvertible Distribution Theory, Second edition, John Wiley, New York, 2017.

  • Time Series Analysis: Nonstationary and Noninvertible Distribution Theory, John Wiley, New York, 1996.

  • 『経済統計』岩波書店, 1996 年.

  • 『計量経済学』岩波書店,1998 年.

  • 『統計学』新世社, 1998 年.

  • 『経済統計 第2版』岩波書店, 2002 年.

  • 『経済時系列の統計−その数理的基礎』(共著)岩波書店, 2003 年.

  • 『現代時系列分析』岩波書店, 2006 年.



    [受賞歴]

  • The T. C. Koopmans 賞

    (論文 "An alternative approach to the asymptotic theory of spurious regression, cointegration, and near-cointegration" に対して),1996 年, Econometric Theory.

  • 第 3 回日本統計学会賞

    (統計学の研究活動, 特に,著書「Time Series Analysis」の研究成果に対して)1998 年.

  • Econometric Theory Award

    (計量経済学の 理論的学術誌への論文発表の功績に対して)1999 年.



    ------------------------------------------------------------------------------


    以下,日本統計学会会報 No.101/1999.9.20 からの抜粋


    統計学は生き残れるか  田中勝人


    私が大学において統計学の教育・研究に従事して約 20年になる.その前半にあたる1980年代は,特に束縛もなく,のびのびと従事することのできた時期であった.しかし,90年代に入ってしばらくすると,文部省が大学再編に積極的に関わり始め,教育体系に関しては教養部よりも学部,学部よりも大学院という形で専門性を重視する方向をめざす改革を断行してきた.もちろん,その方向性を容認できるからいいようなものの,容認できないとしても,このような文部省の介入は,国家予算を基盤として運営されている国公立大学や研究機関が拒否できないところのものであろう.また,改革自体も,構造的に保守性や怠慢さを有していた大学が,社会情勢の変化に対応していずれは実行を迫られたことであろうが,大学自らの変革を待ちきれなかった文部省が先に腰を上げ,社会的需要に応える方向をめざしたものである,と考えられる.そして,現在では,教育面のみならず,研究面も包括した自己評価がノルマとして定期的に実施され,さらに第三者機関による外部評価も導入されようとしている.文部省による大学再編の道はとどまることなく,さらに独立行政法人化,ひいては民営化への道を着実に歩んでいる.大学側もこのようなシナリオを十分に認識した上で,重い腰を上げ,今はまさに存続を賭けた戦いに挑んでいるところである.それにしても,我々大学人は,かつては大人の扱いを受けた身分から,監視下にある子供のような存在に陥落したものだと慨嘆せざるを得ない.

    おそらくいつの時代でもそうであろうが,統計学にかぎらず多くの学問は,社会状況と独立に存在することは不可能である.したがって,統計学に携わっている多くの研究者が所属している国公立大学や研究機関が改革の嵐の真っ只中にいる現在,その状況とは無関係に学問の未来を語ることはできそうにない.また,私立大学や民間の研究機関で統計学に携わっている方々も,タイム・ラグをもってそのような改革の余波を受けることになるであろう.もちろん,統計学の入門レベルが教えられていた教養部が廃止された時点から統計学の危機は始まっていたわけで,今後の変革の中で,統計学の存在価値がさらに低められる可能性も大である.このような現実を前にして,我々統計学の研究に従事している者は,国公立大学の再編と同様に,いわば生き残りをかけた戦いに挑まねばならない.

    さて,統計学が今後どのような形で生き残っていくかについては,多くの議論がありうると思う.国公立大学がリストラされると同様に,学問分野のリストラが始まろうとしている現在,統計学を生活の糧にしている我々は,統計学の重要性と価値を認識してもらう努力をする義務があろう.かつて,G.E.P. Boxは,アメリカ統計学会長講演 (JASA, 1979, Vol.74) において,統計学者の分布が,一方の極に統計理論を専門にする統計学者がおり,他方の極に応用専門の統計学者がいて,その結果,中間層の薄い双峰分布になるのは好ましくない,と述べた.そして,望ましい分布というのは,中間層が厚くなる分布,理論と応用の両面を志向する統計学者からなるような単峰分布であり,そこから多様性がもたらされるのが望ましい,という見解を披露した.我々研究者は,この点を肝に銘じるべきであると考える. もちろん,統計学のあり方として,一方においては,統計学は数学的な科学として従来の枠組みや論理を守るべきであり,他の学問との共存を図ることを良しとしないという考え方があろう.しかし,私はこのような考え方を支持することはできない.いかなる統計理論も,それが使われる領域があるから存在価値があるのであり,数学のように理論が自己目的化するようなことは,統計学の学問的性格と相容れないことである,と考える.また,そのような方向性は,現代の学生にソッポを向かれることであり,後継者を逃がす自殺行為に等しいと考えるからである.

    他方において,統計学を応用科学として規定することにも留保条件を付け加えねばならない.通常の応用科学は,背後にある理論を駆使してよりよい製品を研究開発したり,サービスを提供する,という人類の幸福に直接的に寄与するような陽表的なイメージをもっている.これに対して,統計学は人類の幸福に直接的に寄与する度合いがはなはだ小さい.少なくとも,一般の人から見れば,地味で目立たないマイナーな学問であることは確かである.ならば,統計学はいかなる意味で科学であり,応用科学たりうるであろうか.この点がまさに統計学の存在価値が問われるところであり,過去多くの統計学者がくり返し発してきた問いであろう.この問いに対して,私は次のように答えたい.「普通の応用科学が人類の幸福に直接的に寄与するのに対して,統計学は,統計的方法を必要とする他の学問分野や官庁・企業に奉仕する応用科学である.」統計学が地味で目立たない応用科学であるのは,奉仕対象が一般の人でないゆえの当然の帰結である.

    以上の点を認識した上で,我々は統計学の将来の担い手である学生に統計学の魅力を大いに語る必要がある.私自身は,「縁の下の力持ち」や「ボランティア精神」が統計学を語るキー・ワードになりうると思っている.もちろん,魅力的な要素として美しさやロマンも大切である.例えば,中心極限定理や非中心極限定理の不思議さや美しさを感得させ,また,統計的推測とは,ともすれば無味乾燥に見えるデータの背後にある母集団に思いを馳せることであり,それはあたかも壮大な宇宙の構造を「確率モデル」という変幻自在な武器を使ってあれこれと思い巡らすという,ロマンに満ち溢れた知的作業であることを感じさせたい.ただし,縁の下の力持ちである統計学は,自らの貢献を明らかにしたり自己宣伝をすることをためらう,という美学も持ち合わせていることが,今の世の中では欠点ともなっているが.

    ところで,統計学の境界領域にはさまざまな学問が共存,あるいは競争的な関係で存在している.現在,統計学と最も競争的な関係にあるのは,情報処理などコンピュータの積極的利用に関連した分野であろう.もちろん,統計学とコンピュータは統計パッケージという形で長い付き合いがある.その場合の関係は,パッケージの作成者のほとんどが統計学者ということもあり,統計学が主で,コンピュータが従という関係をずっと保ってきた.いわば,奉仕を旨とする統計学が,コンピュータに奉仕されてきたわけである.そして,パッケージの更新はコンピュータの性能の向上を動機とする場合が普通であった.   しかし,情報処理の分野では,コンピュータのめざましい発展に支えられ,統計学におけるよりも大規模にコンピュータを駆使し,一般の人々により鮮明な形でその存在をアピールしている.さらに,情報処理の分野の中に統計学の親戚のような分野を作り出している.例えば,image processing(画像処理)の分野では,複雑で大規模なデータの処理が問題になるが,その中で従来の枠に拘束されない統計的方法が使われる.応用科学として,情報処理の分野は統計学よりも目立つ存在であり,ある種のカッコよさもあり,地味,目立たなさとは無縁である.このような事実関係を前にして,統計学は情報処理と一線を画すべきか,それとも協調すべきであろうか.経済学においては,貿易を行う理由を説明する理論として「比較優位説」がある.それぞれの国が安く生産しうる財,すなわち比較優位にある財に特化し,他の財の生産は相手国にまかせるという形で国際分業を行い,貿易を通じてそのような財を相互に交換すれば,両国とも貿易を行わなかった場合よりも利益を得ることができる.この説が妥当するならば,情報処理との関係の方向性は明らかである.ただし,この場合,国同士が侵略,統合などのない独立国家として存続するという前提がある.果たして,統計学が情報処理の中に包摂されることなく独自の役割を果たすことができるかどうか,比較優位の原則が有効に作用するかどうか,上述した意味での統計学の応用科学としての力量が試される場面である.

    田中 勝人(たなか かつと)

    1973年一橋大学経済学部卒,1979年オーストラリア国立大学大学院統計学科修了.統計学Ph.D. 1979年金沢大学法文学部講師,1984年一橋大学経済学部助教授,1990年同教授を経て,現在は一橋大学大学院経済学研究科教授.1998年第3回日本統計学会賞受賞. 時系列解析,特に経済データのような非定常時系列を分析するための統計理論,定常過程の中でも従属性の強い時系列を扱うフラクショナル・モデルの統計分析に興味がある. Econometric Theory誌(Cambridge University Press 発行)のCo-editor. 日本統計学会,日本数学会,日本経済学会などの会員.


    ------------------------------------------------------------------------------

    以下,日本統計学会会報 No.144/2010.7.25 からの抜粋


    巻頭随筆:のどかな時代のメディアンの思い出  田中 勝人(一橋大学)


    ここでは,私にとって自由な時間があった今から20年ほど前の時代,それは大学にとっても古きよき時代の終わり頃の思い出について,少し書いてみたい。 当時,私の所属する研究科の大学院修士課程入試の合否判定会議では,ボーダーラインに並んだ受験生の合否を決定するのに,成績順に並んだ受験生(同一成績の者は同一人とみなす)の中の成績1位の者について可否投票を行い,「否」が過半数の場合は全員を不合格として,合否決定を終了する。そうでなければ成績1位の者を合格として,次に,2位の者について同様の投票を行う。以下,成績順に1人ずつの可否投票を繰り返して,「否」の票が初めて過半数に達した時点で,その者を含め下位の者は不合格とする。そのような方式で,合否判定を行っていた。大学院でも入学定員を充足することが要請される現在の入試と比べれば,定員充足のことに悩む必要のなかった時代というのは,何とのどかであったことかと思う。 それにしても,この方式ものどかであり過ぎた。この方式では,最大でボーダーラインに並んだ人数分の投票を行うことになり,種々の手間がかかる。そこで,私は,全く同じ結果をもたらす方式で効率的な方法がないかを考えた。投票前に成績分布が示されており,各投票者は何人を合格させるのが望ましいかを決めてあるはずであるから,その人数を投票すればよいのではないかと思い,その結果,メディアンを使う方法を思いついた。それは,教授会のメンバー n人(n は,まず奇数と仮定する)の各々が,成績上位者の何番目までを合格とするか,その番号を投票したとき(全員を不合格とする場合は 0),n個からなる投票番号のデータのメディアンをボーダーライン上の受験生の合格者数とするものである。

    実際,ボーダーライン上の受験生について1人ずつの可否投票をして合格者がm人であったとすると,全員合格の場合はm回,それ以外はm+1回の投票が行われたことになる。ここで,成績がi番目の者に投票された「否」の票数をa(i) とする。したがって,「可」の票数はn−a(i) となり,合格者がm人であることから,不等式 a(m) < n/2 < a(m+1) が成り立つ。ここで,a(i) は単調非減少であり,m人が全員合格の場合は a(m+1)=n とおくことにする。 他方,成績上位者の何番までを合格にするか,その番号を投票した場合,上の投票結果から,投票番号 i の票数は a(i+1)−a(i) となり,iまでの累積票数は a(i+1) となることがわかる。なお,a(0)=0である。このことと上述の不等式から,累積票数の半分をもたらす投票番号はmになることがわかる。すなわち, mがメディアンとなり,合格者数に一致することになる。 具体例として,n=51 で,ボーダーラインに5人が並んでいる場合に,何番までを合格とするかの投票結果が次の通りであったとする。

    投票番号  1  2  3  4  5

    票数   10  15  11  8  7

    累積票数 10  25  36  44  51

    この場合,投票番号をデータとみなしたときのメディアンは3であり,m=3人を合格とすることになる。なお,このデータのモードは2,平均は2.7となるが,これらの特性値を合否決定に使う合理的根拠を見出すことは困難である。そして,この結果は,1人ずつの可否投票に関する情報を含んでおり,それは次のようになることがわかる。もっとも,この場合の可否投票は,4番目の受験生で打ち切りとなる。

    順位  1  2  3  4  5

    可   51  41  26  15  7

    否   0  10  25  36  44

    今までは,投票総数 n を奇数と仮定したが,その理由は,メディアンが必ず投票番号のいずれかの自然数となり,議論が単純となるからであった。しかし,投票総数が偶数の場合には,メディアンが1.5や2.5などのように,自然数でなく,投票番号の中点となることがあり得る。その場合の合格者数は,メディアンを切り上げた数か,切り捨てた数かを決めておく必要がある。それは,可否投票についていえば,可否同数の場合にどうするかということである。合格とする場合には,メディアンを切り上げた整数値が解を与えることになる。例えば,n=50 の次の結果を考えよう。

    投票番号  1  2  3  4  5

    票数    10  15  11  8  6

    累積票数  10  25  36  44  50

    この場合,投票番号のメディアンは2.5となり,それを切り上げた整数値3が合格者数となる。実際,1人ずつの可否投票の結果は次のようになることがわかる。

    順位  1  2  3  4  5

    可  50  40  25  14  6

    否   0  10  25  36  44

    この場合,3番目は可否同数となり,ここまでを合格とすることになる。

    メディアンによる上記の合否決定方式は,90年代のほんのわずかの間,実際の大学院入試の合否決定に採用され陽の目を見た。しかし,その後,定員確保と入試の多様化に伴って,合否判定方式も変わって行った。ところで,この方法が1人ずつの可否投票と同等なことは,人間の判断の合理性を前提としており,途中で考えを変えるようなことがあれば,同等性は崩れてしまう。また,可否投票でも,下位から行えば,上位からの場合と結果が異なってしまうかもしれない。合否決定に限らず,何らかの決定を行う際には,手続きのやり方に依存して,最終決定に違いが生ずるというような問題が潜んでいる。それは,とりもなおさず,神ならぬ人間のなせるわざなのであろう。

    私が属している国立大学法人は,今年度から6 年間の第2期中期目標期間に入った。全国立大学法人に課せられている重要な検討課題として,組織の見直しが掲げられており,大学院,特に博士後期課程では,収容人数ではなく,入学者数で未充足が続けば定員の削減対象となり得る。ここで書いた話は,定員を気にせずに入学者を決めていたからこそ思いついたものであり,のどかな時代背景が生んだ産物であったと思う。