演習(4年生)
経済関連WEBデータのテキストマイニング―

担 当 者 単 位 数 配当年次 学 期 曜 日 時 限
白田 由香利 教授 2 4 第2学期 2

授業概要

白田ゼミでは,アジア通貨危機や東日本大震災後等の経済状況を可視化とテキストマイニングの手法で分析します.
分析の流れは,はじめにwebから株価,GDP, 為替レート,外貨準備金,等の経済データをとってきます. IMFの統計データベース等を使います.次に,白田の作成したグラフ作成ツールを用いてグラフを描きます.クラウドの環境で作成し,完成したグラフもWEB上で対話的に参照できます.データを変えて様々な角度からグラフを描き,皆でまずは,それを詳しく見ます.そして,株価変動の場合であれば,他社(他国)に比較して,株価が大幅に伸びている,あるいは下がっている企業を見つけ,その理由をテキストマイニングで分析します.このデータとしては, SNSの書き込みデータなどを用います.その書き込み,口コミ情報,また,企業の評判情報などを集め,それらのテキスト群をMeCabという形態素解析ソフトを用いて分析し,名詞,形容詞などに分割し,重要度の高い単語を抽出します.次に,抽出された単語群から,注目する企業名をルートとする共起関係のグラフ構造を作ります.そのグラフを解析することで,どのような内容が書かれているかが分析できます.分析手法としては,主成分分析などの多変量解析を使います.
マイニングの特長は,時系列にテーマの移り変わりを発見することです.出現単語の共起関係を元に,盛んに話されてる(時には炎上している)テーマを複数選び出します.アジア通貨危機がタイから始まり伝搬していったようす等がテーマの変遷として見えてきます.グラフと合わせることで,そのとき,いかにuncertainな状況であったのかが理解できます.
プレゼン発表の回数が多いです.プレゼンは,将来,海外で活躍できるように,英語で行ってもかまいません.日本語発表同様に,英語の発表の仕方も,丁寧に指導しています.
技術的ハードルは高いかもしれませんが,気が付いてみると,ITスキルが大きく伸びていることでしょう.
去年の3年生には、日銀金融政策議事録要旨のテキストマイニングの結果を学会発表してもらいました.学びたい人、スキルを伸ばしたい人、応援します.

到達目標

テキストマイニングでトピックの時系列変化分析ができるようになる。
経済英語の表現が使えるようになる。

授業計画

1 オリエンテーション
2 個人またはグループによるプレゼンテーション
3 演習および講義
4
5
6
7
8
9
10
11
12 個人またはグループによるプレゼンテーション
13
14
15 まとめ

授業方法

以下のURLにゼミで作成したグラフがあります。http://www-cc.gakushuin.ac.jp/~20010570/ASIA/  ,
http://www-cc.gakushuin.ac.jp/~20010570/SHINSAI/kawase/src/2012semi/
このようなグラフィクスを描きます。

準備学習

準備は不要ですが、講義で出された課題をやってきてください。

成績評価の方法

レポート:50%
平常点(出席、クラス参加、グループ作業の成果等):50%
課題レポートと、複数回の発表の内容を重視します。

履修上の注意

履修者数制限あり。
第1回目の授業に必ず出席のこと。

その他

白田のWebに各種教材が載っています。http://www-cc.gakushuin.ac.jp/~20010570/
 
ゼミ合宿は、国内のほか、海外があります。昨年はインドネシアのインドネシア国立大へ行き、簡単ではありますが、アジア通貨危機についての英語発表を向こうでしてきました。そして、ボゴール・アグリカルチュアル大学で環境保全の研究者から直接お話を伺い、自然環境を実際に見学しました。今年もインドネシアでゼミ合宿をする予定です。そのため、経済英語、集中特訓などもやります。国際的視野を広げたい人、どうぞ来てください。
 
欠席していると、分析手法が分からなくなってついてこれなくなります。運動部の合宿がある人は、履修を奨めません。
 
オフィスアワーは、講義のある日の月曜の昼休みとします。