経営科学演習Ⅲ
マーケティングのためのテキストマイニング―

担 当 者 単 位 数 配当年次 学 期 曜 日 時 限
白田 由香利 教授 2 D/M 第1学期 4

授業概要

マーケティングを学ぶ大学院生を対象として、テキストマイニングを講義します。各自の研究の中で、どのようにテキストマイニングを使うかを、講義します。講義で説明し、自分のデータを使って、それを演習でやってみる。そして、その分析結果を発表する、という実践的な演習形式をとります。研究テーマに合わせてテキストマイニングの手法についての相談にものります。この他の手法で必要なものがあれば、講義します。

到達目標

院の研究の中で、テキストマイニングを使えるようになる。
マセマティカ、Rを用いて、テキストマイニングができるようになる。

授業計画

1 マスカラを例にした口コミ分析方法
ReMeCabの起動
バイグラムのグラフ描画
2 演習
自分のデータでバイグラムのグラフ描画
3 TFIDF
マスカラを例にTFIDFによる商品比較分析
4 演習
自分のデータでTFIDFによる商品比較分析
5 演習分析発表
6 白田 他 著:「役に立つ数学」,第7章,第8章
平均,分散,正規分布,確率密度
7 2変数の度数分布(3次元)
共分散,共分散行列
例で学ぶ主成分分析 PCA
*レストランのランキング: 味とサービスの2変数
*ガンか否かの判別: テスター1と2の2変数
グラフィクスで見るPCA
固有値,固有ベクトルをグラフィクスで見て理解する
8 演習
自分のデータでPCA分析
9 演習
分析発表
10 制約付き最適化問題
ラグランジェの未定乗数法
11 トピック分析手法:LSA
SVD
LSAによるマスカラの口コミ分析
12 演習
自分のデータでLSA分析
13 演習分析発表
14 ベイズ推論のMAPをグラフィクスで見る
マハラノビスの距離:等距離の点が境界線
EMによる判別作業をグラフィクスで見る
15 総復習
履修した人の要望に応じて、速度をゆるめたり、内容を変更する可能性があります。テキストマイニングを教えることには変わりはありません。

授業方法

講義と演習を行います。

準備学習

自分の研究テーマのデータあるいは関連データで、実際にテキストマイニングを行えるようになることが重要です。事前学習は不要ですが、講義で聞いたことを、自分のデータを使ってやってみることが必要となります。

成績評価の方法

レポート:50%
平常点(出席、クラス参加、グループ作業の成果等):50%(自分のデータでの分析は個人個人で行います)
自分のデータでやってみることが重要であり、その結果、よい分析結果がでなくとも、きちんとテキストマイニングの手法を実践していれば、高い評価をいたします。ですから、結果にこだわらず、手法を習得することを楽しんでください。
Dコースとして履修する学生に対しては、別途、高度な内容を問うレポート課題を追加で出します。

履修上の注意

第1回目の授業に必ず出席のこと。

その他

白田のサイト
http://www-cc.gakushuin.ac.jp/~20010570/
白田 グラフィクス教材サイト
http://www-cc.gakushuin.ac.jp/~20010570/ABC/
英語版はhttp://www-cc.gakushuin.ac.jp/~20010570/mathABC/ABC/
そのほか、過去の期末試験、小テストの内容も解答付きで載っています。
 
9月上旬のチャクラボルティ講師の「マルチメディアと数学2」でも、テキストマイニングを講義します。合わせて履修すると、テキストマイニングが深く理解できるようになると思います。