マルチメディアと数学Ⅱ
テキストマイニング手法の理解

担 当 者 単 位 数 配当年次 学 期 曜 日 時 限
市川 収 講師 2 3~4 第1学期 3

授業の目的・内容

経営数学の多変量解析である主成分分析、コレスポンデンス分析などを、コンピュータ・グラフィクスを使って理解する。分析対象として、日本語文のテキストマイニングを扱う。日本語形態素解析ソフトとしては、MeCabおよびCabochaを用いる。数学ツールとしてRおよびMapleを利用する。テキストマイニングした結果を、多変量解析し、その解析結果をグラフィクスで描画する、という演習を行う。テキストマイニングという例題を用いて、多変量解析プロセスを理解することを最終目的とする。よって、行列、固有値および固有ベクトル、対称行列などの基礎知識を説明した後、回帰分析および主成分分析の解法プロセスなどを説明する。これらの数学知識の説明はMapleを用いて行い、Mapleによるビジュアルな解法説明を講義の特長とする。例えば、重回帰分析の回帰平面が分散、共分散で表現されること、回帰平面が重心を通ることなどを、学生自身がMapleで3次元グラフィクスを描画し確認する。本講義はマルチメディアと数学1を合わせて履修することを前提とするが、テキストマイニングに興味を持つ学生であれば、単独でも履修可能である。

授業計画

オリエンテーション(テキストマイニングの目的や事例)
Rの操作入門
形態素解析とは
ターム・文書行列の見方
WEB上での形態素解析の実践
WEB上の口コミ情報の分析
TF・IDF
対応分析演習
固有値と固有ベクトル、分散共分散行列
10 主成分分析
11 WEB上の口コミ情報の分析演習
12
13 アンケートの自由記述文の分析演習
14 総括
15 予備日

授業方法

毎回の講義は、始めに講義をして、その後、実習を行うという形式をとる。毎回、課題を出す。

成績評価の方法

提出ノートと授業貢献で評価します。
真面目に演習している限り、分からなくても問題ありません。言われるままにコマンドを打ち込んでいるうちに、中身の数字も少しずつ分かってきます。打ち込めない人は、先生とTAが手伝います。

履修上の注意

履修者数制限あり。(30名)
第1回目の授業に必ず出席のこと。