筑波大学システム情報系掛谷英紀准教授らは、先見性のある人物と先見性のない人物の特徴を見出す方法として、Amazonのカスタマーレビューを使った機械学習の研究に取り組んでいる。
掛谷准教授は「先見性のある人物と先見性がない人物の特徴が明らかになることで、選挙における先見性のある人物への投票や、先見性のある人物が経営する企業への就職支援などにつながる」と話す。
研究では「先見性のある人物」を「ある時期から大きく評価が変化した書籍について、後に優勢となる評価を初期にしていたユーザ(レビュア)」と定義。具体的には、レビュー評価の転換期よりも前の時点で、その書籍についてレビューしているユーザのうち「発売当初、評価が高かった書籍に1点または2点の評点を付けている、または発売当初、評価が低かった書籍に4点または5点を付けていたユーザ」を「先見性がある」とし、「発売当初、評価が低かった書籍に4点あるいは5点の評価を付けている、または発売当初、評価が高かった書籍に1点あるいは2点を付けているユーザ」を「先見性がない」とした。
しかし、この定義だと、初期の多数派は先見性のないユーザになってしまい、ユーザ数に大きな差が出てしまう。そこで、レビュー数が圧倒的に多い2冊の書籍について、先見性のあるユーザのみを抽出。先見性があるユーザとないユーザについて、各ユーザのAmazonでの商品レビューをすべて収集して分析。
その結果、先見性があるユーザ72人、先見性がないユーザ71人が見つかった。
先見性のあるユーザのレビュー数は合計1万6242件、先見性のないユーザのレビュー数の合計は1万1801件となった。今回、分析の対象とした書籍は表のとおりだ。
集めたレビューは、形態素解析ツール「ChaSen」を使って、それぞれの素性(単語)ごとに分割し、機械学習法の1つである「最大エントロピー法」にかけた。
そこで得られた素性の特徴として、先見性のあるレビューとは「『作者』の『自己』満足、分かり『にくい』、『新しい』切り口といった本の感想や、『最初』の一冊におすすめ、『十分』、不『十分』といった、他のユーザへの推薦に言及したものが多く見られた」
一方、先見性のないレビューには「テレビ」化した書籍、「メディア」や「テレビ」に出ている著者の本を手にした経緯に言及したものが多く見られた。このことから、「マスコミの情報に流される人は先見性に欠ける傾向があると考えられる」と分析する。
「先見性」について研究を進める背景について、掛谷准教授は「言われたことを言われたとおりにやる仕事をしている人にとっては、先を見通す先見力は不要かもしれないが、そういった仕事は今後、AI(人工知能)やロボットに取って代われる可能性が高い。特に、企画、マーケティング、研究開発の仕事に携わる人は、うまくいくものを探す必要があり、先見力が必要」と話した。(蓬田修一)
教育家庭新聞 教育マルチメディア号 2019年3月4日号掲載