セミナーレポート

データから「未来を予測する」技術

情報処理学会連続セミナー第1回を取材

2014/7/14

 「ビッグデータ」「データ分析」がバズワードになって久しい。2014年6月9日に行われた情報処理学会の連続セミナーでは「予測と意思決定のためのアナリティクス技術」と題し、予測分析で用いられている技術について、専門家から解説が行われた。

受講者の絶えない連続セミナー
受講者の絶えない連続セミナー

レコメンデーションとその技術


 最近のネットショッピングでは、必ずと言っていいほど目にするものがある。「あなたへのおすすめ」「この商品を購入した人は、他にもこんなものを購入しています」と題された売り手からの商品紹介だ。今のインターネットを介した売買は、この「レコメンデーション」と呼ばれる機能が大きな役割を果たしている。レコメンデーションの仕組みは、一般的に購入履歴を元にした「協調フィルタリング」というアルゴリズムで成り立っている。


 過去に「A」「B」「E」という曲を高く評価しているユーザデータがあり、別のユーザが「A」と「E」を高く評価している場合、「Bがおすすめです」と提示する、といった具合だ。


 データ分析サービスなどを提供しているPreferred Infrastructureの得居誠也氏は、協調フィルタリングのほかに、「コンテンツベース」「深層学習」のレコメンデーションを示した。


 コンテンツベースは、よりユーザ個別の嗜好に合わせた仕組みだ。商品ごとに、ユーザの年齢・性別・居住エリアなどのデータでグループ分けをする。この紐づけを元に、「こういうユーザならば、この商品がおすすめ」と紹介するものである。


 「深層学習」は、購買履歴から詳細な確率モデルを使ったアプローチ。音楽であれば「曲を3秒ごとに区切って特徴を取る」(得居氏)などを行って商品を詳細に分析し、レコメンデーションする手法だ。

深層学習を解説する得居氏   米国の予測市場を紹介する水山氏
深層学習を解説する得居氏   米国の予測市場を紹介する水山氏

イノベーションに追い付いていない教育


 「ビッグデータを分析してイノベーションを」というフレーズが席巻して久しい。これについて東京工業大学大学院准教授の梶川裕矢氏は「機械、医療、薬学など、データ分析は今までどの分野でも行ってきた」ことを強調した。


 梶川氏は、タブレットPCやスマートフォンなどのデバイスを個人が複数持ち歩くようになり、「サンプリングよりも全数調査できる」環境が、「分析技術ブーム」の背景となっていると解説した。


 ただ、米国でのデータサイエンス関連の需要は着実に増加しているものの、日本では下がっているという。「(分析)ツールがあっても、クライアント企業側にデータ分析できる人材がいない」(梶川氏)ことが原因だ。


 こうした人材不足の原因をたどると、教育への力の入れ方に行きつく。梶川氏は「先行投資」として、米国と日本の学生を比較した。米国では1970年代以降、情報科学系の大学院を修了した学生が着実に増えてきた。その波を追うように、Appleなど米国のIT企業が売上高を伸ばしている。


 これに対し、同じ日本の学生は1989年までほぼゼロ。「焦った政府が奈良先端科学技術大学院大学などを設立して」(梶川氏)ようやく増えたという。梶川氏は「科学技術は基礎研究から、それを応用した技術で市場が出来上がるまでは10年単位の時差がある」として、教育の重要性を指摘した。


 また、梶川氏はイノベーションが起こりやすい環境について「政治システム(民主主義、社会主義)や、市場のオープン性は関連しない」と言及し、日本のTPP(環太平洋パートナーシップ協定)への参加には疑問を呈した。


「予測市場」でデータを集める


 こうした未来予測は、何も機械学習だけではなく、「人間の予想を使う」、という手法もある。青山学院大学准教授の水山元氏は「予測市場」というマーケットを紹介した。


 この市場は、株式市場やブックメーカーのように人々が自分の予測に対して証券を購入する。結果が当たっていればリターンが来る。実際、ハリウッド映画のヒット予測「hsx.com」や、米アイオワ大学が運営する選挙予測「IEM」という予測市場が米国に実在する。


 選挙予測は、2013年の参院選の際にヤフーが行った「参議院選挙の議席予測」が記憶に新しい。一方「IEM」では、候補者の「証券」を発行し、その証券売買の動向データを用いて選挙を予測するものだ。水山氏は予測市場の意義を、「『取引』という形で、データ化が難しい人間の暗黙的な知識も利用することができる」とした。


 この「予測市場」を、どう応用するか。水山氏はPCメーカーのHP社の製品に対する売上予測に予測市場を利用したところ、企業の公式予測よりも予測市場での結果の方が勝っていたという。


 技術の深掘りから、人間の集合知まで、ありとあらゆる手段を使って行われる「予測」研究に、これからも目が離せない。

(中西 啓)

【セミナーデータ】

イベント名
:予測と意思決定のためのアナリティクス技術
主催   
:情報処理学会
開催日  
:2014年6月9日
開催場所 
:化学会館(東京都千代田区)

【関連カテゴリ】

トレンド