経営者・有識者インタビュー

第25回

データサイエンティストとはどんな職業か?

北川 拓也 氏
(楽天株式会社 執行役員 編成部 ビヘイビアインサイトストラテジー室 室長)

社会でどのように役に立っているかわかりにくいと言われる「数学」。このコーナーではさまざまな分野の第一線でご活躍中の方々に、社会と数学のかかわりについて語っていただきます。

第25回は15本以上の論文が『Science』をはじめとする国際雑誌に取り上げられた理論物理学者で、現在は楽天で執行役員としてデータサイエンティストのチームを率いる北川拓也さんにお話をうかがいました。

なぜデータサイエンスがビジネスで役立つのか

最近注目されているデータサイエンティストですが、一般の人には何をやっているのか見えにくいと思います。いったいどんなことをやっているのでしょうか。

北川さん:
具体的にやっていることでいうと、たとえば「パーソナライズ」があります。これは全員に同じ情報を提供するのではなく、個々のお客様の興味に合わせた情報提供でいままで知らなかった物や喜びを教え、行動変容を促し、購買という行動に結び付けていくことを指します。そのとき、どんな人と物やサービスの出合いを演出していくかが1つの大きな課題で、マッチングをどうするかを考えるときに役立つのが数学です。数学を使い、過去のデータから「この人はこんなことに興味がある」という相関や「あの人はバナー広告をよくクリックする」といった傾向を見出し、表現していくわけです。

これまでにデータサイエンスを使って成功を収めた世界としては金融、ゲーム、広告、レコメンド(利用者の興味関心がありそうな情報や商品を推薦し、購入へとつなげる手法)があり、いま価値があると言われているのがオポチュニティ・ロス(機会損失)を埋めるという考え方です。楽天のトップページには1日200万人くらいの来訪者がいますが、かりに全員へ同じようにミネラルウォーターの広告を見せても、興味を持つ人は全体の2%くらいしかいません。ということは残りの98%はまったく無駄になっているわけで、その分をマッチングできれば非常に成果が上がるようになります。考え方としては、空いている土地を有効活用するのと同じことです。

確かに、ネットの広告を見ていると「なんで私がこの商品に興味を持っているのがわかるんだろう」と感じることが増えました。

北川さん:
「人はこの商品に興味を持つ」という現象を数字に落とし込んでいくという点で、データサイエンティストは物理の世界に近い仕事です。数学者はあまりこういう考え方をしません。また、データサイエンティストという仕事の大きな部分には「数字をどう解釈するか」がありますが、その点は科学者の仕事とすごく似ています。

「数字をどう解釈するか」とは、どういうことでしょうか。

北川さん:
わかりやすい例をあげると、同じ商品が100円から200円に値上がりした場合と、6000円から6100円に値上がりした場合を比べてみてください。どちらも値上がりした金額は100円で同じですが、感じ方は大きく異なるでしょう。人間は物の値段を「倍々」で感じていると言われていて、この見方に基づけば100円の商品が200円になったときと同じ感じ方をするのは6000円の商品が1万2000円になったときです。この「人は値段を倍々で感じる」というのが解釈で、購買データの分布1つをとってもそこに解釈を与えることで「こんな動きになっているのは、こういう理屈があるからなんだ」と物の値段への感覚値が垣間(かいま)見えてきて、人間の購買の仕方が明らかになってきます。

統計の基本に平均と中央値の話がありますよね。購入金額平均を計算したら6000円だけど中央値を計算すると3000円でした、というような。購入金額の分布が正規分布をしているときは平均と中央値ががっちり合いますが、実際にはだいたいずれるわけです。そういうとき、統計学者はルーチンでlog(対数)をとります。すると、いきなり対数正規分布という形になります。logにしたら正規分布になるということは、だいたいみんなlogで値段を見ているということで、ここにも人が物事を倍々で見ている傾向が表れています。「キャンペーンを打つと購買単価はいくら上がるか」といった議論をするとき、元の平均値や中央値の話をはじめてしまいがちですが、それでは間違えます。なぜなら、人は物の値段を倍々で感じているからです。

統計専門家とデータサイエンティストの違い

現象を数字に落とし込む、すなわち数量化するための基準や考え方はありますか。

北川さん:
科学者としてのセンスです。センスの悪い物理学者はそもそも見ている数字がおかしいか、解釈の仕方がおかしい。不必要な量のデータを見ていたり、不必要に物事をややこしく解釈したり。ですから、直感が非常に重要だと思います。

先ほど言ったようにデータサイエンスに価値があるのは人に新しい行動を起こさせるからですが、人が新しい行動を起こすのはなぜかというと、そこにファンダメンタル(基礎的、根本的)な変数があるからだと考えます。ただし、ある変数が何らかの行動変容に結び付くとは限りません。たとえば「20歳代男性」「30歳代女性」というデモグラフィックな属性はその人のライフスタイルやライフステージを表す1つの相関変数に過ぎず、具体的な行動を決めるときの因果関係となる変数ではありません。

最近の行動経済学でよく知られた話に「リスクを推定する力」があります。要はある人が1%しか当たらない宝くじの損得をどうとらえるかは、その人を表すリスク変数が存在し、それに相関するという話ですね。人が何らかの行動を決定するときにはそうした変数があり、どんな表層から出るフィーチャー(特徴)が変数に影響を与え、行動変容を起こしているのかと解釈するかがこの仕事の重要なところで、それはまさに科学の世界といえます。

すると、統計解析の専門家は出したデータをそのまま伝えるのが仕事ですが、データサイエンティストはもっと踏み込んで経営にまで何らかの提案を行ったりするのですか。

北川さん:
場合によると思います。経営に対して踏み込むというと、ウェブで商品をレコメンドすることではなく、レコメンドするといったコンセプトや、人が物を買うとはどういうことなのかを提案するということになるでしょう。

本を例に人が物を買う時の理屈を考えると、人が本を読むときのコンテクスト(状況、背景)として「三巻まで読んだから四巻を読む」とか「似たような著者を読む」というナチュラルに読み進める方向性のほか、「最近、文学賞を取った」「友人から勧められた」と周囲の影響を受けるディスカバリーと呼ばれる方向性があります。あるいは、スーパーで主婦が買うつもりのなかった物をついで買いをする、という買い方もあります。だからレジ脇にはあんなにガムが積んであるわけで、そうした物を買うという理屈の中からキーとなる考え方をうまくとらえ、サービス化できるかどうかがコンセプトづくりでは重要です。これは数学というよりデザインセンスの世界です。自分が顧客だったとして、ユーザーエクスペリエンス(顧客体験)を解釈するだけの想像力があるかどうか。

アップルの故スティーブ・ジョブス氏や当社の三木谷もそうですが、優秀な経営者はお客様がお金を使うときに何が一番重要なコンポーネントか、直感的によく理解しています。データサイエンティストの役割はその重要性を数字でとらえようとするところにあり、だから直感に引っ張られないことが決して良いわけではありません。

それは意外ですね。もっと論理に寄りかかっているのかと思いました。

北川さん:
数字だけが出てきたところで、気持ちが入っていないと人間は物事を成し遂げられません。楽天でいえば三木谷が100人いれば良いのですが、現実的にそれはあり得ない。そこで従来は天才だけが直感的にとらえていた顧客の理解やお客様へのおもてなしという観点を、ソリューションも含めてパッケージ化したい。

私がやろうと考えているのは、マッキンゼーやゴールドマン・サックスという会社に近いことです。おそらく以前は企業が経営戦略を立てるとき、天才的な存在の人物に依存していたと思います。しかしマッキンゼーは経営戦略を立てる作業をルーチン化し、経営の「け」の字も知らない学生が入ってきてもトレーニングによって経営コンサルタントとして働けるようになるパッケージをつくったのです。ゴールドマン・サックスもトレーディングについて、そういうパッケージをつくりました。

いままでは天才にしか見えなかった因果関係や強い相関性を、天才でなくても見えるようにするパッケージをつくっていくと。

北川さん:
そうです。で、イーコマースのプラットフォームを提供するものとして、楽天に出店する4万4000の店舗さんにそれを教えたい。4万4000店舗が三木谷と同じくらいの経営力を持てば、間違いなく日本という国は盛り上がります。

創造的なアイデアを生むには「ポジティブ・デビアンス」に注目せよ

お話を聞いていると、データサイエンティストは思った以上に人間くさいというか、顧客視点から見なければいけないのだと感じます。

北川さん:
すべてはお客様のためにやっているからですが、これはかなり意見の分かれるところではあります。いま、データサイエンティストと呼ばれている人たちは、そういう部分を捨てることで価値が生まれると主張していることが多い。それは人を物として見るということであり、確かにそういう考えでしか生まれないものもあります。人間の興味は機械的に計算できるという思想がないと、ページをつくるときに編集者を置かずレコメンドエンジンだけ置くといった極端なことはできません。私は必ずしも人間くさいことだけを信じているわけではなく、好きなのは人間くさいほうだ、ということですね。アートやサイエンス、テクノロジーの各側面を矛盾して抱えているといっても良いでしょう。「テクノロジーで全部いける」と考える一方で「いやいや、アートでしかいけないんだ」と考えたり、お互いのバウンダリー(境界線)をプッシュし合ったりすることを私はよくやっています。

これはわれわれの課題ですが、数学を好きな人、学ぶ人を増やすにはどうしたらよいでしょうか。

北川さん:
データサイエンスのアプローチでこの問題を考えてみましょう(笑)。縦軸に数学の能力、横軸に数学が好きな度合いをとったグラフをつくってみると、数学の能力が高い人のなかに数学が好きな人が多いのは当たり前として、数学の能力はそれほど高くないのに数学が好き、という人たちがいます。たとえば小・中学生は当然、大学の研究者と比べると数学の能力はそれほど高くありませんが、中には『大学の数学』を愛読しているような愛好家もたまにいます。こういう良い方向にずれている人たちをポジティブ・デビアンスというのですが、この人たちに会いに行って「数学の力はそれほどないのに、なぜ数学を楽しめているのか」をひたすら研究してみる。統計で物事を見るとき、普通は数が多い人たちに目が向きがちですが、そうではなく、ポジティブ・デビアンスを見ることによってクリエイティブなアイデアが思いつくんです。

なるほど。

北川さん:
その人たちがなんで数学を楽しんでいるのかという部分の核心を見つけ出し、それを主軸に据えて教材やコンペティションなどをつくっていけばいい。これは私たちのやっていることとまったく変わりがありません。たとえば、楽天での購買度合いと楽天への愛着度を調べると、それほど楽天に愛着がないのにたくさん買ってくださっているお客様がいます。なぜだろうと思って調べてみると、お客様が購買している店舗さんの力が強く働いていました。すると「店舗さんへのサポートが非常に大事だ」という認識が生まれ、そこに力を入れるという戦略ができあがります。これと同じことをやれば良いのです。

あと、数学の理論のおもしろさをストーリー仕立てで伝えられたら、かなり興味を持てるようになるのではと昔から思っています。私がある有名な方程式を思い出せず、指導教授に「どんな方程式でしたっけ?」と尋ねたとき、「こういうことなんだよ」とストーリーを語りながら導出してくれて「そうやって考えるんだ!」と感動したことがあります。主要なコンセプトにはおもしろいストーリーが必ずあるので、一流の研究者に話を聞いて回ったらめちゃくちゃおもしろい説明が返ってきますよ。。

今日はありがとうございました。

プロフィール

北川 拓也(きたがわ たくや)

楽天株式会社 執行役員
編成部ビヘイビアインサイトストラテジー室 室長

1985年生まれ。灘中学校、灘高等学校を卒業。高校時代に化学オリンピックで国内最優秀賞を受賞。高校卒業後、現役でハーバード大学に合格。数学、物理学科を専攻し、ダブルメジャーで最優等の成績をとり卒業。その後ハーバードの大学院に進み、2013年、博士過程を修了。今までに15本以上の論文が国際雑誌(Science, Nature communicationsなど)に取り上げられ、その内の3つの論文が特別に重要な論文として編集長から指定された。世界中の物理学者と共同研究をし、これまで20以上の研究所や国際学会で招待講演をしている。現在は楽天執行役員編成部ビヘイビアインサイトストラテジー室室長としてデータサイエンスのチームを率いている。

経営者・有識者インタビュー 一覧に戻る