データサイエンティスト+ビッグデータ=ビジネス価値を高める
デジタルマーケティングプロデュース事業部のコストフです。
こんな状況を想像してみてください。
あなたは生き残るために、物凄い価値のある黄金の塊を見つけなければなりません。
問題なのは、それがゴミの山の奥深くに埋められていることです。
あなたを助けられる人は、暗闇や誰も足を踏み入れない恐ろしい場所に隠された財宝を見つけ出す、卓越した技術を持った勇敢な探検家だけです。
現実世界に置き換えてみましょう。
あなたは、マーケティング・エグゼクティブです。ステイクホルダーのためにビジネス価値を高める、というクリティカルなミッション、すなわち、デジタルマーケティングの激しい荒波の中であなたの会社が生き残るためのミッションを課されています。
すなわち、目的達成のために、あなたはBig Dataと呼ばれるゴミの山を綺麗にしなければならないのです。
お助けが必要ですか? ご心配なく。データサイエンティストチーム(もしくはデータ探索チームといってもいいでしょう)があなたを助けてくれます。
初回である今回の記事は、序説として、データサイエンスやデータサイエンティストとは何であるか、を理解していただくことを目的としています。
つまり、彼らのスキルセットや、彼らはどうやってビジネスバリューを導き出すか、お客さまやチームメイトとの良好な関係のために彼らがすべきこと・やってはいけないことについて述べていきます。
1. データサイエンスとは何か?データサイエンティストはどんなスキルを持っているのか?
ハーバード・ビジネス・レビューの著名な記事 によると、データサイエンティストは「21世紀で最もセクシーな職業」と言われています。
彼らは超巨大なBig Dataと格闘するエキスパートであり、hadoop やSparkのようなオープンソース・フレームワークをつかって分散されたデータをコンピュータ処理することができます。その時、彼らは非構造化データを構造化データに転換するだけではなく、同時に分析し、価値ある洞察を導きます。そして、彼らを突き動かすものは、知的好奇心です。彼らは現状に挑戦し、真実の深淵を探り、ビジネス課題の本質的な課題を探し出すために何度も仮説検証を繰り返し、ついにはそこに到達するのです。
私が参加している国際会議のI-COM(データ・ドリブン・マーケティングやメジャメントの第一人者たちが集まる国際会議。ネットイヤーは同団体の戦略パートナーを務めています。)では、ビジネスにおけるデータサイエンスの重要性を認識しており、データサイエンティスト・ボードという理事会の運営に力を入れています。
この理事会の出版物には、データサイエンスの教育方法と、典型的なデータサイエンティストに期待されるスキル基準をサマリー化したマトリクス図が記載されています。
このマトリクス図は、データサイエンティストに必要な3つの領域のスキル(コンピューティング、リサーチ、ビジネス)を、さらに3つの専門レベル(ビギナー、アドバンス、マスター)に分解しています。

引用元:「DATA SCIENCE EDUCATION MATRIX」I-COM Global Forum for Marketing Data and Measurement
例えば、データサイエンティストのマスターレベル(10年以上の実務経験者)は、データドリブンサービスにおける新しいビジネス機会創出が求められています。一般的な事業におけるシニアセールスと同じようなスキルセットですね。
そして、データドリブン・ダイアグラム についてお話しします。これは、著名なBig Data コンサルタントであるDrew Conway氏によって開発されたものです。これには、データサイエンティストの必須スキルが叙述されています。また、このダイアグラムは、データサイエンスのコミュニティにおいて、普遍的な標準スキルセットとして認知されています。
引用元:Drew Conway Data Consulting, LLC.
このダイアグラムによると、データサイエンティストは3つの基本スキルを共有しています。すなわち、hacking(プログラミングスキル)、math & statistics(数理統計スキル)、substantive experience(実務領域の専門スキル)の3つです。
多くの人は上記のうち2つのスキル領域を持っていますが、3つ全てを有している人、つまりデータサイエンティストは、極めて少ないのが現状です。データドリブンなプロジェクトを評価するときには、真っ当なデータサイエンティストの見極め方を学ぶこと、「自称データサイエンティスト」、つまり3つのうち2つのスキルしか持っていない人たち、を選別することが重要です。
例えば、プログラミングが得意な人たちや数学や統計に優れている人たちは、非構造化データを構造化して、データをクレンジング(分析できる状態に整える)し、データから統計的なインサイトを抽出することはできます。そのような人たちは、機械学習のアルゴリズムにはよいかもしれません。しかし、各ビジネス領域の専門家がそれぞれ持っている知識発見や知的好奇心のスキルが欠けています。彼らはデータサイエンティストとは言えません。
次に、数理統計と特定ビジネス領域の専門スキルのみの人たちは、大学の研究室や研究所で働いているような、伝統的なリサーチャータイプの人たちです。彼らはコンピュータ処理のノウハウが欠損しているので、ローデータのような大規模データを処理することができず、やはりデータサイエンティストとは呼べません。
また、優秀なプログラマーでありビジネスエキスパートでも、数理統計スキルが足りない場合、やはりデータサイエンティストとは言えません。そして、実際のところ、彼らは”Danger Zone”にいます。
なぜ彼らは危険なのでしょうか?彼らはビジネスを十分に理解し、データを構造化でき、そしておそらくは、幾つかの統計モデルを走らせて係数や因子を導き出せるのに?
彼らは統計学の専門知識が欠けているので、処理結果が何を意味するか把握することができず、正確に説明することも出来ないからです。彼らが企業のためにデータサイエンティストの仕事をする場合、それはロシアンルーレットをやっているようなものです。彼らの分析アウトプットは、見た目はよいのですが、仮にその示唆が何かを隠蔽したものなら、それは正にリボルバーに装填された弾丸と同じです。また、もし彼らの示唆が統計的におかしなモデルに立脚していたら、マーケティング責任者であるあなたの意思決定は、例えるなら、”弾丸を噛む”(*1)ことと同じになってしまいます。”Danger Zone”の人たちには、気をつけましょう(笑)
*1 bite the bullet:慣用句で「危険を承知で我慢する」ということ。昔、戦場で麻酔なしの手術をするとき、兵士は弾丸を口にくわえて我慢したことから。「嫌なことに立ち向かう」という意味もありますが、ここではbulletのダジャレです。
データサイエンティストはどんな人なのか?
真実を知ったあなたは、訝しげにこういうでしょう。
「うーむ。ちゃんとしたデータサイエンティストのチームによる提案ができる会社を見つけるには、かなり骨が折れる。本当にそれだけの労力を費やしてまで考えるべきことなのだろうか…?」
2. なぜ、マーケッターはデータサイエンス領域のサービスを広げるべきなのか?
データサイエンティストを雇うべき、その納得できる理由について、3つのポイントをお話しします。
一つ目は、データに裏打ちされた課題解決方法を見つけ、かつビジネスの成長持続性を担保する必要性です。
もしあなたがデジタルマーケターなら、直近の顧客や見込み客に関する、Big Data(残念ながらほとんどがゴミだが)を持っているでしょう。売上を上げ、コストを下げ、顧客とよい関係を作り、ブランド認知を獲得する、云々、あなたは解決すべき様々なビジネス課題に直面しています。しかし、ビジネス課題が何であれ、ビジネスの成功はあなたが顧客のニーズをより良く知る能力と、チーム内での良質なコミュニケーション能力に依存しています。
ですから、デジタルマーケターは、価値ある、そしてメンバーがアクションに移せるビジネスインサイトを「ゴミデータ」から抽出する必要があります。金塊の話を覚えていますか? 金塊を見つけたいとき、誰を呼べばいいのでしょう?そう、データサイエンティストを呼べばよいのです。
二つ目は、マーケターの仮説を検証し、反証するアシスタントを得る必要性です。
データサイエンティストのチームは、あなたの「ゴミデータ」から洞察や裏付けを見つけ、あなたの課題解決仮説の有効性、時には無効性を立証するアシスタントとなるでしょう。
さらに良いことに、彼らはあなたが思いもしなかった隠れパターンを、データの中から見つけることができます。少なくとも、私が参画したデータ分析プロジェクトの多くは、お客さまの期待値を良い意味で裏切り、意義深い結果にたどり着くことができました。このような予想外の結果を見て、多くのクライアントはこんな反応をします。
「うわ!こんなの考えたこともなかった!えーと…、もしこのファインディングを用いたら、あーやって、こーやって、目標達成に大きなインパクトが期待できるぞ…!」
そう、眼に浮かぶでしょう?期待値以上の結果を得て、ハッピーじゃないお客さまなどいないのですから。
三つ目は、継続的なビジネス効果改善のために、PDCAサイクルを適用する必要性です。
データサイエンティストが数値測定をしてビジネス効果の予測を立てることで、マーケターは、お客さまのビジネスがどんなふうにワークしているかをより理解することができます。つまり、ビジネス効率を良くする主な要因は何か、悪い要因は何か、がデータで明確に理解できるのです。ビジネスの仕組みをよりよく理解することは、課題に満ちた現在と改善された未来の間にあるギャップを埋めることにつながります。このギャップに橋をかけることは、いわゆる「1ショット」のデータ分析プロジェクトではできません。PDCAに基づいた継続的なものでなくてはならないのです。
さて、少し、視点を変えて、
マーケター視点ではなくて、データサイエンティストの視点から、考察してみましょう。
3. データサイエンティストがマーケターと良い関係をつくるために「すべきこと」と「すべきではないこと」
データサイエンティストが「すべきこと」とは?
まず、いつでもクリアでシンプルであることです。データサイエンティストとして、マーケターの言葉で語ることです。数学や統計のギリシア語じゃなくて、ハッカーが好むプログラム言語でもなくて。仕事における良好なコミュニケーションのためには、データサイエンティストは、マーケターが語るビジネスの言葉で会話する必要があります。
これは口頭会話に限ったものではありません。
マーケッターのために、データドリブンな課題解決方法を組み上げるときも同じです。また、お客さまのオペレーション部門も、複雑で混乱するデータドリブンな課題解決法の正当性を簡単には信用しないでしょう。もしこれが理由でデータサイエンティストがお客さまを信用できなければ、お客さまも彼らを信用しないでしょう。こんなことが起こったなら、たとえ100%精度の予測モデルを組み上げたとしても、データサイエンティストはマーケターとの信頼関係を築くことはできません。
データを語ってはいけません。物語を語りましょう。
データサイエンティストは、ビジネスインサイトに立脚して、センスの良い、素敵な物語を語れなければなりません。仮に、もしマーケターが「まず数字、また数字、そしてさらに数字」という話ばかり聞かされるとしたら、退屈で仕方がないでしょう。しまいにはデータサイエンティストの話を聞いても時間の無駄だ、とばかりに話を聞かなくなってしまうでしょう。
データをビジネスに当てはめましょう。
お客さまとのコミュニケーションを効果的にするために、フロントに立つデータサイエンティストはお客さまと相互理解が可能なコミュニケーションをしなくてはなりません。これによって、それぞれがデータの話とビジネスの話しかせずに噛み合わない、という残念なすれ違いが改善されるでしょう。
データサイエンティストが「すべきではない」こととは?
データサイエンティストは、自分のお気に入りの予測モデルを押し付けるべきではありません。
良好な関係性を築くためには、お客さまが解き明かしたいビジネス課題を本質的に理解することが重要です。課題を正しく理解した上で初めて、データサイエンティストは最高のデータドリブン・ソリューションを組み上げることができるのです。
「最高」のソリューションは「最高精度」である必要はありません。
それよりも、「最もシンプル」であるべきです。仮に、まあまあ精度が高いと言うレベルであっても、理解しやすく、オペレーションしやすいことのほうが重要です。(逆説的に言うと「すべきこと」の1と同じです)
データサイエンティストは、「完璧なデータ」の幻影を追うべきではありません。
特に、山のようなゴミデータを持っているマーケティング業界において、全知全能の完璧なデータは存在せず、それはただの神話にすぎません。
データサイエンティストは、ビジネスと学術は同じであるという間違った信念を持ってはいけません。この二つは、完全に異なる二つの世界です。
参考までに、学術データは大抵パーフェクト(有用で、綺麗に整理されているという点において)なので、比較的簡単に「ほぼ完璧な予測モデル」を組むことができます。一方で、デジタルマーケティング業界において、少なくとも初回データは恐ろしく汚いもので、予測モデルを組むのは容易ではなく、少なくとも二回以上PDCAサイクルを回さなければなりません。まず、ありもののデータでなんとかモデルを組み、それから次のステージで良いデータが取れるようにデータ収集のフレームワークをデザインし、そしてようやく改善バージョンのデータによる予測モデルを組むことができるのです。
結論
- データサイエンティストは3つのコアスキルをすべて持っています。すなわち、プログラミング、数理統計、ビジネス知識です。もちろん、先述の”Danger Zone”の人たち、つまり数理統計知識はないけどビジネス知識のあるハッカーには気をつけてくださいね。何故なら、彼らは自分のアウトプットが何を意味するか本質的には解っていないのですから。
- マーケッターがデータサイエンティストを採用するよい理由は、ビジネス価値を増加させる課題の解決方法を、データに基づいて創り出せることです。
- データサイエンティストが常に意識すべきことを一つ挙げるなら、ビジネスセンスに裏打ちされた、納得出来る物語を語ることです。データが持っている真実と幻想に固執してはいけません。

デジタルマーケティングプロデュース事業部
アナリスト Krassimir Kostov(コストフ クラシミル)
(記事一覧)
2011年、ネットイヤーグループ株式会社に入社。
前職は銀行の顧客データ分析に従事。ネットイヤーグループではアナリストとして、 ファッションブランド・生命保険会社・中古車販売店・製薬会社などの顧客データ分析を手掛ける。
I-COMのデータサイエンスボードの会員、データサイエンスハッカソンの審査員も務め、社内でのI-COM、グローバルマーケティング業界の教育も進めている。
ネットイヤーグループ、オンラインメディア測定に関する国際団体「I-COM」が主催する国際コンペティションの審査員に弊社金澤、コストフが就任(2015年4月17日)