Service 仕事の合間に! 3分間データマイニング入門第1回 データマイニングって、そもそもなに?

  • Home
  • Services
  • 仕事の合間に! 3分間データマイニング入門第1回 データマイニングって、そもそもなに?

ビッグデータがブームとなっている昨今、データマイニングがともに語られることが多くなっています。第1回は、データマイニングの有名な事例と、データマイニングがそもそも何なのかをお話しましょう。

データマイニングで見つけた、ビールとおむつを一緒に買う理由

ビール+おむつ why?

みなさんは、「ビールとおむつ」という事例をご存知でしょうか。1992年12月23日、米紙『ウォールストリートジャーナル』に掲載された、「Supercomputer Manage Holiday Stock」という記事がすべての始まりと言われています。


米国の大手スーパーマーケット・チェーンで販売データを分析した結果、顧客はビールとおむつを一緒に買う傾向があることがわかった。調査の結果、子供のいる家庭では母親はかさばる紙おむつを買うよう父親に頼み、店に来た父親はついでに缶ビールを購入していた。そこでこの2つを並べて陳列したところ、売り上げが上昇した。

有名な事例なのでご存知の方も多いと思いますが、データマイニングの重要性を伝えるには、とてもわかりやすい例だと思います。その後、大手スーパーマーケット・チェーンが、ウォルマートになったり、セブン-イレブンになったり、テスコになったり(テスコは米国でなく英国のスーパーです)と、さまざまなパターンが登場。実際はOsco Drugという店なのですが、前後関係が忘れ去られ、もはやデータマイニング界の都市伝説のようになっています。

データを分析することで、さまざまな事実が見えてくる。だからこそ、データを分析することが重要。そうしたことを教えてくれる、最もわかりやすい事例が「ビールとおむつ」なのです。

データマイニングとは、情報を発掘すること

とはいえ、「ビールとおむつ」だけではデータマイニングって何だかわからないですよね。データマイニングという言葉を耳にするだけで、身構えてしまう方もいるかもしれません。

データマイニングを英語表記するとdata mining。それぞれの単語を英和辞書で引くと、下のように訳されています。

data 【名詞】〔分析や意思決定に用いる〕データ、事実情報、基礎資料
mining 【名詞】1) 採鉱、鉱業、採掘、鉱山業 2) 地雷の敷設 3)〔データの〕検索

つまり、データマイニングは「データや事実情報の検索・採掘」という意味になります。大量にある情報や事実を積み上げ、その中から価値ある情報を見つけ出す、掘り出すことがデータマイニングなのです。

仮説から発見する"データマイニング"と、仮説を検証する"分析"

情報を発掘すること、それがデータマイニングだと、理解いただけたかと思います。ここでいう情報とは、"仮説"であり、"事実"であり、"関連性"であったりします。ならば、データマイニングと分析、なにが違うの?そう思われる方も多いでしょう。

分析は、data mining ではなく、analysisと英訳します。分析の作業では、大量の情報の中から、事実を発掘することはしません。分析とは、分析者がある仮説を立て、その仮説が正しいか間違っているか"検証する"ことを意味します。

そのため、データマイニングは「仮説発見型」、分析は「仮説検証型」とも呼ばれています。データマイニングと分析は、似て非なるものとして、統計学では明確に分けられています。

次回は、データマイニングの具体的な活用例をご紹介します。

スペシャリスト

カスタマーエクスペリエンス事業部 デジタルテクノロジーグループ
シニアディレクター
神田卓哉

神田卓哉

弊社スペシャリストが登壇するセミナーはこちら

ネットイヤーグループについて

ネットイヤーグループは、徹底したユーザー目線とデジタルテクノロジーを駆使し、デジタルマーケティングに関するコンサルティング、デジタルコンテンツの企画制作、システム開発、マーケティングツールの企画販売などを通じ、企業経営の進化とエンドユーザーとのエンゲージメント強化のご支援をしています。

SERVICE LINE UP

お問い合わせはこちら