「ビックデータ」という言葉が出てきてだいぶ経ちますが、今回はビッグデータについて。ビックデータとは決まった定義がないので大きなデータという解釈で間違いないみたいです。一般的には1ペタ以上のデータを取り扱うみたいですが、ペタとかテラになると私にとって敷居が高いので、マーケティングに関連付けたいと思います。ビックデータというとアメリカのスーパーでの話が有名です。
なぜか紙おむつの売上とビールの売上に関連性があると大量のデータの中に相関が見つかりました。紙おむつが売れている時はビールが売れている。ならば紙おむつの横にビールを置いてみると、結果はビールが二ケタ以上伸びたらしいです。理由は後付なのでいくらでも考えられるのですが。一般的に紙おむつとビールという関連性のないデータを今までは一緒に分析することはなかったのですが大きなデータが取り扱えるようになり膨大なデータの分析ができるようになったということです。
では、ここから本題なのですが、今までのデータとビックデータの違いは何でしょうか?
今までのデータは意識のあるデータ、ビックデータは意識が働いていない、いわゆる無意識のデータといえます。今までのデータのもとはアンケートです。アンケートはどのような収集の仕方でも人間である以上そこに意識が働きます。少しでもよく見せようと。しかしビックデータは大きなデータを取り扱えるので、例えばスイカやパスモのような膨大な個人データの収集が可能です。誰が何時にどこの駅のどこの改札から乗って、何時にどこの改札から出て、帰宅時は何時にどこの改札から乗ったのか。そしてスイカで買い物をしたものは。これらが、すべて記録されます。このデータが新宿駅の1日だけでも360万人分です。ほとんどがごみのようなデータかもしれませんが、見栄や外聞のない本来の消費者の行動が分析できるかもしれません。使い方によっては宝の山になるということです。そして、携帯の位置情報と組み合わせれば、莫大なデータ量になりますが、分析の仕方によっては、マーケティング手法が大きく変わってくるかも知れません。