見出し画像

デー太くんと学ぶ #03「パネルデータの種類とデータ収集」

前回、販売/購買データ分析システムの全体の流れについて学んだデータくん。
システムの全体が見えてきたことで、今度はひとつひとつのステップについて学びたくなったようで…。


はじめに

デー太くん:みなさん、お久しぶりです!
日々の業務にも少しずつ慣れてきたデー太です。
このシリーズも早くも第3回となりました!
みなさん楽しく読んでいただけていますでしょうか?

前回は"販売/購買データ分析システム"の全体的な流れについて見ていき、私もだんだんとシステムのことが分かってきました。

そこで今度は、集める整える分析する見せるの4ステップそれぞれについてフォーカスしていきたいと思います!

羽留先輩:おっ、またやってるね~。

デー太くん:羽留先輩!

羽留先輩:今日は何を紹介していくのかな?

デー太くん:前回出てきた4つのステップそれぞれについてフォーカスしていこうと思ってます。

羽留先輩:なるほど。
そうなるとまずは"集める"のところからかな?

デー太くん:そうですね!

羽留先輩:それじゃあ今日はデータ収集について見ていこうか。

デー太くん:お願いします!

パネルデータの種類

羽留先輩:ところでデー太くん、データ収集について見ていく前に、販売/購買データ分析システムでは大きく分けて2種類のパネルデータを扱っているというのは覚えているかな?

デー太くん:その名の通り、"販売データ""購買データ"ですよね?

羽留先輩:その通り!
じゃあ、それらのデータについてはどのくらい分かるかな?

デー太くん:う~ん、そう聞かれるといまいち理解できてない気がします。

羽留先輩:たしかに似たようなところもあるからね。
じゃあ、まずはパネルデータの種類について復習していこうか!

羽留先輩:話を始める前に、デー太くんにクイズです!
「先月あるお店である商品が売れたか?」ということを知りたいときは、どちらのデータを使えば分かるかな?

デー太くん:お店でいつ何が売れたかが分かればいいと思うので、販売データだと思います!

羽留先輩:ふむふむ。
その回答があっているか、考えながら話を聞いてみてね!

さっきデー太くんが言ってくれた通り、販売/購買データ分析システムでは"販売データ""購買データ"を扱っているね。
これらは、片方だけでもいろいろなことが分かるけど、組み合わせることでより多くのことが分かるようになるんだ。
ちなみに、前回のシステム全体の流れの図には、"SRI+"(小売店販売データ)と"SCI"(消費者購買データ)という名前でも載っていたよ。

じゃあ、まずは販売データから。
これはお店(小売店)が持っているデータで、ものが売れたときのデータだね。
日本各地の協力店舗6,000店舗以上から毎日データが送られてきていて、「どこで」「いつ」「何が」売れたか、といったことが分かるよ。

続いて購買データ
これはお客さん(消費者)が持っているデータで、ものを買ったときのデータだね。
日本各地のモニターさん(協力者)50,000人以上からデータが送られてきていて、「誰が」「いつ」「どこで」「何を」買ったか、といったことが分かるよ。

さて、さっきのクイズの答えはどうかな?

デー太くん:購買データでも「いつどこで買ったか」が分かるということは、販売データだけじゃなくどちらのデータからでも分かるというのが正解ですか?

羽留先輩:その通り!

デー太くん:「どちらの」と聞いておいて「どちらも」が答えというのは少しズルいですよ~。

羽留先輩:ごめんごめん。
でも、この「同じ事柄についてお店側とお客さん側の両方から見ることができる」というのが重要で、これによって分かることが大きく増えるんだよ。
たとえば、あるお店である商品がたくさん売れているとき、誰がその商品を買っているのかという情報を組み合わせることで、なぜ売れているのかが分かったりするんだ!

デー太くん:たしかに、いろんな角度から分析できた方が新たな発見がありそうですね!

羽留先輩:そうなんだよ。
そしてこの、販売データと購買データの両方を保有しているというのが、インテージグループの強みのひとつでもあるんだ!

データ収集

販売データの収集

羽留先輩:パネルデータの種類について復習したところで、いよいよ本題のデータ収集について見ていこうか。
前回も言ったように、販売データと購買データではデータ収集システムが異なっているから、まずは販売データの収集から見ていこう!
そして、販売データ収集のポイントは「量」!

デー太くん:量ですか?

羽留先輩:そう、量!
ということで、ここでクイズ第2問!
販売データと購買データでは、どちらの方が1日当たりに送られてくるデータ件数が多いでしょう?

デー太くん:う~ん、どっちだろう。
協力店舗は6,000店舗で、モニターさんは50,000人ですよね。
モニターさんの方が10倍くらい多いですけど、販売データ収集のポイントが量ということは販売データの方が多いんですかね?

羽留先輩:たとえば、あるお店に1日当たり10人のお客さんが来たら、10件の販売データができるよね。

デー太くん:たしかにそうですね。
お店にお買い物に来るお客さんはもっと多そうなので、そう考えると販売データの方が圧倒的に多そうです!

羽留先輩:正解!
販売データは、なんと1日当たり約900万件も送られてきているんだ!

デー太くん:そんなにですか、すごいですね!

羽留先輩:そうでしょ~。
そしてそれを支えているのが、徹底したデータチェック体制なんだ!

デー太くん:チェック体制ですか?
量とチェック…いまいちピンと来ないです…。

羽留先輩:確かにピンと来ないかもしれないね。
販売データのようにたくさんのデータが送られてくるとなると、その分、間違ったデータが送られてきたり、そもそもデータが送られて来なかったりといったトラブルも多くなってしまうんだ。
そこで、販売データ収集システムでは365日毎日1時間おきにデータチェックを行うことで、トラブル発生時に素早く対応できる体制を整えているんだ!

デー太くん:それはすごいですね!
それだけちゃんとしたチェックがあれば安心してデータを使うことができますね。

羽留先輩:そうだね、データは信頼性が最も重要なので、その担保にはかなり力を入れているよ!

購買データの収集

羽留先輩:それじゃあ次は、購買データの収集について見てみよう!
購買データ収集のポイントは「簡単さ」!
購買データは、販売データと違って元になるデータがモニターさんが持っているレシートだから、販売データのような自動化ができない分、いかにモニターさんの負担を減らすかというところが大事なんだ。

デー太くん:たしかに、買った物の記録を付けていくのってめんどくさくなっちゃいそうですもんね。
僕も前に家計簿を付けようと思ったことがあったんですが、結局三日坊主になっちゃったんですよね…。

羽留先輩:そうなんだよ~。
だけど、そんなデー太くんでも大丈夫!
なんと、スマートフォンのアプリでレシートと商品バーコードの写真を撮るだけでいいんだ!
それに、モニターさんがいつデータを送ってくれるかは分からないから、365日24時間いつでもデータを受け取れるようにもしているんだよ。

デー太くん:それだけでいいんですか?
とても簡単ですね。
それなら僕でもできそうです!

羽留先輩:三日坊主なデー太くんでもできるなら安心だね!
この簡単さは、レシート画像から必要な情報を自動識別する画像解析技術や、商品や店舗の情報を管理しているマスターとの照合による商品や店舗の自動特定など、さまざまな技術を駆使することで実現されてるんだ!
モニターさんの負担を少しでも減らすために、簡単で使いやすいシステムへと日々改良が続けられているんだよ!
マスターについては、こちらのシリーズでより詳しく紹介されてるから、ぜひあわせて読んでみてね。

デー太くん:僕らががんばった分、モニターさんの負担を減らせているんですね!

羽留先輩:そうだね。
それと最後に、販売データと購買データの両方に共通するポイントが「安定性」!

デー太くん:安定性!

羽留先輩:データ収集はパネルデータの大元を作るためのステップで、滞るとその後の処理に影響が出たり、パネルデータの内容が間違ったものになってしまう可能性もあるから、安定性が求められるところでもあるんだ!
だからこそ、日々のメンテナンスなども念入りに行われているんだよ。

デー太くん:データ収集は、パネルデータにとってとても重要なステップなんですね。
それに、画像解析情報の自動特定など、"集める"だけでもさまざまな技術が使われていたのにも驚きました。
今日もとても勉強になりました、ありがとうございました!

今日の"ここがすごい‼"

・インテージグループの保有する販売データと購買データは、組み合わせることでさまざまな角度から分析が可能になる!
・販売データは1日当たり約900万件も収集しており、万全のチェック体制によりデータの信頼性を担保している!
画像解析や情報の自動特定などの技術により、レシートと商品バーコードを撮影するだけで購買データを記録できる!

デー太くんと学ぶシリーズはこちら!

この記事が参加している募集