一言で言うと、DMP(Data Management Platform)がどういうものなのか、DMPを構築するために考えるべきこと、など、これまで僕が知る限り最もふわっとした中身がありそうでなさそうな単語第一位だったDMPについて、体系的かつ網羅的に記載された本です。今年
はDMP構築の流れが一気に来そうな香りがしていますが、まずはこの一冊を読んでDMPについて関わる人の認識を合わせておくことが重要かもしれないな、と思いました。
個人的な興味として、ここ半年ほどコツコツとDMPを調べてきたのですが、いくつかハラオチしていないところがありました。本書を読んで自分がハラオチしてなかったところが埋まった気がしました。一部ではまだ紙の書籍をAmazonで予約購入するも手元に届いていないという声もちらほら聞こえてきてまだ読めていない方も多そうですが、空気を読まずにハラオチしたところや、いつもどおりの妄想を書いていきたいと思います。
DMPとデータ解析基盤の違い
Web系の人であれば、2009年頃からのソーシャルゲームブームによってデータ解析が収益向上に寄与するためにデータ解析に力をいれていたり、2012年頃から声高に叫ばれているリーンスタートアップによって小さく初めてユーザーに使ってもらいながらデータを蓄え・解析することでサービス改善をしていく、という流れがあったため、データ解析の重要性やその基盤を構築することの重要性などはかなり一般的な考え方となっていると思います。
そのため、Web系企業各社はデータを蓄え、解析し、サービス改善(アクション)に結びつけるということを行なっているという認識であり、今回、似たような概念(だと少なくとも僕は感じている)のDMPが登場した時は少々違和感がありました。結論から言うと、プライベートDMPと本書で定義されているものについては、いわゆるWeb系企業の言うところのデータ解析基盤との違いはほぼないな、と思いました。広告配信やマーケティングに利用するというアクションがセットのデータ解析基盤がプライベートDMPという認識で問題ないと思います。
また、後述しますが、本書において最も重要なのは「プライベートDMP」という造語(に近いもの。ググっても日本のサイトばかりがあたるので、おそらく本書を執筆するにあたり、概念を分かりやすく説明するために定義した用語であると考えています)を定義することで、データエクスチェンジ市場が成熟していない日本市場においてDMPの出口を明確に示したことが挙げられます。
「プライベートDMP」という用語
DMPには大きく分けて2つの機能が必要です。「データを蓄積・解析し、アクション(広告配信、マーケティング活動)に繋げる基盤としての役割」と、もう一つが「データを第三者に提供する機能」です。特に海外は、データを第三者提供するための窓口になることで大きな成功を収めている企業(Bluekai, eXelateなど)が目立ちます。一方、日本ではデータエクスチェンジ市場が成熟していないため、第三者データの流通がほとんど発生していません。そのため、DMPの大きな要素の一つが埋まらない状態でした。これが、
いわゆるデータ解析基盤との違いがよく分からなくなる原因の一つだと思います。そこに対して、本書では「プライベートDMP」という用語を使い、日本市場でDMPが活躍しうるポジションを明確に定義したと言えます。
プライベートDMPと(パブリック)DMP
端的に言うと扱うデータの種類と、データの活用方法に違いがあります。
- プライベートDMPは1st partyのデータを使い、場合によっては第三者提供のデータ(ほとんど入手困難、あり得るとしたらアライアンスを結んだパートナー企業とかから取得)を利用します。
- (パブリック)DMPは外部提供を念頭に入れた上で1st partyのデータを蓄積し、整理するということを行います。
プライベートDMPのデータは外に出て行かず、DMPを利用する広告主や広告業者にとって閉じたDMPという意味で「プライベート」という言葉が使われているようです。最近「プライベートDMP」という言葉を聞く機会が多く、なんぞや?と思っていたため、ここがクリアになったのが本書を読んで得た一番の学びだと思っています。
で、僕はやはりデータ解析に興味のあるエンジニアでもあるので、実際にどうやったらDMPを構築できるかを考えたくなるわけです。
DMPを構成する要素技術
本書ではDMPを構築するために7つの要素が挙げられていました。詳細部分までは踏み込まれていなかったので、特にデータマイニング的視点から妄想で文脈を埋めていきたいと思います。
- 顧客ID、Webサイト訪問クッキー、会員ID、ソーシャルメディアIDなどを統合する。
- 統合されたデータを分析し、クラスタリングを生成する。
- 生成したクラスターを連携するツールにデータをフィードないし交換する。
- 生成したクラスターに属するユーザーデータを可視化する。
- 特定ユーザーと類似または関連づけられるユーザーに対象を拡張する。
- ユーザーセグメントを最適化し、セグメントごとのメッセージを最適化する。
- ユーザーデータを広告配信に利用し、かつ広告配信の反応によってデータの精度を高める。
1. IDの統合
これは事前の設計が重要となるでしょう。仮に事前にうまく設計され得ていなくてもCookieSyncでなんとかなります。
しかし、そのために大量のタグを仕込む必要が出てきて、ユーザーが意図せず様々なサイトに対してリクエストを発行することになり、場合によってはユーザーエクスペリエンスを阻害してしまう可能性もあることを念頭に置くことが重要だと思います。
2. クラスタリング
ポイントはクラスタリングに用いる特徴量です。データのイメージとしては簡単で、あるIDに紐づく様々な情報(どのページを何回見たかとか、どんな商品をカートに入れたか、とか)を特徴量とすることでオーディエンスベクトルが作られるはずです。データの作り方で全てが決まってしまうため、センスの見せ所の一番のポイントとなるでしょう。ExcelやRなどのツールを使ってもいいし、データがでかくてコマッタナーという状態であれば、Mahoutを使えばそれっぽい情報を作れるはずです。データ量に依存はしますが、データマイニングの手法に頼らずに、頑張って人手でクラスタを作っていってもいいと思います。
3. 連携するツールにクラスタリング結果を提供
ここはツール間の連携の話ですね。連携するツールのインターフェースさえわかっていればいいので、そこに対して、必要な状態に変換した加工済みデータを渡します。
4. ユーザーデータの可視化
これも特に難しいことはありません。ツールを利用すればそんなに苦労することなく可視化はできると思います。Excelでもいいし、Rでもいいですね。ちょっとこったことをしたければd3.jsなんかでも面白いかもしれません。むしろ、何を可視化したいのか、を明
確に定めることが重要だと思います。
5. ユーザー対象を拡張する
ユーザーベースのレコメンドに近いことをすれば実現できるでしょう。あるユーザーに似たユーザーは誰か、というアプローチです。
場合によっては、事前に行なっているクラスタリング結果と合わせることで、このクラスタの人はこのクラスタの人と重複度が高い、という新しい発見が得られるかもしれません。
6. セグメントの最適化とメッセージの最適化
ここはマーケターの力の見せ所でしょう。広告やマーケティングは説明変数が膨大になるため、全てを自動化することは困難であり、自動化出来る部分を自動化することで人手で処理できるくらいまで情報をそぎ落とし、最後は人手で微調整するということが重要だと思います。同じように、メッセージなどのコミュニケーションの動線の設計は人間が最も力を発揮しなければならないところだと思います。
7. 広告への利用と反応の確認
PDCAサイクルでのDo, Check部分に相当します。いかにセンスあふれる(と感じられる)解析やアクションプランをねっても机上の空論です。実際に作ったセグメントと設計したシナリオに沿って広告配信を行うことでその効果を定量評価可能な形に落としこんでい
くことが重要でしょう。
まとめ
自分としては、技術的視点でどのようにDMPを構築するか、や、データ統合によるプライバシー問題などまで言及してほしかったな、という気持ちもありますが、これまで日本語で体系だって書かれたDMPに関する書籍はなかったため、非常に貴重な一冊だと思います。おそらく、これかも何度か読み返すことになるでしょう。
余談ですが、個人的には付録の海外DMPの動向部分が非常に面白く、その部分だけでも一読の価値がある気がします。海外のDMPプレイヤーで追いかけるべき対象がわかれば、後はググりまくれば情報が手に入る大変便利な世の中ですからね!