DMPはどのようにCookieデータを収集しているか(オンラインデータ編)

CookieSyncとDMP

前回、CookieSyncの技術について簡単に解説しました。CookieSyncを使えば2つの異なるシステム(ドメイン)で発行されるCookie情報を交換することができます。 DMPはこの技術を駆使してCookie情報を収集し、オンラインのデータを次々に紐付けていきます。 今回も前回のブログ記事の続きのこちらこちらの記事の内容を用いて、DMPがどのようにオンラインのデータを収集しているかを見て行きましょう。

DMPが保有しているデータ

http://www.adopsinsider.com/wp-content/uploads/2011/07/data-management-platform-integration1.jpg

出典:Data Management Part II: Centralize and Synchronize Your User Data

こちらの図が非常に分かりやすいので引用します。図からDMPが2種類のデータを所有していることが分かります。

  1. DMPのCookieIDをkeyにして、他のシステムのCookieIDを管理するマスターテーブル
  2. 他のシステムから送られてくる、そのシステムにおけるCookieIDをkeyにした行動ログや属性情報など

1.Cookieの管理テーブル

CookieSyncを行なって、DMPと他システム間のCookieSyncを繰り返すことで、DMPにはDMPCookieID:OtherSystem1CookieID, DMPCookieID:OtherSystem2CookieIDというデータが集まってきます。なので、後はこれを同一DMPCookieIDでまとめてしまえば、DMPCookieIDをkeyにしたCookieのマスターテーブルのようなものが作れてしまいます。

2.他システムにおけるデータ

Cookieの管理テーブルが用意できていれば、後は別途CookieIDをkeyにしたデータを送ることによって、DMPはDMPのCookieIDでユーザー(ブラウザ)を特定した状態でデータを管理することができます。

3.DMPからのデータの引き方

※この項目は当該ブログ記事に明記されていなかったので推測になります。

DMPと連携しているシステムからは、CookieSync済みのDMPCookieIDをkeyとして問い合わせることで、DMPで収集している様々なデータを取得可能になります。 これによって自システム以外のオンライン上の広大な空間でのユーザー(ブラウザ)の行動情報を取得可能になります。

では実際にどのようにデータを収集しているか

http://www.adopsinsider.com/wp-content/uploads/2011/07/data-management-platform-redirect-process.jpg

出典:Data Management Part III: Syncing Online Data to a Data Management Platform

こちらの図が大変わかり易いので引用して説明します。以下の箇条書きの数字は図の番号と対応しています。

  1. ユーザーがサイトを訪れ、ページのHTMLをリクエストする
  2. コンテンツサーバーはユーザーにページを返す。そのページには、DMPのコンテナタグ含まれている
  3. ページの残りがローディングされている間に、コンテナタグはブラウザに強制的にDMPを呼び出させる
  4. 呼び出されたDMPは管理しているタグを返す。このタイミングでDMPのCookieがユーザーにセットされる。(タグを返すと書いたがイメージで、実際はCookieSyncの技術と同じく1x1pixel画像を利用したリダイレクト)
  5. ユーザーはDMPから返された情報にしたがって、各種システムにリダイレクトさせられる。このタイミングでユーザーには各システムのCookieがセットされる
  6. 各システムのCookieのセットと同時にDMPへのコールバックも行う。そのコールバックには、URLに各システムにおけるCookieID(ブログ記事本文ではUniqueIDと書いているがCookieIDのことでしょう)が付与された状態で行われる。IDは暗号化されているのが望ましい。
  7. DMPはその情報を受け取り、DMPのCookieIDと照合した上で保存する。
  8. CookieIDの交換が完了さえしていれば、後は非同期にCookieIDとそれに紐付くデータをDMPが取得すれば、データベースの構築が完了する

このあと、DMPは独自にデータの分析を行います。どのようなデータを収集しているかと合わせて、この分析がDMP同士の差別化ポイントだったりするのでしょう。それはともかく、このような流れで溜め込まれたデータを、必要に応じてDataExchangeに流通させたり、DSPやアドサーバーに提供していきます。ここがDMPのマネタイズポイントですね。

DMPがタグマネジメント機能を提供することで、様々なシステムとCookieSyncを実現しているのが理解できます。先にシステム間のCookieIDの交換が完了していると、実際のデータは後から任意のタイミングでDMPに投入すれば良さそうです。できるだけユーザー体験を阻害しないような配慮ですね。

Cookie交換のところのセキュリティに関しては、IDの暗号化をエクスキューズにしているようです。この当たりはまた突っ込んで考えていきたいと思います。

まとめ

私は実際のDMPのシステムに触れたことはないので、情報の参照元にしたブログ記事の正確性がどの程度現実に即しているのかは不明ですが、技術的には実現可能そうなので、大きく外れてはいなさそうですね。

DMPについて理解が深まってくると、とにかくユーザーの情報が欲しいマーケッターやターゲティングに活用したい広告業者にとってはぜひ欲しいシステムなんだろうなと納得できます。かつて、Googleを始めとする一部のプラットフォーマー以外が、ここまでの規模でユーザーの情報を取得できたことはないはずなので、やはり様々な業界で大きなパラダイムシフトをもたらしそうな期待感は高まります。一方で、技術者としてはセキュリティ大丈夫なのかなーと思ったりしますし、ユーザーとしてはどこまでどんな情報収集してるのよ、という不安感が出てきたりします。色々とセンシティブな領域ではありますが、技術的にもビジネス的にもチャレンジングかつ面白い分野なので、ビジネスサイドによる需要ドリブンでの盛り上がりだけでなく、多くの人を巻き込んで良い感じに進んで行ってほしいものです。

さて、タイトルから類推できそうですが、次はオフライン編について触れようかと思います。どんどん危険な匂いが増していきますね!

おまけ

CookieSyncやDMPに関しては、今現在、日本語での技術的な情報源が少ないですが、以下のものが非常に良い感じで参考になります。あわせて読むと理解が深まるはずです。

ScaleOutさんの情報発信力はさすがですね。