【初心者向け】GA4における機械学習:予測オーディエンスとは?

こんにちは。運営人上尾です。

GA4に移行するのが精一杯。GA4では機械学習が使われているのは知っているけど、機能まではよく分からないという方がまだ多いのではないでしょうか。お恥ずかしながら私も鋭意勉強中です。

最近ようやくお客様のGA4への移行の終わりました。そこで、GA4で何ができるのか、特に「予測オーディエンス」というものについて調べてみたので、それをシェアしたいと思います。

 この予測オーディエンスで、機械学習が使われています。GA4の機械学習とGoogle 広告の機械学習は何が違うのか、機械学習は本当に使えるのかなどを、ホームページを運営している一般企業の企画、運用担当者側の立場に立ってまとめてみました。

今回調べてみて、あらためてこれは GA4で最もインパクトのある機能の一つであるということがよくわかりました。

最期までお付き合いいただだけると有難いです。

GA4における機械学習

予測オーディエンスの話に入る前に、そもそもGA4では機械学習で何を「学習」し「予測」しようとているのでしょうか。

オーディエンスを機械学習で予測するというのが「予測オーディエンス」なので、まずGA4に組み込まれた機械学習についてみていきます。

GA4の機械学習が行う「予測」

機械学習とは、人間に代わり機械(コンピューター)がデータを分析する方法の1つ。コンピュータに大量のデータを入力し、データに潜むパターンや未知のルールを発見する方法のことを指します。

機械学習は、今日いろいろなところに使われています。わかりやすいのはアマゾンのオンラインショップのレコメンド機能です。Twitter上で顧客が自社について何をつぶやいているかの把握なども機械学習と言語ルールを組み合わせて判定しています。

また、ネット上における不正検知等にも使われています。

ではGA4では、機械学習で何を予測しているかと言うと 自社のホームページやアプリを訪問したユーザーの行動履歴に基づいて予測を行っています。

[参考記事] GoogleAnalytics4の機械学習とは?

では予測精度を高めるために、どんな指標を用いてデータを評価し、予測してくれるのかと言うと、 今のところこの三つの指標です。

  1. 購入の可能性     過去 28 日間に操作を行ったユーザーによって、今後 7 日間以内に特定のコンバージョン イベントが記録される可能性です。
  2. 離脱の可能性    過去 7 日以内にアプリやサイトで操作を行ったユーザーが、今後 7 日以内に操作を行わない可能性です。
  3. 予測収益  過去 28 日間に操作を行ったユーザーが今後 28 日間に達成する全購入コンバージョンによって得られる総収益の予測です。

かなり端折って言うと、

  • 自社サイトでこれから購入しそうなユーザー
  • 逆に自社サイトを離れてゆきそうなユーザー
  • 今後1ヵ月にもたらされる収益

を予測します、ということです。

これらは、特に EC サイトにとっては経営に直結する大事な指標です。

逆に EC サイトを使っていない会社の場合には、離脱の可能性という指標が一番使いやすいと思います。

詳細は[GA4] 予測指標を御覧ください。

そもそも、評価指標とかモデルとかって何だ?とい方にはこちらが判り易いです。

[参考記事] モデル最適化指標・評価指標の選び方

オーディエンスとは何か

GA4で言うオーディエンスとは、同じ属性を持つユーザーグループのことです。類似の行動履歴やユーザーの属性などによって、このオーディエンスを定義します。

こう書くと、UA(旧GoogleAnalytics)のセグメントと何が違うのか。ということになりますが、それは次項で書きます。

サイトまたはアプリにアクセスしたユーザーの行動や記述的なデータがオーディエンスの条件に一致すると、そのユーザーはオーディエンスに追加されます。

Google 広告と連携することによって オーディエンスを共有することができます

[GA4] Google アナリティクスのオーディエンスの概要

予測オーディエンスとは何か

こういったオーディエンスの数が多くなると、ある来訪者がサイトを訪れた時に、「サイトにとっての価値を生み出す可能性が高いユーザー」 かどうかを判断し予測することができるようになります。

この利益をもたらすであろう可能性の高いユーザーをだけを予測し、 リスト化する機能が予測オーディエンスです。

詳細は[GA4] 予測オーディエンスを御覧ください。

  • 7 日以内に離脱する可能性が高い既存顧客
  • 7 日以内に離脱する可能性が高いユーザー
  • 7 日以内に購入する可能性が高い既存顧客
  • 7 日以内に初回の購入を行う可能性が高いユーザー
  • 28 日以内に利用額上位になると予測されるユーザー

たとえば「7 日以内に購入する可能性が高い既存顧客」オーディエンスに含まれるのは、デフォルトで「購入の可能性」が 80パーセンタイルを上回っているユーザーです。

この「パーセンタイル」とは、ユーザーを小さいほうから数えて任意の%に位置する値を指します。仮にユーザー 1,000 人に基づくモデル化データであれば、90パーセンタイルとは、購入の可能性が最も高いユーザー 100 人(上位 10%のユーザー)に相当します。つまり、90パーセンタイルを上回ることが条件なら、上位 99 人のユーザーがオーディエンスに登録されることになります。

Google公式ヘルプより引用

このパーセンタイルは、配信したいオーディエンスのボリュームに合わせてスライダーで設定が可能です。 

セグメントとオーディエンスの違い

では、GA4にあるオーディエンスとセグメントとの違いは何でしょうか?

大雑把に言って、セグメントというのは、GA4の探索でしか使えない機能です。

探索で利用できるデータの期間は過去最大14ヵ月ですから、セグメントも過去データに遡って適用されます。探索した結果、有益だとおもったら、オーディエンスをセグメントから作ることはできます。そして、セグメントは基本的に過去のデータなので、広告と共有することができません。

これに対し、オーディエンスというのは、一定条件に合致したユーザーをグループ化してゆく機能で、過去に遡って適用されません。むしろオーディエンスを設定した時点からユーザーデータを集めることをはじめます。そしてグーグル広告側で、一定条件を満たしたユーザに広告を出す、ということができます。

もう1つ大きな違いは、セグメントは過去の分析用のためのものなので、いつでも条件等を編集することができますが、オーディエンスは名前や説明は変更できても、ユーザをグループ化する条件は変更できません。

[参考記事] GA4 オーディエンス

つまり、この予測オーディエンスという機能によって、 これまで専門人材がいなければ実際は不可能だった機械学習というものを、GoogleAnalytics4では、機械学習という新たなノウハウを組み込みました。自社のホームページやアプリを訪問したユーザーの行動履歴に基づいて、ユーザーの行動を予測するという機械学習を使えるようになったというわけです。

無料でここまでできるというのは実に凄いことです。

予測オーディエンスを使うための条件

では誰でも無料で使えるようになったとはいえ、本当に予測オーディエンスを我々は使うことができるのでしょうか。ここでは予測オーディエンスを使うための条件というものが見て行きます。

結論から言えばやはり一定のアクセスを集めているホームページもしくはアプリでないとこの予測オーディエンスを活用する生かすことは難しいです。また機械学習やデータサイエンティストなどを専門の人材が入らなくなったとはいえ、やはりある程度使いこなすための知識は必要になります。

予測オーディエンスを使うための前提条件

前章で書きましたか、これは自社を訪れたホームページもしくはアプリの行動履歴に基づいた機械学習です。機械学習はそもそも安定した学習データがないと正しく機能しません。

予測モデルを正常にトレーニングするための条件は以下のとおりです。

  • 購入ユーザーおよび離脱ユーザーのポジティブ サンプルとネガティブ サンプルの最小数。関連する予測条件をトリガーしたユーザーが過去 28 日の間の 7 日間で 1,000 人以上、トリガーしていないリピーターが 1,000 人以上必要です。
  • モデルの品質が一定期間維持されていることが要件になります。
  • 購入の可能性と予測収益の各指標の両方を対象とするには、プロパティは purchase(収集が推奨されるイベント)と in_app_purchase(自動的に収集されるイベント)の少なくともどちらか一方を送信する必要があります。purchase イベントを収集する場合、そのイベントの value と currency パラメータも収集する必要があります。”

詳細は、GA4の公式ヘルプ[GA4] 予測指標にあります。

要するに、予測条件を満たしたユーザと満たさないユーザが、過去28日間の間の7日間で1000人以上いないと、モデルをトレーニングできません、ということです。

1週間に千人ですから、通常のホームページを運用する方にとっては、かなり高いハードルです。

こんな条件はなんとか無視してトライしてみたいと思うかもしれませんが、残念ながら機械学習のデータとして安定的に使えるという状態になるまでは、予測オーディエンスを使うためのボタンは押せない仕様になっています。

逆にある程度の規模がある EC サイトを自社でお持ちの場合、この機能を使いこなすことによって、アイデア次第で、販促キャンペーンの効果を高める施策を打つことができるようになります。

予測オーディエンスを作るための権限

これはマーケター以上の権限が必要です。 権限がない人には予測オーディエンスを作るためのボタンが表示されません。前章で述べた条件さえ整えば費用は発生しません。

詳細はGA4の公式ヘルプ「アクセス権とデータ制限の管理」にあります。

予測オーディエンスの設定方法

詳細はこちらのサイトをご覧ください。公式ヘルプよりも図があってイメージしやすいです

[参考記事] GA4の便利機能「オーディエンス」とは?設定や活用方法についてご紹介

[参考記事] GA4の予測オーディエンスの設定

基本の流れはまず、オーディエンスを作る、そしてしばらく経って、条件が整って予測機能が利用できるようになったら、「予測可能」タブから設定を追加するだけです。

予測オーディエンスの使い方

上記のように基本的には全て設定のレベルで済みます。

Python でプログラミングを使う必要はなくなったので、ある程度機械学習というものに対しての理解があれば、使いこなすことができそうです。

では仮にすべての前提条件が整って予測オーディエンスを使えるようになったとすると何ができるのでしょうか。

最もインパクトの大きい使い道はやはり Google 広告との連携オーディエンスの共有です。

Google 広告との共有

この予測オーディエンスで作られたオーディエンスを Google 広告と共有して、広告配信対象にすることができます。 

Google 広告には、特定のオーディエンスに絞って広告を配信する機能があります。このオーディエンスの対象として GA4で集めた予測オーディエンスを指定することができるようになりました。

広告の配信対象の精度を格段に高めることができます。 

これは GA 4になって Google 広告と広告配信のタグを共通化したことによるものです。

このオーディエンスの共有にはGA4とGoogle 広告をあらかじめ連携しておく必要があります

Google 広告でもオーディエンスという同じ言葉が使われています。しかし同じ言葉でも Google 広告のオーディエンスとGA4のオーディエンスとは意味内容が異なります。

Google 広告のオーディエンスはGoogle がユーザーに対してパーミッションを取り、 個人情報を除いたユーザーの行動履歴を取得した膨大なデータから抽出したグループです。かたや GA4で言うオーディエンスとは自社のホームページを訪れたユーザーの振る舞い履歴をベースにして機械学習でモデルで作ったグループです。グループを抽出する基になるユーザが大きく異なっています。

規模が大きいEC サイトの場合は、アイデア次第でターゲットを絞ったプッシュ型のマーケティングが可能になります。具体的には7日以内に購入する可能性が高いユーザーの上位何パーセントかに限って、広告を出したり、キャンペーンをうったりすることができるようになります。

もうちょっとで購入に至りそうなユーザーだと予測されるユーザー限定で広告を配信するということもできるようになります。 

EC サイト以外での一般のサイトの場合、予測機能で使えそうなものは、7日以内に離脱する可能性が高いユーザーという指標です。

具体的には、離脱する可能性が高いユーザーに対して、再訪を促すような広告を配信したり、何某かのキャンペーンに誘導するような広告を出したりできます。

このように、予測オーディエンスを使うことができれば、広告の配信精度を高めることができますし、広告の成果を上げやすくなると思います。

まとめ

いかがでしたでしょうか。個人的には、今回調べてみて、機械学習の導入というのは GA 4の中で最も特徴的な機能だと思いました。

同時に予測オーディエンスを使うまでには、一般の会社にとっては、まだ超えるべきハードルが相当あるということもよくわかりました。

今後予測オーディエンスの対象や手法等はもっと精緻なものが開発されてゆくと思いますが、機械学習の精度を高めるためにある程度のユーザー数がないと使えないというところは変わらないと思います。しかし、必要とされるユーザ数の閾値も今後変わる可能性があります。

今後 Web マーケティングもしくはデジタルマーケティング施策で何を重点的にやっていくかということにもつながりますが、自社の固有のリストつまりオーディエンスを蓄積するためには、やはり自社サイトへのアクセス数を増やすことが必要です。

そして自社サイトの流入を増やすために、大切になるのが、コンテンツの拡大であり、どんなコンテンツを作ってゆくかという作戦は、ますます重要になってくると思います。