ここで解説する内容はいつの時点から実装が反映されるのかがはっきりつかめていないため、まだ見えないよという方は、今後の情報としてご覧ください。
「pseudonymous」は、日本語の「仮名」です。
「pseudonymous」は、本名を隠すために使用される名前、またはその性質を指します。
日本語では「仮名」が最も一般的な訳語です。また、「偽名」や「変名」も用いられます。
具体的には、GA4データのBigQueryエクスポートにおいては、ユーザーのIDに基づいて生成された仮名IDを意味します。
GA4のプロパティをBigQueryと正常に接続し、24時間以上経過したら、「analytics_<property_id>」という名前のデータセットにインポートされたGA4のデータを確認できるはずです。
このデータセットには、以下の4つのデータテーブルが含まれており、GA4のデータが格納されています。
events_(<日数>)
events_intraday_<現在の日付>
pseudonymous_users_(<日数>)
users_(<日数>)
「events_」および「events_intraday_」のデータテーブルは、BigQueryでのイベントベースとユーザーベースのGA4エクスポートデータを含んでいます。
ちなみに、events_intraday_<現在の日付>は、当日のデータをストリーミングでエクスポートしている場合のみ、BigQueryに表示されます。
一方、「pseudonymous_users_」および「users_」のデータテーブルには、BigQueryでのユーザーベースのGA4エクスポートデータのみが含まれています。
「pseudonymous_users_」および「users_」のデータテーブルを使用する利点は、より多くのユーザーデータにアクセスできることです。これらのテーブルには、'events_' および 'events_intraday_' のデータテーブルには含まれていない、オーディエンスや予測データが含まれています。
「pseudonymous_users_」データテーブルには、ユーザーIDでないすべての擬似識別子のデータが含まれています。ユーザーのデータが更新されるたびに、このテーブルも更新されます。
例えば、
pseudonymous_users_(1)は、前日のユーザーIDでないすべての擬似識別子のデータがこのデータテーブルに含まれています。
pseudonymous_users_(2)は、前二日間のユーザーIDでないすべての擬似識別子のデータがこのデータテーブルに含まれています。
そして、pseudonymous_users_(5)は、過去5日間のユーザーIDでないすべての擬似識別子のデータがこのデータテーブルに含まれています。
擬似識別子は、Google Analyticsがユーザーをデバイスやセッション全体で追跡し、彼らの行動の完全なイメージを作成するために、各ユーザーに作成・割り当てられる一意の識別子です。
ユーザーID – ユーザーごとに独自の識別子を作成し、Google Analyticsに送信することができます。ログインIDをユーザーIDとして使用することができます。
Google Signals – Google Signalsは、ユーザーがデバイス間でGoogleアカウントにサインインしており、広告のパーソナライズをオンにしている場合、デバイスやプラットフォーム間でユーザーを追跡する機能です。
デバイスID – これはGA4が使用するデフォルトの方法で、ユーザーが使用しているデバイスに基づいてユーザーを追跡します。ユーザーIDやGoogle Signalsを使用していない場合、デバイスIDが使用されます。
「pseudonymous_users_」のデータテーブル名は「pseudonymous_users_YYYYMMDD」となっており、ここで「YYYYMMDD」はテーブルがBigQueryにインポートされた日付を指します。
たとえば、2023年8月19日にインポートされたデータテーブルの名前は「pseudonymous_users_20230819」となります。
GA4の「users_」データテーブルとは何ですか? 「users_」データテーブルには、ユーザーIDであるすべての擬似識別子のデータが含まれています。フィールドのいずれかに変更があると、ユーザーのデータが更新されます。
GA4でユーザーIDの追跡を使用していない場合、BigQueryプロジェクトで「users_」データテーブルは利用できません。
「User data」の「daily」エクスポートタイプが有効になっていない場合、GA4のプロパティをBigQueryプロジェクトにリンクすると、「users_」データテーブルは利用できません。
「pseudonymous_users_」データテーブルとは異なり、ユーザーIDが含まれている場合、同意していないユーザーのデータも「users_」テーブルにエクスポートすることができます。