Pendoのデータ同期機能を使用すると、Pendoのデータをお使いのデータレイクやデータウェアハウス、さらにはビジネスインテリジェンス(BI)ツールにプッシュできるため、複雑なクエリや分析を実施できるようになります。Pendoのデータを他の主要なデータソースと組み合わせると、以下のことが可能になります。
- プロダクトの改善が売上と契約更新に与える影響を測定します。
- トップオブファネルの獲得からプロダクト内のアクティベーションまで、エンドツーエンドのユーザージャーニーにおける摩擦を特定します。
- データソース全体で包括的な顧客の健全性スコアを計算し、契約更新のための戦略を策定します。
- プロダクトの使用状況とセンチメントの推移に基づき、解約リスクモデルを作成します。
- アップセルとクロスセルの機会を特定し、データに基づくアカウントの成長を促進します。
前提条件
データ同期は有料の機能です。この機能を利用するには、Pendoの担当者にお問い合わせください。まずは、データのサブセットでデータ同期をお試しいただくことも可能です。詳細については、この記事のテストエクスポートを参照してください。
データ同期機能を設定するには、Pendoのサブスクリプション管理者である必要があります。
仕組み
データ同期では、まず、Google Cloud Storage、Amazon S3、Microsoft Azure Storageからクラウドストレージサービスを1つ選択し、Pendoのデータの格納先として設定します。これにより、Pendoで収集されたすべてのイベントが、Avroファイル形式で選択されたクラウドストレージに渡されます。Pendoでページまたはフィーチャーのルールが追加または更新されると、その都度Pendoから更新ファイルが自動送信されます。
続いて、クラウドストレージサービスから、Snowflake、Databricks、Google BigQuery、Amazon Redshiftなどのデータレイクやウェアハウスにデータを移すためのETLパイプラインを作成します。データ同期のETLパイプラインを設定するためのファイルスキーマとベストプラクティスについては、以下のドキュメントを参照してください。
データがデータレイクまたはウェアハウスに読み込まれたら、アナリティクスチームは、そのデータを他のデータソースと組み合わせて、そこから得られたインサイトをLooker、Tableau、Power BI、Modeなどの信頼できる情報源となるビジネスインテリジェンス(BI)ツールにプッシュできるようになります。
セットアップ
データ同期機能は、Avroファイルをクラウドストレージコンテナに送信してファイルを取得し、データレイクまたはウェアハウスにファイルを読み込ませることができます。クラウドストレージの保存先は、Pendoサブスクリプション1件につき1つのみ設定できます。データ同期では、Google Cloud Storage (GCS)、Amazon Simple Storage Service (S3)、Microsoft Azure Storageをサポートしています。設定手順については、以下の記事を参照してください。
テストエクスポート
1日分のPendoデータを含むテストエクスポートを1回実施できます。これにより、データエンジニアリングチームはデータ同期のAvroファイルでのPendoデータの表示を確認し、クラウドストレージからPendoデータを引き出すETLパイプラインを計画できます。
[設定(Settings)]>[データ同期(Data Sync)]に移動し、サポートされている3つのクラウドストレージサービスのいずれかの設定プロセスを開始します。保存先の設定後、[テストエクスポート(Test export)]を選択してエクスポートを実施できます。