Warning

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

2 - Data Lineage でデータをプレビューする

learn.palantir.com ↗でも以下の内容をご覧いただけますが、アクセシビリティの観点から、ここに掲載しています。

📖 タスクの概要

Data Lineage アプリケーションを使用すると、データパイプライン全体を視覚化して見ることができます。このタスクでは、passengers_clean テーブルがどのように派生したかを見て、「先祖」を探索します。各行(Arrow)は、クリーニングステップ、複数のテーブルからの情報を単一の包括的なデータセットに結合するステップ、またはテーブルに新しい派生列を追加するステップなど、データ変換を表します。

🔨 タスクの説明

  1. データパイプライン全体を見るためにズームアウトします。最も左側に紫色のノード source/passengers_json_raw とその左に黄色のノード raw/passengers_json_raw が表示されます。これらは Foundry に取り込まれたまだ表形式のデータでない raw json を表します。

  2. グラフ上の passengers_preprocessed というタイトルのノードをクリックします。これは、それらの raw json データセットに対する変換から派生した表形式のデータです。わずか数回のクリックでその内容を探索することができます。

  3. グラフの下部にある Preview タブをクリックします。Preview タブは、選択したデータセットのスナップショットを表形式で表示し、テーブルの最初の300行をプレビューします。Preview は、データが期待通りに見えるかどうかをスポットチェックするのに便利です。

注:このデータセットの名前データは仮想的なものです。