Data Lineage アプリケーションを使用すると、データパイプライン全体を視覚化して見ることができます。このタスクでは、passengers_clean テーブルがどのように派生したかを見て、「先祖」を探索します。各行(Arrow)は、クリーニングステップ、複数のテーブルからの情報を単一の包括的なデータセットに結合するステップ、またはテーブルに新しい派生列を追加するステップなど、データ変換を表します。
🔨 タスクの説明
データパイプライン全体を見るためにズームアウトします。最も左側に紫色のノード source/passengers_json_raw とその左に黄色のノード raw/passengers_json_raw が表示されます。これらは Foundry に取り込まれたまだ表形式のデータでない raw json を表します。
グラフ上の passengers_preprocessed というタイトルのノードをクリックします。これは、それらの raw json データセットに対する変換から派生した表形式のデータです。わずか数回のクリックでその内容を探索することができます。