注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

Data Lineage に関する質問

以下は、Data Lineage に関するよくある質問です。

一般的な情報については、Data Lineage ドキュメントをご覧ください。


Data Lineage でオブジェクトタイプの元データセットと書き戻しデータセットを確認するにはどうすればよいですか?

  • まず、右パネル(虫眼鏡アイコンのタブ)で検索してオブジェクトを Data Lineage グラフに追加します。Object types を選択して検索をフィルター処理し、元データセットと書き戻しデータセットを表示したいオブジェクトの名前を入力します。

  • 次に、オブジェクトタイプの左側にある矢印を選択して、その祖先を表示します。オブジェクトタイプが読み取り専用の場合は 1 つの祖先ノードが生成され、書き戻しが有効な場合は 2 つの祖先ノードが生成されます。Node color options ドロップダウンで Resource overview が選択されていることを確認し、右上の凡例に従って書き戻しデータセットの色を確認します。元スキーマデータセットの色は、使用されるトランスフォームの種類によって異なります。

  • オブジェクトタイプの書き戻しおよび元データセットには、右上に小さな地球儀アイコンも表示されます。

トップに戻る


パイプライン内のどのデータセットに特定の列が含まれていますか?

  1. まず、パイプライン内のすべてのデータセットが Data Lineage グラフに追加されていることを確認します。
  2. 次に、キャンバスの左上隅にある Tools トグルの Select モードを使用して、目的のデータセットを選択します。
  3. 次に、右側のパネルから Histogram of selection properties を開きます。Frequent columns というセクションの下に、選択した列の名前ごとに最も頻繁に使用される列が表示されます。

これらの列の 1 つを選択すると、その列を含む選択範囲内のデータセットが強調表示されます。

トップに戻る


このパイプラインで最後にリソースを変更したのは誰ですか?

  • まず、パイプライン内の関心のあるすべてのデータセットが Data Lineage グラフに追加されていることを確認します。
  • 次に、画面の左上隅にある Tools トグルの Select モードを使用してデータセットを選択します。次に、右側のパネルから Histogram of selection properties を開きます。
  • Last Modified セクションの下に、選択したデータセットを最後に変更したユーザーが表示されます。ユーザー名を選択すると、そのユーザーが最後に変更したデータセットがグラフ内で強調表示されます。

トップに戻る


どのデータセットがオープントランザクションを持っていますか?

右上のドロップダウンメニューで Build Status を選択します。これで、現在実行中のデータセットがあるかどうかを確認できます。そのようなデータセットにはオープントランザクションがあります。

トップに戻る


パイプラインで使用されるデータセットのほとんどはどこに保存されていますか?

  • まず、パイプライン内の関心のあるすべてのデータセットが Data Lineage グラフに追加されていることを確認します。
  • 次に、画面の左上隅にある Tools トグルの Select モードを使用して、関心のあるすべてのデータセットを選択します。次に、右側のパネルから Histogram of selection properties を開きます。
  • Frequent folder paths というセクションの下に、選択したリソースの最も一般的なフォルダーパスが表示されます。

ゴールデンパスを選択すると、このパス内のリソースがグラフ上で強調表示されます。フォルダーパスにカーソルを合わせると、フルパスが表示されます。

Histogram of selection properties パネルで複数のプロパティを選択すると、選択範囲を満たすすべてのリソースがグラフ上で強調表示されます。

トップに戻る


保存されていない Data Lineage グラフを共有するにはどうすればよいですか?

保存されていない Data Lineage を共有するには、保存の近くにある右上の矢印を選択します。そこにクイック共有リンクが表示されます。

トップに戻る


データセットが最新ではないのはなぜですか?

データセットが最新ではない理由はいくつかあります。

データセットが最新ではない理由としては、以下の点が考えられます。

  • データセットのビルドが失敗していますか?
  • 上流のデータセットがビルドされておらず、最新ではありませんか?
  • ソースから最新のデータを受け取りましたか?

Data Lineage では、これらの質問に簡単に答えることができます。

  1. まず、Data Lineage で関心のあるデータセットを開き、ノードを右クリックして、パイプライン内の各リソースのステータスを確認します。

  2. 次に、Expand node... を選択します。Expand parents... の上にある左向きの二重矢印を選択すると、そのデータセットのすべての祖先ノードを表示できます。

  3. 次に、右上のドロップダウンメニューで Node color optionsBuild status オプションを選択して、パイプライン内のすべてのリソースのビルドステータスを表示します。このパイプラインのビューにより、古いデータセットの診断が容易になります。

トップに戻る