8. [Builder] オントロジーデータパイプライン29 - 元データセットへの加算変更:パート 1

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

29 - 元データセットへの加算変更:パート 1

📖 タスクの概要

この演習では、元データセットとオントロジーの設定に関する2つの主要なシナリオに対応する方法を練習します。

  1. 元データセットへの加算変更。
  2. 元データセットへの破壊的な変更。

ユーザーの乗客オブジェクトタイプのタイトルキーは、単純に乗客の姓です。元データセットに full_name という新しい行を作成し、これをタイトルキーと交換しましょう。そうすることで、元データセットが新しい行を受け取ったときにオントロジーの同期プロセスで何が起こるかを確認します。

🔨 タスクの説明

  1. ユーザーの ontology_flight_alerts_logic パイプライン作成物を開きます。

    • ⚠️ 通常、このような変更を行うときは Main からブランチを作成したいと思うでしょうが、便宜上、ユーザーは Main に直接変更を加えます。
  2. passengers_clean文字列の結合 トランスフォームを追加し、空白で区切った first_namelast_name を組み合わせ、新しい行を full_name と呼びます。

    • ノード間にトランスフォームを追加するには、ノード間の + 記号をクリックするか(下の画像を参照)、後で各ノード接続の端にある白と灰色の円を使ってノードの入力と出力を変更します。
  3. トランスフォームノードの名前を考えます(例:"Concat Names")。

  4. 変更を適用し、プレビューします。

  5. パイプライングラフに戻り、ユーザーのトランスフォームノードの色を変更し、passengers の出力が下の画像に示すように入力スキーマを使用するように変更します。

  6. パイプラインをデプロイします。

  7. データセットのビルドが完了したら、出力 passengers データセットを開き、下の画像に示すように 詳細 タブの Syncs セクションに進みます。ここでは、データセットとオブジェクトストレージサービス(別名 "Phonograph")間の同期がスキーマの変更にもかかわらず成功したことがわかります。

ここにいる間に、また Health タブにアクセスし、以前設定した Schema Check がパスしたことを確認することもできます。チェックを COLUMN_ADDITIONS_ALLOWED_STRICT に設定したため、新しい行が追加されました。