8. [Builder] オントロジーデータパイプライン11 - オントロジーデータ変換

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

11 - オントロジーデータ変換

📖 タスクの概要

新しいパイプライン作成物には、3つの入力データセットを使って3つの出力を生成し、それらをオントロジーオブジェクトとリンクタイプに対応させる準備をします。

  1. flight_alerts_clean:これは私たちのフライトアラートオブジェクトタイプをバックアップしますが、まずは予想されるワークフローで必要とされない カテゴリー 行を削除したいと考えています(オントロジーストレージサービスに同期するデータ量を減らすことで、計算負荷も軽減されます)。
  2. passengers_clean:このデータセットは現時点では更新が必要ないと判断したため、Pipeline Builder を使ってそのまま出力に渡します。
  3. passenger_flight_alert_clean:乗客とフライトアラートの間には多対多の関係があります。リレーショナルデータベースの多対多の結合と同じように、オントロジーの多対多リンクタイプをバックアップするためには結合テーブルが必要です。したがって、このデータセットも準備する必要があります。これは既に私たちのパイプラインの一部であり(そしてこれ以上の準備は必要ないと仮定します)。

🔨 タスクの説明

  1. 上記の3つのデータセットをインポートします。
  2. passengers_cleanpassenger_flight_alert_clean の出力データセットを作成し、それぞれ passengerspassenger_flight_alerts と命名します。
  3. flight_alerts_clean に対して、 カテゴリー 行を削除する変換を追加します。
  4. そのフライトアラート変換から flight_alerts という出力データセットを作成します。
  5. パイプラインをデプロイします。