2. ユーザーのオントロジーの開発2 - データセットの準備

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

2 - データセットの準備

オントロジーは世界のカテゴライゼーションであり、このトラックでの概念的な世界の要素の一つはフライトアラートです。これらのアラートは、プラットフォーム内の他の場所で使用されるロジックによりトリガーされ、"データ"に変換されると想定します。

このようなオントロジー開発プロジェクトに取り組む前に、以下の点を理解しておく必要があります:

  • ユーザーのオブジェクトタイプとリンク、および必要なデータアーキテクチャを使用して達成することを目指すワークフロー。
  • オブジェクトタイプは単一のデータセットにバックアップされ、データセットは1つのオブジェクトタイプしかバックアップできません。
  • クリーニングとフォーマットは、オントロジーではなくデータ変換の上流で行う必要があります。

オブジェクトタイプを作成する最初のステップは、適切なデータセットを見つけるか開発することです。このレッスンでは、他の Foundry ユーザーの出力に影響を与えずに快適に作業するために、既存のデータセットのコピーを作成するだけです。実際のプロジェクトでは、所望のデータセットが存在しない場合、通常はより複雑なパイプラインを開発し、データエンジニアや Foundry に接続されたさまざまなソースシステムの管理者と協力してパイプラインを開発します。

🔨 オブジェクトタイプの新しいデータソースを作成する

  1. チュートリアルの使用中にパーソナルサンドボックスフォルダーをすでに作成した場合は、そのフォルダーに移動します。まだ作成していない場合は、Palantir Foundry の紹介チュートリアルのサンドボックスフォルダーの作成ページの手順に従って今すぐ作成してください。
  2. ユーザーのパーソナルサンドボックスフォルダーで、Training Pipeline Simulator (ユーザー名 日付) フォルダーを開き、新規 ボタンを選択し、ドロップダウンメニューから Pipeline オプションを選択して新しいパイプラインを作成します。
  3. パイプラインの場所、バッチ対ストリーミングの選好、および他のパイプライン作成オプションについて尋ねられた場合は、デフォルト値を使用します(何も変更しない)。
  4. Foundry データセットを追加するオプションがある歓迎画面が表示されるはずです。このオプションを選択し、次に /Foundry Training and Resources/Example Data/Aviation Ontology/flight_alerts/ データセットを見つけます。そのデータセットの隣にある + を選択し、ウィンドウの右下隅の近くにあるボタンを使用してデータセットを追加します。これにより、ウィンドウが閉じられ、Pipeline Builder UI の中央エリアに flight_alerts データセットが表示されます。
  5. 右側のサイドバーで "パイプライン出力を追加" を選択し、次に "Dataset" オプションの横にある "追加" ボタンを選択します。右側のサイドバーには、flight_alerts データセットに基づいて自動的に生成された行名が表示されるはずです。
  6. 右側のサイドバーの上部(行とすべての他のボタンの上、元の名前が 新しいデータセット {日付} と表示されている場所)のフィールドを使用して、出力データセットの名前を flight_alerts_{ユーザー名}_{日付} に変更します。
  7. ソースデータセットから新しく作成した出力データセットにデータをコピーするには、Pipeline Builder UI の上部にある緑の矢印(画面解像度によっては、下部に "保存" と表示されるかもしれません)ボタンをクリックして保存し、その近くにある青いハンマー "デプロイ" ボタンをクリックします。そのボタンがポップアップを開くと、緑の "パイプラインをデプロイ" ボタンをクリックしてデプロイを確認します。
  8. 新しいデータセットが準備できるまでに数分かかる場合があります - デプロイボタンの右にある更新ホイールアイコンをクリックしてデータセットの進行状況を監視することができます。詳細を表示するためにそれをクリックすることも、デプロイが成功したことを意味する緑のチェックマークになるのを待つこともできます。

これで、オントロジーオブジェクトタイプをバックアップする準備ができたユニークなデータセットができました。