2. Developing Your Ontology2 - データセットの準備
Warning

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

2 - データセットの準備

learn.palantir.com でも以下の内容をご覧いただけますが、アクセシビリティの観点から、ここに掲載しています。

オントロジーは世界の分類であり、このトラックの架空の世界の要素の一つはフライトアラートです。これらのアラートは、プラットフォームの他の場所でのロジックを使用してトリガーされ、"データ"に変換されると仮定します。

オントロジー開発プロジェクトに取り組む前に、以下のことを知っておくべきです:

  • ユーザーのオブジェクトタイプとリンク、および必要なデータアーキテクチャで達成を目指すワークフロー。
  • オブジェクトタイプは単一のデータセットによって支えられ、データセットは一つのオブジェクトタイプしか支えられません。
  • クリーニングとフォーマットは、オントロジーではなく、データ変換の上流で行うべきです。

オブジェクトタイプを作成する最初のステップは、適切なデータセットを見つけるか、開発することです。このレッスンでは、他の Foundry ユーザーの出力に影響を与えずに快適に作業できるように、既存のデータセットのコピーを作成するだけです。実際のプロジェクトでは、必要なデータセットが存在しない場合、より複雑なパイプラインを開発し、データエンジニアや Foundry に接続された様々なソースシステムの管理者と協力する可能性があります。

🔨 ユーザーのオブジェクトタイプのための新しいデータソースを作成する

  1. すでにチュートリアルで使用するための個人的なサンドボックスフォルダーを作成している場合は、そのフォルダーに移動します。まだ作成していない場合は、Palantir Foundry の紹介チュートリアルの「サンドボックスフォルダーの作成」ページの手順に従って作成してください。
  2. ユーザーの個人的なサンドボックスフォルダーで、Training Pipeline Simulator (ユーザーの名前 日付) フォルダーを開き、新規 ボタンを選択し、ドロップダウンメニューから パイプライン オプションを選択して新しいパイプラインを作成します。
  3. パイプラインの位置、バッチ対ストリーミングの選好、および他のパイプライン作成オプションについて尋ねられた場合は、デフォルト値を使用します(何も変更しないでください)。
  4. Foundry データセットを追加するオプションがあるウェルカム画面が表示されるはずです。このオプションを選択し、/Foundry Training and Resources/Example Data/Aviation Ontology/flight_alerts/ データセットを見つけます。そのデータセットの隣の + を選択し、ウィンドウの右下隅近くのボタンを使用してデータセットを追加します。これにより、ウィンドウが閉じられ、Pipeline Builder UI の中央部に flight_alerts データセットが表示されます。
  5. 右側のサイドバーで "パイプライン出力を追加" を選択し、"データセット" オプションの横にある "追加" ボタンを選択します。右側のサイドバーには、flight_alerts データセットに基づいて自動的に生成された行の名前が表示されるはずです。
  6. 出力データセットを flight_alerts_{ユーザーの名前}_{日付} にリネームします。リネームするには、右側のサイドバーの上部にあるフィールド(行と他のすべてのボタンの上、元の名前が 新規データセット {日付} と表示されている場所)を使用します。
  7. ソースデータセットから新しく作成した出力データセットにデータをコピーするには、Pipeline Builder UI の上部にある緑色の矢印(画面の解像度により、下部が "保存" と表示されているかどうか)ボタンをクリックして保存し、その隣にある青色のハンマー "デプロイ" ボタンをクリックします。そのボタンをクリックするとポップアップが開きますので、緑色の "パイプラインをデプロイ" ボタンをクリックしてデプロイを確認します。
  8. 新しいデータセットが準備できるまでに数分かかる場合があります - デプロイボタンの右側にある更新ホイールアイコンをクリックすることで、データセットの進行状況を監視できます。詳細を表示するためにクリックすることも、デプロイが成功したことを意味する緑色のチェックマークになるのを待つこともできます。

これで、オントロジーオブジェクトタイプを支えるための独自のデータセットが準備できました。