注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

コアコンセプト

ワークブック

Code Workbook で主に操作するリソースはワークブックです。ワークブックは、Foundry からデータセットをインポートし、これらの入力データセットを以下の目的で変換するために使用されます。

  • 外部ソースからインポートした生データをクリーニングし、他のユーザー向けのキュレーションされたデータセットを作成するために結合します。
  • 加工済みのデータソースを分析して、有用な洞察を導き出します。
  • 予測分析を行うためにモデルをトレーニングし、適用します。
  • レポートに表示するためのパラメータ化された可視化を作成します。

ワークブックについて詳しく学ぶ。

トランスフォーム

トランスフォームは、1つ以上の入力を受け取り、1つの出力を返すロジックの断片です。入力と出力は、Foundryのデータセットやモデルになることができます。

トランスフォームについて詳しく学ぶ。

テンプレート

コードテンプレートは、技術的な経験のあるユーザーと協力して作業するために、コードをシンプルなフォームベースのインターフェースの後ろに抽象化することを可能にします。ユーザーが選択した値はコードテンプレートに置換され、その後ワークブックの他のトランスフォームと同様に実行することができます。

テンプレートについて詳しく学ぶ。

環境

各 Code Workbook は環境に関連付けられています。環境には、ワークブック内の計算をバックアップする Spark モジュールにインストールされた Conda パッケージと Spark 設定のセットが含まれています。

環境について詳しく学ぶ。

ブランチング

Code Workbook のブランチングは、ワークブック内でロジックとデータを同時に操作できるように、データ変換に特化したバージョン管理の経験を提供します。

ブランチングについて詳しく学ぶ。