注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

コアコンセプト

ワークブック

Code Workbook で操作する主なリソースは Workbook です。Workbook は、Foundry からデータセットをインポートし、以下の目的でこれらの入力データセットをトランスフォームするために使用されます。

  • 他のユーザー向けにキュレーションされたデータセットを作成するために、外部ソースからインポートされた生データをクリーニングおよび結合する。
  • 処理されたデータソースを分析して、有用なインサイトを導き出す。
  • モデルをトレーニングおよび適用して予測分析を行う。
  • レポートに表示するためのパラメーター化された可視化を作成する。

ワークブックの詳細はこちら。

トランスフォーム

Transforms は、1 個以上の入力を受け取り、単一の出力を返すロジックの断片です。入力および出力は、Foundry のデータセットやモデルである場合があります。

トランスフォームの詳細はこちら。

テンプレート

コード templates は、コードをシンプルなフォームベースのインターフェースの背後に抽象化することで、さまざまな技術経験を持つユーザーが共同作業できるようにします。ユーザーが選択した値がコードテンプレートに代入され、その後、Workbook 内の他のトランスフォームと同様に実行することができます。

テンプレートの詳細はこちら。

環境

各 Code Workbook は environment に関連付けられています。環境には、Workbook の計算をサポートする Spark モジュールにインストールされた一連の Conda パッケージと Spark 設定が含まれています。

環境の詳細はこちら。

ブランチ

Code Workbook における Branching は、データトランスフォーメーションに特化したバージョン管理の体験を提供し、チームが Workbook 内でロジックとデータを同時に操作できるようにします。

ブランチの詳細はこちら。