注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

比較: Code Repositories vs. Code Workspaces vs. Code Workbook

Foundry には、コードベースのデータトランスフォームを作成するための 3 つの製品があります: Code Workbook、Code Workspaces、および Code Repositories。これらの製品にはいくつかの機能の重複がありますが、それぞれが異なるワークフローとユーザータイプに合わせて設計されています。以下のガイドは、どのツールがユーザーのニーズに最適かを判断するのに役立ちます。

Code Repositories は、堅牢なプロダクションパイプラインを作成し、ガバナンスと精査の追加層が必要なワークフローをサポートするために推奨されます。Code Repositories を使用すると、データエンジニアは効率的なパイプラインを一括で作成できます。Code Repositories に適したワークフローの例には次のものがあります:

  • 増分計算を必要とする高データスケールでの毎日のパイプライン。
  • 厳格なガバナンス要件を持つ高可視性のパイプラインで、過去のコードのバージョンに戻ることができるか、ユニットテストが合格したコード変更をゲートする必要がある場合。

Code Workspaces は、JupyterLab® および RStudio® Workbench を使用して、Foundry プラットフォームのデータセキュリティ、ブランチング、ビルドスケジューリング、リソース管理などの利点と組み合わせて、迅速かつ効率的な探索的分析を行うために推奨されます。Code Workspaces に適したワークフローの例には次のものがあります:

  • セルごとのデータ分析を実行し、その内容を共有可能なレポートにエクスポートする
  • データトランスフォームパイプラインまたは機械学習モデルのプロトタイプ作成

Code Workbook は、Code Workspaces では適さない高スケールデータに対してコードベースの分析を行うために推奨されます。これらの分析は一度限りの使用であるか、定期的に更新される製作物を生成する可能性があります。Code Workbook はパイプラインのプロトタイピングにも使用でき、その後 リポジトリに昇格 することができます。Code Workbook に適したワークフローの例には次のものがあります:

  • 異なる p 値をテストして臨床試験の結果を調査する。
  • 他の人と共有するためのインタラクティブなビジュアライゼーションを作成する。

比較概要

Code RepositoriesCode WorkspacesCode Workbook
機能高度なパイプライン探索的分析高度な分析
柔軟なパフォーマンス最適化とコード生成を備えた、長期間持続するデータパイプラインでの複雑なワークフローを可能にします。Foundry のプリミティブと結びついた使い慣れた IDE を使用して、インタラクティブな探索的ワークフローを可能にします。一般的な分析言語とビジュアライゼーションライブラリをサポートするデータ分析ワークフローを可能にします。
サポートされる言語Python, SQL, Java, MesaPython, RPython, R, SQL
サポートされる環境すべての環境Kubernetes 環境のみすべての環境
バッチパイプラインのサポートはいはいはい
増分計算はいいいえいいえ
トランスフォーム生成はいいいえいいえ
複数出力トランスフォームはいはいいいえ
ファイルシステムアクセスはいはいはい
ビジュアライゼーションサポートいいえはいはい
イテレーションサイクルコードロジックのイテレーションデータ探索と分析のイテレーション洞察生成のイテレーション
コードロジックのイテレーションを支援するように設計されています。実行時デバッガとプレビューはトランスフォームロジックの検証に役立ちます。データはビルド後に Foundry で分析できます。広く知られているツールを使用してデータ探索と分析を迅速にイテレーションするために設計されています。データから洞察を生成するのに役立つように設計されています。すべてのトランスフォームは入力データ全体で実行され、インタラクティブコンソールはアドホッククエリを可能にし、Spark 実行モデルは迅速なイテレーションのために最適化されています。
フルデータプレビュー入力サンプルを事前にフィルター処理する機能付きデータサンプルのプレビューフルデータプレビューフルデータプレビュー
デバッガはいいいえいいえ
コンソールサポートデバッグモードではいはい
Spark モジュール管理ジョブレベルで Spark モジュールが開始されます迅速なフィードバックループのための Spark レス環境インタラクティブ性のために Spark モジュールが保温され、ワークブックレベルで開始されます
運用データパイプライン管理データ探索管理データ分析管理
Foundry データ管理ライブラリとカスタム Python ライブラリをサポートしますpip、CRAN、Conda ライブラリを含む、Code Repositories から公開されたライブラリを消費できる完全に調整可能な環境Code Repositories から公開されたカスタムライブラリを消費でき、ユーザーはコードテンプレートとしてロジックの一部を保存でき、他のユーザーによるポイントアンドクリック分析が可能になります。
データ期待値はいいいえいいえ
カスタムライブラリの公開はいいいえいいえ
カスタムライブラリの消費はいはいはい (一部の環境で)
ポイントアンドクリックコードテンプレートいいえいいえはい
変更管理ガバナンス柔軟性迅速な変更
重要なパイプラインが安全かつ堅牢であり続けるよう、変更のトレーサビリティとガバナンスを優先します。高度なレビューおよび承認ワークフローと完全な変更履歴。フルブランチサポートと自動 Git バージョン管理による迅速かつ柔軟なイテレーションを優先します。軽量なブランチワークフローによる迅速なイテレーションと共同作業を優先します。CI チェックやユニットテストは不要です。
フル Git ワークフローはいはいいいえ
マージ後のデータコピーいいえいいえはい
セキュリティマーキングの管理と削除はいいいえいいえ
影響分析ビューはいいいえいいえ
高度なコードレビュー ワークフローはいいいえいいえ
ユニットテストはいいいえいいえ
テーブルの概要
Code Repositories の機能
  • Code Repositories は高度なパイプラインを特徴としており、柔軟なパフォーマンス最適化とコード生成を備えた長期間持続するデータパイプラインでの複雑なワークフローを可能にします。
  • Code Repositories でサポートされる言語には、Python、SQL、Java、Mesa があります。
  • Code Repositories は、増分計算トランスフォーム生成複数出力トランスフォーム、およびファイルシステムアクセス をサポートしています。
  • Code Repositories はビジュアライゼーションをサポートしていません。
Code Workspaces の機能
  • Code Workspaces は、Foundry 内の JupyterLab® および RStudio® Workbench の埋め込みサポートを特徴とする迅速かつ効率的な探索的ワークフローを提供します。
  • Code Workspaces でサポートされる言語には、Python と R があります。
  • Code Workspaces はファイルシステムアクセス をサポートし、ノートブックベースの分析に対して完全な柔軟性を提供します。
  • Code Workspaces は分散型 Spark をサポートしておらず、そのため、ワークスペースの計算制限 内に収まるデータに適しています。
Code Workbook の機能
  • Code Workbook は、一般的な分析言語とビジュアライゼーションライブラリをサポートする高度な分析ワークフローを特徴としています。
  • Code Workbook でサポートされる言語には、Python、R、SQL があります。
  • Code Workbook はファイルシステムアクセスビジュアライゼーション をサポートしています。
  • Code Workbook は増分計算、トランスフォーム生成、または複数出力トランスフォームをサポートしていません。
Code Repositories のイテレーションサイクル
  • Code Repositories はコードロジックのイテレーションを支援するように設計されています。データはビルド後に Foundry で分析できます。
  • Code Repositories は、入力サンプルを事前にフィルター処理する機能付きのデータサンプルプレビューをサポートしています。
  • Code Repositories は実行時のデバッグ をサポートしています。
  • Code Repositories では、Spark モジュールはジョブレベルで開始されます。
Code Workspaces のイテレーションサイクル
  • Code Workspaces はデータの探索と分析を支援するように設計されています。結果は共有され、ダッシュボードに公開され、再利用可能なトランスフォームに変換されるか、Code Repositories や Pipeline Builder などのプロダクション準備が整ったパイプラインツールにエクスポートされます。
  • Code Workspaces は JupyterLab® および RStudio® Workbench IDEs の完全な柔軟性を提供し、完全なコードとデータプレビューを含みます。
  • Code Workspaces は、コード実行に対する即時フィードバックを提供するセルごとのイテレーションを提供します。
  • Code Workspaces では Spark モジュールは必要なく、環境のアドホック調整のための完全にカスタマイズ可能なカーネルが利用可能です。
Code Workbook のイテレーションサイクル
  • Code Workbook はデータから洞察を生成するのに役立つように設計されています。すべてのトランスフォームは入力データ全体で実行され、Spark 実行モデルは迅速なイテレーションのために最適化されています。
  • Code Workbook はフルデータプレビューをサポートしています。
  • Code Workbook は、トランスフォームのアドホック分析のためのコンソールサポート を提供します。
  • Code Workbook では、Spark モジュールは即時のインタラクティビティのために保温され、ワークブックレベルで開始されます。
Code Repositories の運用
  • Code Repositories は Foundry データ管理ライブラリとカスタム Python ライブラリをサポートします。
  • Code Repositories は、データ期待値、カスタムライブラリの公開、およびカスタムライブラリの消費をサポートします。
  • Code Repositories はポイントアンドクリックコードテンプレートをサポートしていません。
Code Workspaces の運用
  • Code Workspaces は、Code Repositories から公開されたライブラリを含む pip、CRAN、Conda ライブラリを消費でき、環境は迅速に変更できます。
  • Code Workspaces はデータ期待値やカスタムライブラリの公開をサポートしていません。
  • Code Workspaces はポイントアンドクリックコードテンプレートをサポートしていません。
Code Workbook の運用
  • Code Workbook は、Code Repositories から公開されたカスタムライブラリを消費でき、ユーザーはコードテンプレートとしてロジックの一部を保存でき、他のユーザーによるポイントアンドクリック分析が可能になります。
  • Code Workbook はデータ期待値やカスタムライブラリの公開をサポートしていません。
  • Code Workbook は、一部の Spark 環境でカスタムライブラリを消費 します。
  • Code Workbook はポイントアンドクリックテンプレート をサポートしています。
Code Repositories の変更管理
  • Code Repositories は、重要なパイプラインが安全かつ堅牢であり続けるよう、変更のトレーサビリティとガバナンスを優先します。
  • Code Repositories は完全な変更履歴を提供します。
  • Code Repositories は、フル Git ワークフロー、セキュリティマーキングの管理と削除影響分析ビュー、高度なコードレビューワークフロー、およびユニットテストを提供します。
  • Code Repositories はマージ後のデータコピーをサポートしていません。
Code Workspaces の変更管理
  • Code Workspaces は、フルブランチサポートと自動 Git バージョン管理による迅速かつ柔軟なイテレーションを優先します。
  • Code Workspaces は Code Repositories に完全にバックアップされており、フル Git ワークフローの恩恵を受けます。
  • Code Workspaces はマージ後のデータコピーをサポートしていません。
  • Code Workspaces はノートブックの内容の安全なチェックポイントを 30 日間保存し、任意の状態を安全に保持および取得する機会を提供するとともに、Git リポジトリにコードのバックアップを永続的に保存する機会も提供します。
Code Workbook の変更管理
  • Code Workbook は、軽量なブランチワークフローによる迅速なイテレーションと共同作業を優先します。Code Workbook では CI チェックやユニットテストは不要です。
  • Code Workbook はマージ後のデータコピーをサポートします。
  • Code Workbook はフル Git ワークフロー、セキュリティマーキングの管理や削除、影響分析ビュー、高度なコードレビューワークフロー、またはユニットテストを提供しません。

JupyterLab® は NumFOCUS の登録商標です。 RStudio® は Posit™ の商標です。