分析Code WorkspacesJupyterLab®

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

JupyterLab®

Code Workspaces は、Foundry 内で JupyterLab® を使用することを可能にします。Code Workspaces 内の JupyterLab® は以下をサポートします:

  • 表形式のデータセットの読み書き。
  • 非構造化データセットからのファイルのダウンロードまたはアップロード。
  • Conda または PyPI からの Python パッケージのインポート。
  • 反復を促進するための Dash、Streamlit、または TensorBoard™ アプリケーションのプレビュー。
  • Dash または Streamlit アプリケーションの公開。

Code Workspaces は現在、Python ダッシュボード用に DashStreamlit をサポートしています。ユーザーは、Foundry の バージョン管理ブランチング、および データガバナンス 機能が組み込まれた Code Workspaces で直接ダッシュボードを作成することができます。

Code Workspace のダッシュボードはブランチングをサポートしています。新しい Workspace ブランチを 作成する と、新しいダッシュボードを公開するか、変更を同期すると、そのブランチにダッシュボードの新しいバージョンが公開されます。これにより、ダッシュボードをユーザーに公開する前にプレビューを確認することができます。マスターブランチに公開するには、ブランチをマスターにマージするだけです。

JupyterLab® と TensorBoard™

Dash ダッシュボード

現在、読み取り専用のダッシュボードのみがサポートされています。

Dash アプリケーションを作成するには、以下の手順に従ってください:

  1. Dash アプリケーションのコードを含む Python ファイル(.py.ipynb ではない)を作成します。
  2. ターミナルウィンドウを開き、ファイルを実行します(例:python app.py)。
  3. JupyterLab® ワークスペースの Dashboards タブを開き、Dash セクションの Preview をクリックして、ローカルで開発しているアプリケーションをプレビューします。
  4. アプリケーションに満足したら、Publish dashboard を選択し、新しいアプリケーションの場所を Files and Projects で選択し、モジュール名と変数名を提供します。

Dash アプリケーションのモジュール名は、リポジトリのルートからのドット区切りのパスとして入力する必要があります(例えば、app、またはモジュールがフォルダー内にある場合は folder.app)。変数名は、通常 server と呼ばれる、モジュールファイル内の Dash app サーバー用に宣言された Python 変数です。

  1. オプション: 高度な設定を構成します。デフォルトでは、アプリケーションの設定は Jupyter® ワークスペースの設定と一致します。
  2. Publish and sync を選択して、新しい Dash アプリケーションを登録し、コードをバックエンドのコードリポジトリに同期します。CI チェックと公開が完了したら、ダッシュボードパネルのリンクを選択して公開されたアプリケーションを表示できます。

Streamlit ダッシュボード

現在、読み取り専用のダッシュボードのみがサポートされています。

Streamlit アプリケーションを作成するには、以下の手順に従ってください:

  1. Streamlit アプリケーションのコードを含む Python ファイルを作成します。
  2. ターミナルウィンドウを開き、Streamlit を使用してコードを実行します。streamlit run app-name.py
  3. JupyterLab® コードワークスペースの Dashboards タブを開き、Streamlit セクションの Preview を選択して、ローカルで開発しているアプリケーションをプレビューします。
  4. 満足したら、Publish dashboard を選択し、新しいアプリケーションの場所を Files and Projects で選択し、リポジトリのルートに対する Python ファイルの名前を入力します(例:app.py)。
  5. オプション: 高度な設定を構成します。デフォルトでは、アプリケーションの設定は JupyterLab® ワークスペースの設定と一致します。
  6. Publish and sync を選択して、新しい Streamlit アプリケーションを登録し、コードをバックエンドのコードリポジトリに同期します。CI チェックと公開が完了したら、ダッシュボードパネルのリンクを選択して公開されたアプリケーションを表示できます。

TensorBoard™

Code Workspaces から直接 TensorBoard™ をプレビューすることができます。これを行うには、tensorboard --logdir=<$PATH_TO_LOGS_DIRECTORY> をターミナルから実行し、TensorFlow ログが含まれるディレクトリへのパスを入力します。次に、Jupyter® Workspace のダッシュボードタブを開き、TensorBoard™ セクションの Preview を選択します。

JupyterLab® と TensorBoard™

Jupyter® ノートブックの変換

この機能はデフォルトでは有効になっていません。有効にするには、Palantir の担当者に問い合わせてください。

Code Workspaces は、Jupyter® ノートブックをデータ変換パイプラインとして公開し、ノートブックによって生成された出力データセット用の変換 JobSpecs を登録することができます。

出力データセットの変換を登録するための手順は以下の通りです:

  1. ワークスペース内のファイルとして Jupyter® ノートブックを保存します。

  2. Data パネル内のデータセットの隣にある青色の Build アイコンを選択します。

データセット名の右側にある青いビルドボタン。
  1. インターフェースに従って変換を構成します。Code Workspaces は、出力データセットを生成するために追加された入力と共に使用された Jupyter® ノートブックを推定します。推定が間違っている場合は、入力と出力を手動で編集できます。
スクリプトファイル、入力、出力を変更し、CPU とメモリを調整するための Edit Transform パネル。
  1. Sync and run を選択して変換設定を保存し、変換と出力データセットの JobSpecs を公開するための CI チェックを開始します。

CI チェックが完了すると、変換はビルドの準備が整います。Foundry の他の データ統合 ツールを使用して変換を管理し、それが属する データパイプライン を管理できます。

変換は自動的に Code Workspace の環境を使用しません。スクリプトファイルの先頭に実行時に必要なすべてのパッケージをインストールする必要があります。パッケージをインストールするためのコードスニペットは Packages パネルで見つけることができます。 例えば、変換で scikit-learnscikit-image を使用するには、このコードスニペットをファイルの先頭に追加します:

# scikit-learnとscikit-imageをインストールします
!mamba install -y -q scikit-learn scikit-image

Jupyter®、JupyterLab®、および Jupyter® ロゴは、NumFOCUS の商標または登録商標です。

TensorBoard および関連するマークは、Google Inc. の商標です。

すべてのサードパーティの商標(ロゴやアイコンを含む)は、それぞれの所有者の財産のままであり、提携または推奨が示されるものではありません。