注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。
現在、Code Workspaces でオブジェクトを直接使用することはできません。ユーザーはワークスペース内の Data メニューを使用して、オブジェクトを利用したデータセットをインポートできます。
はい、Code Workspaces で PySpark を使用できますが、Code Workspaces は現在シングルノードで動作するため、分散型の Spark インフラストラクチャを利用しません。Spark インフラストラクチャを活用したい場合は、Foundry アプリケーションである Pipeline Builder および Code Repositories をお勧めします。
JupyterLab® ノートブックに PySpark をインストールするには、Packages タブに移動し、openjdk
(Conda から) と pyspark
(PyPI から) を検索してインストールします。
Code Workspaces は現在、JupyterLab® および RStudio® Workbench をサポートしています。
セキュリティ上の理由から、以下の Python パッケージはサポートされていません:
上記のパッケージについて懸念がある場合は、Palantir 担当者にお問い合わせください。
はい、Settings メニューでネットワークポリシーを定義した後、Code Workspaces で API コールを行うことができます。外部 API は Control Panel で承認されたネットワークエグレスポリシーとして登録されている必要があります。
Code Repositories アプリケーションは、関連する Code Workspaces から IPython フォーマットでコードを受け取り、セルごとに JSON フォーマットでレンダリングします。
はい。詳細は パッケージのインポート に関するドキュメントをご覧ください。パッケージが組織の Conda/PyPI/CRAN チャンネルにホストされている場合、Foundry がチャンネルをプロキシし、ユーザーのプロジェクトで利用できるようにすることが可能です。詳細については、Palantir 担当者にお問い合わせください。
Code Workspace にライブラリをインポートするには、ワークスペースの左パネルにある Packages タブを使用 します。
はい、Code Workspaces から来たコードであれば、Code Repositories で直接編集できます。コミットした後、Code Workspace で Sync または Reset changes 機能を使用してリモートの変更をワークスペースに取り込むことができます。
概念的には、Code Repositories は Code Workspaces のバージョン管理マネージャーとして、プルリクエスト、競合解決、および管理を処理し、一方でコードの開発は Code Workspaces で行うことができます。
セキュリティのため、ユーザーは JupyterLab® または RStudio® で作業する際に隔離されています。つまり、同じ Code Workspace にアクセスする各ユーザーは自分自身の環境を持つことになります。共同作業は git ワークフローを通じて行われます。最新のコードを同僚に利用可能にするには、Sync Changes を選択して変更を同期し、同僚が Sync または Reset changes を選択すると変更が利用可能になります。複数のユーザーが同じワークスペースで作業する場合、それぞれ独立したブランチで作業することをお勧めします。
デフォルトで .gitignore
を使用していくつかのファイルを無視し、データが git リポジトリに同期されないようにし、リポジトリのサイズを制限します。また、JupyterLab® の .ipynb
ファイルからすべての出力を削除します。
はい。デフォルトでは、Code Workspaces は TinyTex-1 ↗ で定義されている一般的な R Markdown ファイルをレンダリングするための要件のみを事前インストールしますが、他の LaTeX パッケージを自分でインストールすることができます。
.tds.zip
ファイルをダウンロードできます。my_latex_packages
に設定したと仮定します。.Rprofile
に貼り付けて、正しい場所にファイルを抽出するように更新します。以下のスニペットで my_latex_packages
をユーザーのデータセットエイリアスに置き換える必要があります。# foundry パッケージを読み込み
library(foundry)
# "my_latex_packages" データセットのファイルリストを取得
my_latex_packages_files <- datasets.list_files("my_latex_packages")
# "my_latex_packages" データセットのファイルをローカルにダウンロード
my_latex_packages_local_files <- datasets.download_files("my_latex_packages", my_latex_packages_files)
# TEXMFLOCAL のパスを取得
texmflocal <- system("kpsewhich --var-value TEXMFLOCAL", intern = TRUE)
# ダウンロードしたファイルを TEXMFLOCAL ディレクトリに解凍
sapply(my_latex_packages_local_files, function(tds_file) { unzip(tds_file, exdir = texmflocal) })
headers-include:
- \usepackage{my_package} % LaTeXのパッケージをインクルードするためのコマンド
はい。
my_fonts
と名付けたと仮定します。my_fonts
をユーザーのデータセットエイリアスに置き換える必要があります。Copied!1 2
# 以下のコードスニペットを実行 foundry::download_dataset("my_fonts", "path/to/local/directory")
# 'my_fonts' データセットからファイル名のリストを取得
my_fonts_files <- datasets.list_files("my_fonts")
# 'my_fonts' データセットのファイルをローカルにダウンロード
my_fonts_local_files <- datasets.download_files("my_fonts", my_fonts_files)
# 'fonts' ディレクトリを作成
dir.create("fonts")
# ダウンロードしたファイルを 'fonts' ディレクトリにコピー
file.copy(unlist(my_fonts_local_files), "fonts")
/home/user/repo/fonts
ディレクトリ内のフォントをリファレンスできるようになり、R Markdown の推奨に従って HTML または PDF 出力で使用できます。HTML のフォントを変更するには、カスタム CSS ↗ で font-family
を設定します。
PDF のフォントを変更するには、前文に カスタム LaTeX コード ↗ を使用して \newfontfamily
でフォントをロードします。
セル内のコードが実行されている間、Code Workspaces が Jupyter® ノートブックを一時停止するのを防ぐために %%keep_alive
セルマジックを利用できます。
Copied!1 2 3
%%keep_alive long_running_process()
Copied!1 2
# %%keep_alive マジックコマンドは、Jupyterノートブックで長時間実行するプロセスを中断せずに実行し続けるためのものです。 # long_running_process() は長時間実行されるプロセスの関数です。この関数が途中でタイムアウトしないように、マジックコマンドを使用しています。
これはセルコードが実行中の間、最長24時間セルをアクティブに保ちます。ブラウザータブが閉じられたり、長時間アイドル状態になったりすると、JupyterLab®はセルの出力を表示および保存することを停止します。後でセルの出力を表示したい場合は、出力を変数に保存するために %%capture
セルマジックを使用できます:
Copied!1 2 3 4
%%keep_alive # 長時間実行されるプロセスが終了しないようにセッションを維持するマジックコマンド %%capture cell_output # セルの出力を抑制し、変数 'cell_output' に格納するマジックコマンド long_running_process() # 長時間実行されるプロセスを呼び出す関数
別のセルで、上記の変数の出力をファイルに書き込んで、後で確認できるようにします。
Copied!1 2 3 4 5
with open('cell_output.txt', 'w+') as f: # cell_output.stdoutの内容を書き込む f.write(cell_output.stdout) # cell_output.stderrの内容を書き込む f.write(cell_output.stderr)
管理者が設定したダウンロード制限を確実に適用するために、Palantir プラットフォームでは IDE のネイティブファイルダウンロードが無効になっています。
ファイルをダウンロードするには、ファイルを Foundry データセットに書き戻します。これを行うには、Code Workspaces のサイドバーで Data タブに移動し、Write data to new dataset を選択して、新しいデータセットの名前を入力します。データセットのエイリアスを確認した後、データセットの種類として Non-tabular dataset を選択し、アップロードするファイルまたはディレクトリの場所を入力して、生成されたコードスニペットを実行します。
ファイルが Foundry データセットにアップロードされたら、データセットリンクを選択してデータセットプレビューに移動し、そこからファイルをダウンロードできます。 プラットフォームからデータをエクスポートする前に管理者が正当性を求める場合や、エクスポートするデータの量を制限する場合があることを覚えておいてください。
RStudio® および Shiny® は Posit™ の商標です。
Jupyter®、JupyterLab®、および Jupyter® ロゴは NumFOCUS の商標または登録商標です。
言及されたすべてのサードパーティ商標(ロゴやアイコンを含む)は、それぞれの所有者の財産です。提携や支持は示唆されていません。