分析Code Workbookコードリポジトリ隠しコードリポジトリ

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

隠しコードリポジトリ

Code Workbook は、branchesの使用を通じて軽量なバージョン管理を提供します。さらに、各ワークブックは特別な隠しコードリポジトリにバックアップされています。このリポジトリは、Code Workbook で書かれたコードの安全なバックアップとして機能するとともに、ワークブックで行われたすべてのコード変更の履歴を公開します。

Code Workbook インターフェースの右上にある歯車アイコンメニューを開き、隠しコードリポジトリを開くを選択することで、ワークブックの隠しコードリポジトリにアクセスできます。

Hidden repository button

特別なプロパティ

ワークブックの隠しリポジトリは常に以下のプロパティを持つ:

  • リポジトリは読み取り専用です: リポジトリの内容は表示のみ可能で、リポジトリ直接更新することはできません。リポジトリを更新する唯一の方法は、ワークブックでコードを変更することです。
  • リポジトリはデフォルトで隠されています: リポジトリは Code Workbook インターフェースを通じてのみ発見可能です。
  • リポジトリは3つの別々のファイルを保存します: pipeline.Rpipeline.pypipeline.sql の各ファイルは、それぞれの言語のために変換されたワークブックのコード全体を含む。
  • リポジトリは完全な変更履歴を保存します: ワークブックのコードの各ブランチの全履歴は、隠しリポジトリの Branches タブにて利用可能です。
  • リポジトリには隠し workbook.yml ファイルが含まれています: このファイルはワークブックに関する基本的なメタデータを保存します。

ワークブックのブランチで行われたすべてのコード変更は、自動的に隠しコードリポジトリの対応するブランチへの新しいコミットを作成します。

コード変換

隠しリポジトリにコミットされた Code Workbook のコードは、自動的に Code Repository 構文に変換されます。例えば、Code Workbook の以下のコードセルを考えてみてください。

Copied!
1 2 3 4 # この関数は、データセットのカラム名を変更するためのものです。 def rename_column(dataset): # withColumnRenamedメソッドを使用して、"old_name"という名前のカラムを"new_name"に変更します。 return dataset.withColumnRenamed("old_name", "new_name")

このコードは、隠されたリポジトリの pipeline.py ファイルに以下のように変換されます:

Copied!
1 2 3 4 5 6 7 @transform_pandas( Output(rid="ri.foundry.main.dataset.id-1"), dataset=Input(rid="ri.vector.main.dataset.id-2") ) def rename_column(dataset): # 列の名前を変更する関数 return dataset.withColumnRenamed("old_name", "new_name")

Code Workbook に複数の指定された言語のコードセルが存在する場合、それぞれのコードセルは同じユニークなファイルに追加されます:R の場合は pipeline.R、Python の場合は pipeline.py、SQL の場合は pipeline.sql。これにより、指定された言語のすべてのコードを 1 つのファイルで表示できます。ワークブックの グローバルコード セクションで記述されたコードも、適切なファイルに格納されます。

失われたコードの回復

ワークブックのバックアップを定期的に保存することで、隠しコードリポジトリは失われたり誤って削除されたコードを復元するための推奨方法です。特定のワークブックのブランチの履歴を参照するには、隠しリポジトリの上部にある ブランチ タブを開き、目的のブランチ(master など)を選択し、コード変更を確認したいコミットを選択します。その後、コードをコピーしてワークブックに戻して貼り付けることができます。