注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。
Code Workbook は、テンプレート化されたワークフローのためのマルチノード・テンプレートをサポートしています。テンプレートは、複数の他のテンプレートから作成することができ、これらのテンプレートのパラメーターの値を互いにバインドすることができます。
titanic_dataset
を使用した例を見ていきましょう。2つの数値行を選択し、それらを2つのグラフにプロットするワークフローをテンプレート化します。最初のグラフは、2つの数値行の散布図です。2番目のプロットは、数値行に基づいてフィルター処理された乗客が生き残ったかどうかのヒストグラムです。
テンプレート化するワークフローの視覚的な概要は以下の通りです。
まず、入力データセットから2つの数値行と Survived
を選択するテンプレートを作成します。このテンプレートには Filter
というタイトルを付けます。
次に、2つの数値行の散布図をプロットするテンプレートを作成します。このテンプレートには Scatterplot
というタイトルを付けます。入力データセットが Pandas のデータフレームとして読み込まれるように設定されていることに注意してください。
最後に、入力データセットを2つの数値行と2つのテンプレート化された入力に基づいてフィルター処理するテンプレートを作成します。入力データセットが Spark のデータフレームとして読み込まれるように設定されていることに注意してください。
3つのテンプレートをすべて選択し、右クリックしてメニューを開き、新しいテンプレートを作成 を選択します。これでテンプレートエディターが表示されます。
col1
パラメーターの値をリンクさせ、col2
パラメーターの値をリンクさせたいと思います。まず、Filter
テンプレートに移動します。col1
をクリックし、ドロップダウンで 共有パラメーターを作成 を選択します。
右側に、col1
という新しいパラメーターが作成されました。右側のペインでソースデータセットとして titanic_dataset
を選択します。次に、他の2つのテンプレートに移動し、新しい col1
マルチノード・テンプレート・パラメーターに col1
をリンクさせます。col2
についても同様に繰り返し、マルチノード・テンプレートを保存します。
以前に作成した3つのテンプレートは、現在マルチノード・テンプレートの一部になっています。
Filter
テンプレートに移動します。col1
と col2
パラメーターの隣には、このパラメーター値がマルチノード・テンプレート・パラメーターによって制御されていることを示すアイコンが表示されます。
ペインの上部で View Group
を選択します。これで、マルチノード・テンプレートのノードがハイライト表示され、テンプレート内の共有パラメーターが一覧表示されるビューが表示されます。このビューで col1
と col2
の値を変更すると、3つのノード内のすべてのインスタンスも変更されます。
子ノード・ペインで共有パラメーターの値を変更すると、マルチノード・テンプレート内のすべてのインスタンスの値も変更されます。
このテンプレートの新しいインスタンスを追加してみましょう。
Fare
と PClass
を分析してみましょう。子ノードのビューでこれらの2つの行を選択することで、グループ全体で行の値を設定していることに注意してください。
次に、Filter then histogram
のカットオフ値を更新します。テンプレートを実行し、別の数値行のセットに対して同じグラフを作成しました。