分析Code Workbookテンプレートマルチノード・テンプレート

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

マルチノード・テンプレート

Code Workbook は、テンプレート化されたワークフローのためのマルチノード・テンプレートをサポートしています。テンプレートは、複数の他のテンプレートから作成することができ、これらのテンプレートのパラメーターの値を互いにバインドすることができます。

titanic_dataset を使用した例を見ていきましょう。2つの数値行を選択し、それらを2つのグラフにプロットするワークフローをテンプレート化します。最初のグラフは、2つの数値行の散布図です。2番目のプロットは、数値行に基づいてフィルター処理された乗客が生き残ったかどうかのヒストグラムです。

テンプレート化するワークフローの視覚的な概要は以下の通りです。

mnt_workflow.png

テンプレートの作成

まず、入力データセットから2つの数値行と Survived を選択するテンプレートを作成します。このテンプレートには Filter というタイトルを付けます。

filter_template

次に、2つの数値行の散布図をプロットするテンプレートを作成します。このテンプレートには Scatterplot というタイトルを付けます。入力データセットが Pandas のデータフレームとして読み込まれるように設定されていることに注意してください。

scatterplot_template

最後に、入力データセットを2つの数値行と2つのテンプレート化された入力に基づいてフィルター処理するテンプレートを作成します。入力データセットが Spark のデータフレームとして読み込まれるように設定されていることに注意してください。

filter_then_histogram

マルチノード・テンプレートの作成

3つのテンプレートをすべて選択し、右クリックしてメニューを開き、新しいテンプレートを作成 を選択します。これでテンプレートエディターが表示されます。

creating_multi_node_template

col1 パラメーターの値をリンクさせ、col2 パラメーターの値をリンクさせたいと思います。まず、Filter テンプレートに移動します。col1 をクリックし、ドロップダウンで 共有パラメーターを作成 を選択します。

shared-mnt-parameter

右側に、col1 という新しいパラメーターが作成されました。右側のペインでソースデータセットとして titanic_dataset を選択します。次に、他の2つのテンプレートに移動し、新しい col1 マルチノード・テンプレート・パラメーターに col1 をリンクさせます。col2 についても同様に繰り返し、マルチノード・テンプレートを保存します。

マルチノード・テンプレートの使用

以前に作成した3つのテンプレートは、現在マルチノード・テンプレートの一部になっています。

Filter テンプレートに移動します。col1col2 パラメーターの隣には、このパラメーター値がマルチノード・テンプレート・パラメーターによって制御されていることを示すアイコンが表示されます。

mnt_logic_pane_1

ペインの上部で View Group を選択します。これで、マルチノード・テンプレートのノードがハイライト表示され、テンプレート内の共有パラメーターが一覧表示されるビューが表示されます。このビューで col1col2 の値を変更すると、3つのノード内のすべてのインスタンスも変更されます。

mnt_logic_pane_2

子ノード・ペインで共有パラメーターの値を変更すると、マルチノード・テンプレート内のすべてのインスタンスの値も変更されます。

このテンプレートの新しいインスタンスを追加してみましょう。

add-new-mnt-titanic.png

FarePClass を分析してみましょう。子ノードのビューでこれらの2つの行を選択することで、グループ全体で行の値を設定していることに注意してください。

mnt_workflow_new_instance

次に、Filter then histogram のカットオフ値を更新します。テンプレートを実行し、別の数値行のセットに対して同じグラフを作成しました。