注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。
Code Workbook では、変換が受け取る各入力のタイプを指定できます。入力タイプは、変換の名前の下にあるドロップダウンメニューから設定できます:
要求された入力タイプが実際の入力のタイプと一致しない場合、Code Workbook は必要な変換を行います。
例えば:transform_A
の出力が pandas データフレームで、その派生変換 transform_B
が入力を Spark データフレームとして手動設定した場合、Code Workbook は pandas データフレームを要求された Spark データフレームに変換します。transform_C
の出力が pandas データフレームで、その派生 transform_D
が入力を R の data.frame として要求した場合、Code Workbook はまず pandas データフレームを Spark データフレームに戻し、その後 R の data.frame に変換します。
以下のフローチャートは、Code Workbook が入力タイプ間の変換をどのように扱うかの概観を提供します:
Code Workbook の変換は、それぞれが異なる入力タイプを設定できる任意の数の入力を持つことができます。しかし、変換は単一の出力しか持つことができません。複数の出力は現在サポートされていません。
Code Workbook は、言語により、その変換で特定のタイプの出力のみを許可します:
言語 | 許可される出力タイプ |
---|---|
Python | Spark データフレーム, Pandas データフレーム, FoundryObject, None |
R | R の data.frame, FoundryObject, NULL |
SQL | Spark データフレーム |
変換が上記に記載されているもの以外のタイプを返す場合、Code Workbook はサポートされていないタイプのエラーを返します。
Code Workbook では、None/NULL の戻り値を持つ変換を実行させることができますが、下流の変換は None/NULL を入力として受け入れません。
デフォルトでは、Python の変換は、入力を Spark データフレームとして受け入れます。入力タイプは、変換の名前の下にあるドロップダウンメニューから設定できます。そして、Code Workbook は上流の出力を望ましい入力タイプに変換します:
以下の入力タイプが Python の変換でサポートされています:
入力タイプ | 説明 |
---|---|
Spark データフレーム (デフォルト) | クラス pyspark.sql.dataframe.DataFrame の pySpark データフレーム |
Pandas データフレーム | クラス pandas.core.frame.DataFrame の Pandas データフレーム |
Python トランスフォーム入力 ('saved as dataset' の入力のみ利用可能) | 入力に直接ファイルアクセスを可能にする FileSystem オブジェクト。非構造化ファイルへのアクセスのドキュメントを参照してください。 |
オブジェクト | モデリングワークフローを実行するための Foundry モデルオブジェクト。Modelsのドキュメントを参照してください。 |
デフォルトでは、R の変換は、入力を R の data.frame として受け入れます。入力タイプは、変換の名前の下にあるドロップダウンメニューから設定できます。そして、Code Workbook は上流の出力を望ましい入力タイプに変換します:
以下の入力タイプが R の変換でサポートされています:
入力タイプ | 説明 |
---|---|
Spark データフレーム | クラス SparkDataFrame の SparkR データフレーム |
R の data.frame (デフォルト) | クラス data.frame の R データフレーム |
R トランスフォーム入力 ('saved as dataset' の入力のみ利用可能) | 入力に直接ファイルアクセスを可能にする FileSystem オブジェクト。非構造化ファイルへのアクセスのドキュメントを参照してください。 |
オブジェクト | モデリングワークフローを実行するための Foundry モデルオブジェクト。Modelsのドキュメントを参照してください。 |
SQL の変換でサポートされている入力と出力のタイプは Spark データフレームのみです。データフレームは SQL 内でテーブルとして読み込むことができます。