概要

パイプラインを作成するには、データセットが必要です。データセットはパイプラインに追加され、クリーニング、変換、他のデータセットと組み合わせて、Foundry オントロジーの一部としてさらなる使用のためにデプロイされます。

Pipeline Builder は、構造化データセットと半構造化データセットの両方をサポートしています。

構造化データセットは、オープンソースの表形式データとデータセットの行に関するメタデータを含むファイルで構成されています。行のメタデータは、スキーマとしてデータセットと一緒に保存されます。

また、Pipeline Builder は、XML、JSON、CSV ファイルを含む半構造化データセットもサポートしています。半構造化ファイルを表形式に変換してスキーマセーフティを利用するために、パース変換関数を使用できます。パイプライン内のデータを変換する方法を学びましょう。

Pipeline Builder でのワークフローの定義を始める第一歩は、ワークスペースに1つ以上のデータセットを追加することです。データセットの追加や入力計算モードの変更に関する以下のドキュメントを参照し、Foundry のデータセットについて詳しくはデータ・インテグレーションをご覧ください。