注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。
データセットの概要で説明したように、Foundryの非構造化データは、テーブル形式のデータと同様に、データセット内のファイルの集合として保存されます。
以下は、構造化データと非構造化データのパイプライン間で同一の動作をするいくつかの特長です:
テーブル形式のデータに対するパイプラインとの一部の違いには以下のようなものがあります:
非構造化データのパイプラインを始めるには、PythonとJavaのトランスフォームのドキュメンテーションの関連部分を参照してください:
非構造化データがクリーン化・正規化された後、Code Workbookを使用して非構造化データセットを分析し、PythonとRで機械学習モデルを訓練することができます。Code Workbookでの非構造化データアクセスについて詳しく学ぶ。