5A. [Repositories] Code Repositories での生ファイルの取り扱い10 - 演習のまとめ

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

10 - 演習のまとめ

以下の画像は、これまでにこのトレーニングのルートで行った作業の視覚的なまとめです。強調表示されている部分は、このチュートリアルで具体的に行った手順を表しています。

✅ 演習での成果物

  • 生のJSONおよびCSVをSpark DataFramesに解析し、データセットに書き出す前処理用のPythonトランスフォームファイル。
  • Masterブランチで構築された前処理済みの出力。

✅ 学習した内容

  • データセットには、スキーマなしの生のCSVおよびJSONファイルが含まれていることがあります。FoundryのAPIとパッケージを使用して、これらをSpark DataFramesに解析し、Parquetに書き込むことができます。
  • コードアシストが実行されている場合、Foundry\Clickableモジュールや変数として、モジュール名や変数をctrl+クリックできます。