5A. [Repositories] Working with Raw Files in Code Repositories10 - 演習のまとめ
Warning

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

10 - 演習のまとめ

learn.palantir.com ↗でも以下の内容をご覧いただけますが、アクセシビリティの観点から、ここに掲載しています。

以下の画像は、ユーザーがこれまでにこのトレーニングのルートで行った作業の視覚的なまとめです。ハイライト部分は、このチュートリアルで具体的に行ったステップを示しています。

✅ 演習での成果物

  • 生のJSONとCSVをパースし、SparkのDataFramesに変換してデータセットに書き出す前処理Pythonトランスフォームファイル。
  • Master ブランチで構築した前処理済みの出力。

✅ 学習した内容

  • データセットはスキーマなしの生のCSVとJSONファイルを含むことができます。FoundryのAPIとパッケージを使用すると、これらをSparkのDataFramesにパースし、Parquetに書き込むことができます。
  • コードアシストが実行中の場合、モジュール名や変数に対してctrl+clickを行うと、Foundry\Clickableのモジュールや変数となります。