5A. [Code Repositories] 코드 리포지토리에서 원시 파일 다루기10 - 연습 요약

본 번역은 검증되지 않았습니다. AIP를 통해 영문원문으로부터 번역되었습니다.

10 - 연습 요약

이 내용은 learn.palantir.com ↗에서도 확인할 수 있으며 접근성을 위해 여기에 제공됩니다.

아래 이미지는 이 교육 트랙에서 지금까지 수행한 작업의 시각적 요약입니다. 강조된 부분은 이 튜토리얼에서 특별히 수행한 단계를 나타냅니다.

✅ 결과물

  • 원시 JSON과 CSV를 Spark DataFrames로 구문 분석하고 데이터셋으로 작성하는 전처리 Python 변환 파일.
  • Master 브랜치에서 빌드된 전처리 결과물.

✅ 학습내용

  • 데이터셋은 스키마가 없는 원시 CSV와 JSON 파일을 포함할 수 있습니다. Foundry API와 패키지를 사용하여 이를 Spark DataFrames로 구문 분석하고 Parquet에 작성할 수 있습니다.
  • 코드 지원이 실행 중인 경우, Foundry\Clickable 모듈과 변수의 모듈 이름과 변수를 ctrl+click 할 수 있습니다.