5A. [Code Repositories] 코드 리포지토리에서 원시 파일 다루기6 - 실습 요약

본 번역은 검증되지 않았습니다. AIP를 통해 영문원문으로부터 번역되었습니다.

6 - 실습 요약

이 콘텐츠는 learn.palantir.com ↗에서도 확인할 수 있으며, 접근성을 위해 여기에도 제공됩니다.

✅ 결과물

  1. 데이터소스 프로젝트: 승객 프로젝트.
  2. passengers_logic Code Repositories.
  3. 원시(raw)이며 구문 분석되지 않은 JSON 및 CSV 파일의 “지역(local)” 프로젝트 사본을 생성하는 파이썬 변환.
  4. Master 브랜치에서 구축된 “원시(raw)” 데이터셋 파일.

✅ 학습내용

  • Foundry 데이터셋은 대부분 Parquet ↗ 파일로 구성되어 있으며, Spark에 최적화되어 있습니다.
  • 데이터셋은 스키마가 없는 원시 CSV 및 JSON 파일을 포함할 수 있습니다.
  • Foundry Explorer 도우미는 모든 파일과 폴더를 빠르게 검색하고 선택한 데이터셋을 미리보기 할 수 있는 파일 탐색 인터페이스입니다.