5A. [Code Repositories] 코드 리포지토리에서 원시 파일 다루기12 - 핵심 내용 정리

본 번역은 검증되지 않았습니다. AIP를 통해 영문원문으로부터 번역되었습니다.

12 - 핵심 내용 정리

이 내용은 learn.palantir.com ↗에서도 사용할 수 있으며, 접근성을 위해 이곳에도 제공됩니다.

이제 새로운 데이터소스 프로젝트 구조, 저장소, 그리고 승객에 대한 전처리된 데이터셋을 가지게 되었습니다. 이는 원시 파일을 Spark DataFrame으로 파싱하고 Parquet에 기록하는 과정을 거쳤습니다. 이 시점에서 기본적인 개발 흐름에 익숙해져야 합니다: 브랜치 → 코드 → 미리보기 → 커밋 → 빌드 → 병합. 우리는 계속해서 더욱 복잡한 내용을 추가할 것입니다.

이 튜토리얼에서 수행한 작업은 다음과 같습니다:

  1. Datasource Project: Passengers 프로젝트와 연결된 passengers_logic Code Repositories를 생성했습니다.
  2. Foundry API와 패키지를 사용하여 원시 JSON 및 CSV 파일을 결과물 데이터셋으로 파싱했습니다.

이 교육 과정에서 사용된 제품 관련 문서 목록은 다음과 같습니다: