5. [Pipeline Builder] Transforms 프로젝트7 - 연습 요약

본 번역은 검증되지 않았습니다. AIP를 통해 영문원문으로부터 번역되었습니다.

7 - 연습 요약

이 내용은 learn.palantir.com ↗에서도 확인할 수 있으며 접근성을 위해 이곳에도 제공됩니다.

✅ 결과물

  1. 승객 데이터를 위한 새로운 Datasource 프로젝트 생성.
  2. 프로젝트의 .../datasets/raw.../datasets/clean 폴더에 새로운 Pipeline Builder 아티팩트 생성.
  3. JSON 파싱 변환 작업 생성.
  4. 원시 승객 데이터를 정리하기 위한 일련의 변환 작업 생성.
  5. 승객 데이터 Datasource 파이프라인에 대한 Notepad 및 Data Lineage 관련 문서 작성.
  6. 승객 데이터 Datasource 파이프라인에 대한 빌드 일정 생성.

✅ 학습내용

Pipeline Builder는 JSON(및 XML)을 Spark에서 사용할 수 있는 형식(예: Parquet)으로 파싱할 수 있습니다.