3. [Pipeline Builder] 프로젝트 출력 생성2 - 클리닝 파이프라인 생성

본 번역은 검증되지 않았습니다. AIP를 통해 영문원문으로부터 번역되었습니다.

2 - 클리닝 파이프라인 생성

이 내용은 learn.palantir.com ↗에서도 확인할 수 있으며, 접근성을 위해 여기에 제시되었습니다.

📖 과제 소개

현재 초기 단계의 준비 변환 시퀀스를 가지고 있습니다: 원시 소스 → “로컬” 원시 복사 → 전처리. 이 튜토리얼에서 생성하는 결과물은 파이프라인의 다음 단계로의 입력으로 사용됩니다. 이 첫 번째 과제에서는 파이프라인의 클린 세그먼트를 생성합니다.

🔨 과제 지시사항

  1. 이전 튜토리얼에서 생성한 데이터소스 프로젝트 폴더로 이동합니다, 예를 들어, .../Temporary Training Artifacts/${yourName}/Data Engineering Tutorials/Datasource Project: Flight Alerts/.
  2. 배치 파이프라인을 flight_alerts_datasource_clean으로 명명합니다.
  3. /preprocessed 폴더에서 세 개의 데이터셋을 추가합니다.
  4. 선택적으로 세 개의 전처리 노드에 색상과 레이블을 적용합니다.