2. [Code Repositories] 데이터 변환 소개9 - 실습 요약

본 번역은 검증되지 않았습니다. AIP를 통해 영문원문으로부터 번역되었습니다.

9 - 실습 요약

이 내용은 learn.palantir.com ↗에서도 확인할 수 있으며 접근성을 위해 여기에 제공됩니다.

✅ 결과물

  • 파이프라인의 데이터소스 단계에 전용 Code Repositories를 구축했습니다.
  • 세 가지 원시 입력에 대한 변환 파일: flight_alerts_raw, status_mapping_raw, priority_mapping_raw.
  • 각 변환 파일에 해당하는 기능 브랜치에서 빌드된 데이터셋.

✅ 학습내용

  • 파이프라인의 각 단계는 구조화된 환경에서 코드 기반 데이터 변환을 개발하고 유지하기 위해 전용 Code Repositories가 있어야 합니다.
  • Foundry 저장소는 Git을 통해 코드 브랜치 및 관리를 가능하게 하여 코드 변경에 구조와 감독을 도입합니다.
  • 변환에서 다른 Foundry 프로젝트의 데이터셋을 사용하려면 프로젝트 참조를 명시적으로 만들어야 합니다.
  • 코드 어시스트는 Code Repositories 세션과 병렬로 실행되며 자동 완성, 컴파일 오류 및 기타 IDE와 같은 기능을 제공합니다.
  • 각 저장소 커밋 및/또는 빌드는 파이프라인 위생을 보장하는 CI 확인을 시작합니다.
  • 데이터셋 빌드가 Code Repositories에서 시작될 때 실행되는 코드 브랜치에서 빌드됩니다.
  • 파이프라인의 모든 단계에서 동일한 브랜치 이름을 사용하여 하류 브랜치가 올바른 상류 브랜치에서 읽을 수 있도록 해야 합니다.
  • 저장소는 Shrinkwrap 파일을 사용하여 입력/출력 경로를 실제 데이터셋 리소스 ID(RID)에 매핑합니다. 그러나 코드 에디터의 프롬프트를 사용하여 해당 경로를 RID로 바꿀 수 있습니다.