5C. [Code Repositories] 데이터 변환을 통한 다중 출력2 - 폴더 구조 및 저장소 생성

본 번역은 검증되지 않았습니다. AIP를 통해 영문원문으로부터 번역되었습니다.

2 - 폴더 구조 및 저장소 생성

이 내용은 learn.palantir.com ↗에서도 확인할 수 있으며, 접근성을 위해 여기에 제공됩니다.

📖 작업 소개

변환 프로젝트는 일반적으로 여러 원본을 결합하고 추가적인 비즈니스 로직을 적용하여 풍부한 데이터셋을 생성합니다. 일반적으로 이러한 데이터셋은 일반적으로 노출되지 않으며(온톨로지 프로젝트 단계에서는 노출됩니다). 이 작업은 변환 프로젝트에 대해 권장되는 하이레벨 디렉터리 구조를 구현하는 데 도움이 될 것입니다.

🔨 작업 지시사항

  1. .../Temporary Training Artifacts/yourName/Data Engineering Tutorials/ 폴더에 Transform Project: Alert Metrics라는 새 폴더를 생성합니다.

  2. 상위 수준 프로젝트 폴더 내부에 다음 폴더를 추가합니다:

    • /data
    • /documentation
    • /analysis
  3. flight_alert_metrics_logic이라는 새로운 Python 변환 Code Repositories를 생성합니다.

  4. Master에서 yourName/feature/join_data라는 새 브랜치를 생성합니다.

  5. 저장소의 /datasets 폴더에 transformedoutput이라는 두 개의 새 하위 폴더를 생성합니다. 이렇게 하면 변환에 의해 생성된 데이터셋이 관련 문서에서 권장하는 폴더 구조로 배치됩니다.

    • 간단히 말해, output 폴더는 변환 프로젝트의 최종 결과물을 나타내며, 그 결과물을 생성하기 위해 필요한 사전 작업은 transformed 폴더에서 이루어집니다.