2. [Code Repositories] 데이터 변환 소개3 - Code Repositories 생성하기

본 번역은 검증되지 않았습니다. AIP를 통해 영문원문으로부터 번역되었습니다.

3 - Code Repositories 생성하기

이 내용은 learn.palantir.com ↗에서도 확인하실 수 있으며, 접근성을 위해 여기에도 제공됩니다.

📖 작업 소개

파이프라인의 각 단계에는 구조화된 설정에서 코드 기반 데이터 변환을 개발하고 유지 관리할 수 있는 전용 Code Repositories가 있어야 합니다. Datasource 프로젝트를 위한 저장소 생성부터 시작해봅시다.

⚠️ 이 튜토리얼을 수행하기 위한 사전 요구사항은 나중에 작업을 저장할 전용 위치를 생성해두는 것입니다. 아직 설정하지 않았다면 아래의 지시사항을 따르십시오:

  1. 먼저, 샌드박스 폴더를 생성할 프로젝트 폴더를 찾기 위해 아래의 각 단계를 차례대로 수행합니다.

    1a. 화면 상단의 Projects를 선택하고, Foundry Training & Resources라는 프로젝트를 검색하여 엽니다. 그런 다음, Foundry Reference Project 폴더를 선택합니다. 다음으로, **Temporary Training** Artifacts 하위 폴더를 선택합니다. 이 화면에서 오른쪽 상단 근처에 선택 가능한 + New 옵션이 있다면 여기에서 샌드박스 폴더를 빌드할 수 있습니다. 폴더를 생성하기 위해 2단계로 넘어가세요. 그렇지 않다면 1b단계로 계속하세요.

    1b. Foundry Training & Resources 프로젝트에서 새 폴더를 생성할 수 없었다면, 대신 화면 상단의 Projects를 선택하고, Temporary Training Artifacts라는 프로젝트를 검색합니다. Foundry 구성에 이러한 프로젝트가 있다면, 모든 사용자에게 새 데이터 쓰기 권한을 부여하도록 설정되어 있을 것입니다. 이런 프로젝트를 찾을 수 없다면, 프로젝트 생성 권한을 어떻게 제어하는지에 따라 직접 생성할 수도 있습니다. 생성한다면, 그룹의 모든 사람에게 에디터 역할을 부여하세요. 이 프로젝트를 가지고 있다면 선택하여 열고, 2단계로 넘어가서 폴더를 생성하세요. 그렇지 않다면, 1c단계로 계속하세요.

    1c. Foundry 등록이 모든 사용자가 새 데이터를 쓸 수 있는 프로젝트로 설정되어 있지 않을 수 있습니다. 향후 튜토리얼을 완료하기 위해서는 이러한 프로젝트가 생성되어야 합니다. Foundry 관리자 또는 Palantir 지원에게 모든 사용자에게 기본적으로 에디터 접근 권한을 부여하는 Temporary Training Artifacts라는 프로젝트를 생성하도록 요청하세요. 생성되면 해당 프로젝트를 열고, 2단계를 수행하여 폴더를 생성하세요.

  2. Temporary Training Artifacts 프로젝트를 열면, 이름을 붙인 폴더를 생성하고 거기에 자원을 저장합니다. .../**Temporary Training** Artifacts/yourFolder/...

🔨 작업 지시사항

  1. 이전 튜토리얼에서 생성한 Datasource 프로젝트 폴더로 이동합니다. 즉, .../**Temporary Training** Artifacts/${yourName}/Data Engineering Tutorials/Datasource Project: Flight Alerts/.
  2. 그 폴더에서 화면 오른쪽 상단의 녹색 ➕ New ▾ 버튼을 클릭하고 드롭다운 목록에서 Code Repository를 선택하여 새로운 Code Repositories를 생성합니다.
  3. 저장소 초기화 화면의 Name your repository 섹션에서 flight_alerts_logic라고 입력합니다.
  4. Repository type 섹션의 Data Transforms 블록에서 언어 템플릿으로 Python을 선택합니다.
  5. Data Transforms 블록 오른쪽에 있는 Initialize repository를 선택합니다.

이제 저장소가 Python으로 데이터를 변환하는 데 필요한 기본 템플릿 파일로 부트스트래핑하고 있습니다.

📚 권장 독서 (~10분 소요)

초기화 후에 sub-project를 생성하는 과정을 사용하여 다중 언어 저장소(예: SQL + Python 또는 Python + Java)를 활성화할 수 있습니다. 데이터 변환 언어에 대한 자세한 정보는 File editor on Navigation에서 설명한 프로세스를 사용합니다. 데이터 변환 언어에 대한 자세한 정보는 지원되는 언어들에 대해 읽어보는 시간을 갖는 것이 좋습니다.