8. [Pipeline Builder] 온톨로지 데이터 파이프라인29 - 추가 백킹 데이터셋 변경: 파트 1

본 번역은 검증되지 않았습니다. AIP를 통해 영문원문으로부터 번역되었습니다.

29 - 추가 백킹 데이터셋 변경: 파트 1

이 내용은 learn.palantir.com ↗에서도 이용할 수 있으며, 접근성을 위해 여기에 제시됩니다.

📖 작업 소개

이 실습에서는 백킹 데이터셋과 온톨로지 구성의 변경을 포함하는 두 가지 주요 시나리오를 처리하는 방법을 연습하게 됩니다.

  1. 백킹 데이터셋에 대한 추가 변경
  2. 백킹 데이터셋에 대한 파괴적 변경

승객 오브젝트 유형의 제목 키는 단순히 승객의 성입니다. 백킹 데이터셋에 full_name이라는 새로운 열을 만들어 제목 키로 교체해 봅시다. 이렇게 하면 백킹 데이터셋이 새로운 열을 받을 때 온톨로지 동기화 프로세스에서 어떤 일이 일어나는지 확인할 수 있습니다.

🔨 작업 지시사항

  1. ontology_flight_alerts_logic 파이프라인 아티팩트를 엽니다.

    • ⚠️ 일반적으로 이런 변경을 할 때는 Main에서 분기하는 것이 좋지만, 편의상 Main에 직접 변경을 하게 됩니다.
  2. first_namelast_name을 공백으로 구분하여 결합하는 문자열 결합 변환을 passengers_clean에 추가하고, 새로운 열을 full_name으로 명명합니다.

    • 두 노드 사이에 변환을 추가할 수 있는 방법은 노드 사이의 + 기호를 클릭하거나 (아래 이미지 참조), 노드 연결의 끝에 있는 흰색 및 회색 원을 통해 나중에 노드의 입력과 결과물을 변경하는 것입니다.
  3. 변환 노드에 이름을 지정하는 것을 고려해 보세요 (예: "이름 결합").

  4. 변경 사항을 적용하고 미리보기를 수행합니다.

  5. 파이프라인 그래프로 돌아가서 변환 노드를 색칠하고 passengers 결과물이 아래 이미지에 표시된 대로 입력 스키마를 사용하도록 변경합니다.

  6. 파이프라인을 배포합니다.

  7. 데이터셋 빌드가 완료되면 결과물 passengers 데이터셋을 열고 아래 이미지에 표시된 대로 Details 탭의 Syncs 섹션으로 이동합니다. 여기에서는 스키마 변경에도 불구하고 데이터셋과 오브젝트 스토리지 서비스(즉, "Phonograph") 간의 동기화가 성공적이었음을 확인할 수 있습니다.

여기에 있으면서 Health 탭에 접근하여 앞서 설정한 Schema Check가 통과했음을 확인할 수도 있습니다. COLUMN_ADDITIONS_ALLOWED_STRICT으로 체크를 설정했기 때문에, 체크는 새 열을 추가했습니다.