8. [Pipeline Builder] 온톨로지 데이터 파이프라인8 - 온톨로지 데이터소스 준비 지침

본 번역은 검증되지 않았습니다. AIP를 통해 영문원문으로부터 번역되었습니다.

8 - 온톨로지 데이터소스 준비 지침

이 콘텐츠는 learn.palantir.com ↗에서도 확인하실 수 있으며, 접근성을 위해 여기에도 제공되고 있습니다.

다음 몇 가지 작업에서는 Foundry의 온톨로지 관리 애플리케이션(OMA)에 기본 오브젝트 유형과 링크 유형을 생성하게 됩니다. 오브젝트 유형은 일정에 따라 정기적으로 유지되는 빌드의 대상(즉, 결과물)이 되는 Foundry 데이터셋에 의해 지원됩니다. 이러한 빌드의 예로는 이 교육 트랙에서 생성한 것들이 있습니다.

먼저, 온톨로지 오브젝트 유형을 지원하기 위한 데이터셋을 구축하기 위한 모범 사례를 검토하고, 파이프라인이 이를 어떻게 구현하고 있는지 몇 가지 예를 들어 보겠습니다.

데이터셋을 지원하기 위한 최적의 스키마에 대한 지침을 검토하는 것부터 시작해 봅시다. 이 문서를 3-4분 동안 검토하고, Foundry 온톨로지에 데이터를 준비하고 동기화하는 작업이 자주 포함된다면 북마킹을 고려해 보세요. 제안된 데이터 유형과 명명 패턴을 따르면 온톨로지 전반의 성능과 일관성을 향상시킬 수 있습니다.

다음으로, 파이프라인의 작동 방식과 따라서 온톨로지의 유지 관리성에 영향을 미치는 코드 개발 모범 사례로 돌아가 보겠습니다. 이 문서 페이지에서(~8분 독서) 코드와 파이프라인 위생에 대한 일반적인 권장 사항을 검토할 수 있습니다.

이러한 권장 사항을 검토한 후, 온톨로지 오브젝트 유형을 지원하기 위한 다음 데이터셋을 더 잘 준비하기 위한 적어도 세 가지 제안을 생각해 볼 수 있나요?

마지막으로, 온톨로지 개발 프로젝트를 시작하기 전에 다음 사항들을 알아야 합니다:

  • 오브젝트 유형과 링크를 사용하여 달성하려는 워크플로와 필요한 데이터 아키텍처.
  • 오브젝트 스토리지 V1(OSv1)에서는, 오브젝트 유형은 단일 데이터셋에 의해 지원되며, 데이터셋은 오브젝트 유형 하나만 지원할 수 있습니다. 오브젝트 스토리지 V2(OSv2)에서는, 단일 데이터셋이 여러 오브젝트 유형을 지원할 수 있습니다.
  • 가능한 경우 OMA 또는 온톨로지 지원 애플리케이션에서가 아닌 데이터 변환에서 클리닝 및 포맷팅을 수행해야 합니다.
  • 기본 키는 항상 고유해야 하지만, 온톨로지 지원 데이터셋의 경우 특히 중요합니다.
  • 지원 데이터셋 스키마가 변경되면, 오브젝트 유형과 링크 유형에 부정적인 영향을 미치지 않도록 액션을 취해야 할 수도 있습니다(이에 대해서는 나중에 자세히 설명하겠습니다).