8. [Code Repositories] 온톨로지 데이터 파이프라인8 - 온톨로지 데이터소스 준비 가이드라인

본 번역은 검증되지 않았습니다. AIP를 통해 영문원문으로부터 번역되었습니다.

8 - 온톨로지 데이터소스 준비 가이드라인

이 내용은 learn.palantir.com ↗에서도 확인 가능하며, 접근성을 위해 이곳에도 제공됩니다.

다음 몇 가지 작업에서는 Foundry의 온톨로지 관리 애플리케이션(OMA)에서 기본 오브젝트 유형과 링크 유형을 생성하게 됩니다. 오브젝트 유형은 보통 스케줄이 잘 관리되고, 이 교육 트랙에서 생성한 것처럼 빌드의 대상(즉, 결과물)이 되는 Foundry 데이터셋에 의해 지원됩니다.

먼저, 온톨로지 오브젝트 유형을 지원하기 위한 데이터셋을 구성하는 최선의 방법을 검토하고, 이미 구현된 파이프라인이 이를 어떻게 이용하는지 강조해 보겠습니다.

데이터셋을 지원하기 위한 최적의 스키마에 대한 가이드라인을 검토하는 것으로 시작해 봅시다. 3-4분 정도를 들여 이 문서를 검토하고, Foundry 온톨로지에 데이터를 준비하고 동기화하는 작업을 자주 수행한다면 북마크를 고려해 보세요. 제안된 데이터 유형과 명명 패턴을 준수하면 온톨로지 전반의 성능과 일관성을 향상시킬 수 있습니다.

다음으로, 파이프라인이 실행되는 방식과, 따라서 온톨로지의 유지 관리성에 영향을 미치는 코드 개발의 모범 사례로 돌아가 보겠습니다. 이 문서 페이지에서 (~8분 가량 읽기) 코드와 파이프라인 위생에 대한 일반적인 권장 사항을 검토하게 됩니다.

이러한 권장 사항을 검토한 후, 다음 데이터셋을 온톨로지 오브젝트 유형을 지원하기 위해 더 잘 준비하는 데 대한 최소한 세 가지 제안을 생각해 볼 수 있습니까?

마지막으로, 온톨로지 개발 프로젝트를 시작하기 전에 다음 사항을 알아야 합니다:

  • 오브젝트 유형과 링크를 사용하여 달성하려는 워크플로와 필요한 데이터 아키텍처.
  • 오브젝트 유형은 단일 데이터셋에 의해 지원되며, 데이터셋은 오직 하나의 오브젝트 유형만을 지원할 수 있습니다.
  • 가능한 한 OMA나 온톨로지를 인식하는 애플리케이션에서가 아닌 데이터 변환에서 클리닝과 포매팅이 이루어져야 합니다.
  • 기본 키는 항상 고유해야 하지만, 온톨로지를 지원하는 데이터셋에는 특히 중요합니다.
  • 지원 데이터셋 스키마가 변경되면, 오브젝트 유형과 링크 유형이 부정적으로 영향을 받지 않도록 액션을 취해야 할 수도 있습니다(이에 대해서는 나중에 더 자세히 설명합니다).