본 번역은 검증되지 않았습니다. AIP를 통해 영문원문으로부터 번역되었습니다.

초기 설정 개요

이 가이드는 귀하의 조직의 데이터를 Foundry에 연결하는 과정을 안내합니다.

시작하기 전에, 조직의 데이터를 Foundry에 연결하는 첫 단계는 기본적으로 네트워킹 개념임을 인식하는 것이 중요합니다. 초기 설정은 네트워크 엔지니어링에 익숙하고 조직의 네트워크 토폴로지와 구성(방화벽 규칙 등)을 인지하고 있는 사람이 가장 잘 수행할 수 있습니다.

개념 개요

Foundry에 데이터를 연결하려면 다음 세 가지 구성 요소를 이 순서대로 설치하거나 구성해야 합니다.

  1. 연결: 데이터 소스에 액세스하는 데 필요합니다.
    • 에이전트: 시스템에서 실행되는 소프트웨어에 연결; 사설 네트워크 및 온-프레미스 데이터 소스에 액세스하는 데 필요합니다.
    • 직접 연결: 인터넷을 통해 데이터 소스에 연결; 공공 네트워크를 통해 연결할 때 선호됩니다.
  2. 소스 / 커넥터: Foundry 외부의 데이터에 액세스하는 데 사용됩니다.
  3. 동기화: Foundry에 데이터를 가져오거나 내보냅니다.

에이전트는 귀하의 조직의 네트워크 내에서 실행되는 Palantir 소프트웨어입니다. 에이전트는 귀하의 조직의 데이터 소스와 Foundry 인스턴스 간의 안전한 중개자 역할을 합니다. 사설 네트워크나 온-프레미스 시스템에서 실행되는 소스에 액세스하려면 에이전트 연결이 필요합니다. 단일 실행 에이전트는 여러 소스와 동기화를 지원할 수 있습니다.

에이전트 아키텍처에 대해 더 알아보기.

직접 연결은 인터넷을 통해 액세스할 수 있는 데이터 소스에 대한 연결입니다. 예를 들어, REST API, SFTP 서버 또는 Azure 스토리지 계정입니다. 에이전트를 설정하지 않고도 우수한 가용성과 성능을 유지하면서 직접 연결을 구성할 수 있습니다. 직접 연결은 귀하의 등록 및 연결 자격 증명에 대한 네트워크 Egress 정책이 필요합니다.

소스 또는 커넥터는 Foundry에 연결하는 외부 데이터 시스템입니다. 예를 들어, 소스는 Postgres 데이터베이스, S3 버킷, Linux 서버의 파일 시스템, SAP 인스턴스 또는 인터넷의 REST API일 수 있습니다. 설정된 소스는 Foundry에 동기화를 설정해야 하며, 데이터는 데이터 세트로 소스에서 동기화되어야 Foundry에서 사용할 수 있습니다.

동기화는 소스에서 특정 데이터를 읽어 Foundry에 가져옵니다. 예를 들어, 여러 테이블이 포함된 PostgreSQL 데이터베이스 소스가 있는 경우, Foundry에 특정 테이블을 가져오도록 동기화를 구성할 수 있습니다. 동기화가 성공적으로 실행되면, Foundry의 결과는 데이터 통합, 모델 개발 및 분석 도구 전체에서 사용할 수 있는 데이터 세트가 됩니다.

역할 및 워크플로

대부분의 Foundry 사용자는 스스로 새 에이전트를 설정할 필요가 없습니다. 에이전트 설정에는 IT 중심의 기술 세트가 필요하지만, 동일한 에이전트를 사용하여 여러 소스와 동기화를 지원할 수 있습니다. 일부 조직은 Foundry 배포의 첫 주 동안 설정된 에이전트를 사용하여 장기간 운영할 수 있습니다. 기존 에이전트가 액세스할 수 없는 데이터(예: 네트워크 세분화 또는 데이터 규모로 인해)를 액세스하거나 고가용성을 허용하기 위해 추가 에이전트를 설정하기 위해서만 새 에이전트가 필요합니다.

아래 표는 데이터에 연결하는 데 필요한 리소스를 유지 관리하는 데 필요한 구성 빈도와 기술 세트를 요약한 것입니다.

리소스구성 빈도일반 사용자 역할필요한 지식
에이전트드문 듯IT / 네트워크 엔지니어네트워크 및 방화벽 정책; Linux VMs; SSH
소스가끔IT / 네트워크 엔지니어; 데이터 엔지니어네트워크 액세스 디버깅; 자격 증명 관리
동기화자주데이터 엔지니어; 데이터 과학자SQL 쿼리 작성; 파일 관리

고가용성

높은 가용성(HA) 아키텍처를 구축하기 위해 중복 하드웨어를 설정하는 것이 좋습니다. 고가용성은 회복력을 높이고 영업 시간 동안 유지 관리를 위해 다운타임이 없게 합니다.

Foundry는 소스 수준에서 HA를 제공하며, 이는 소스가 여러 에이전트에 할당되면 Foundry가 건강한 에이전트 중 하나에 수집 작업을 발송한다는 의미입니다. 소스 생성 시작 시 고가용성 설정에서 에이전트를 구성하는 것이 강력히 권장됩니다. 생성된 소스에 추가 에이전트를 추가하려면 해당 소스의 자격 증명을 다시 입력해야 합니다.

고가용성을 설정할 때 다음과 같은 모범 사례를 권장합니다.

  • 항상 유사한 하드웨어에서 짝을 이룬 에이전트를 설치합니다.
  • 짝을 이룬 각 에이전트에 유사한 이름을 지정합니다. 예를 들어 agent-1agent-2와 같습니다.
  • 짝을 이룬 모든 에이전트를 모든 소스에 체계적으로 할당합니다.
  • 짝을 이룬 두 에이전트 모두에서 중복되지 않는 업그레이드 창을 구성합니다. 업그레이드 창은 영업일 동안이어야 하며 충분한 숙성 시간을 제공해야 합니다. 이렇게 하면 업데이트와 관련된 예기치 않은 문제가 단일 에이전트로 제한되어 운영자 또는 관리자가 감지할 수 있습니다.

다음 단계

인터넷을 통해 데이터 소스에 액세스하는 데 직접 연결을 사용하려면(예: 공용 REST API 또는 S3 버킷), 직접 연결 설정부터 시작하세요.

조직의 네트워크 내에 있는 데이터 소스에 연결하려면 에이전트 설정부터 시작하세요.