동기화는 커넥터로부터 특정 데이터를 읽고 Foundry에 가져오는 작업입니다. 예를 들어, 여러 개의 테이블이 포함된 관계형 데이터베이스 소스가 있다면, 특정 테이블을 Foundry에 가져오도록 동기화를 설정할 수 있습니다.
동기화를 설정하면 선택한 프로젝트 내 Foundry 데이터셋이 생성됩니다. 실제로 데이터 소스에서 데이터셋으로 데이터를 동기화하는 것은 빌드를 통해 이루어집니다. 빌드는 수동으로 실행할 수도 있지만, 대개는 일정을 사용하여 관리됩니다.
동기화를 생성하기 위해서는 다음과 같은 단계가 필요합니다:
먼저, Foundry로 동기화하려는 데이터를 결정해야 합니다. 이를 위해, Data Connection에서 커넥터를 선택한 다음, 오른쪽 상단의 기본 작업을 선택합니다:
커넥터 유형이 소스 탐색을 지원하는 경우, 동기화 가능한 데이터를 보여주는 탐색기 페이지로 이동합니다. 표시되는 탐색 뷰는 사용 중인 커넥터 유형에 따라 다릅니다. 예를 들어, 파일 시스템 커넥터는 파일 경로를 찾아보고 필터를 설정할 수 있게 해주고, JDBC 커넥터는 테이블을 탐색하고 SQL 쿼리를 지정할 수 있습니다. 현재 소스 탐색은 직접 연결에는 사용할 수 없습니다.
아래에서는 두 가지 일반적인 커넥터 유형에 대한 예시 동기화 구성 경로를 살펴봅니다:
파일 시스템 소스 유형을 탐색할 때, 파일 시스템을 검색하여 동기화할 파일의 디렉토리를 선택할 수 있으며, 필터를 정의할 수도 있습니다.
사용 가능한 모든 옵션은 필터 문서를 참조하세요.
동기화할 디렉토리를 선택하고 필터를 적용한 후, 미리보기 일치를 선택하여 동기화에 포함될 파일을 확인합니다. 그런 다음, **동기화 생성...**을 선택하여 진행합니다. 다음 단계는 동기화 위치 정의를 참조하세요.
JDBC 탐색 뷰에서는 단일 데이터셋에 대한 동기화를 생성하거나 한 번에 여러 데이터셋에 대한 동기화를 대량 생성할 수 있습니다.
각 테이블에서 SELECT *
입니다. 선 쿼리를 사용하면, 실제 쿼리를 실행하기 전에 데이터베이스를 새로 고침하거나 필터 기준을 추가하는 등의 SQL 쿼리를 먼저 실행할 수 있습니다.소스 탐색을 사용하든 사용하지 않든, Foundry에서 동기화된 데이터셋을 저장할 위치를 선택해야 합니다. 데이터셋의 위치는 프로젝트 수준 권한에 따라 결과 데이터에 대한 접근 권한을 결정합니다.
동기화 데이터셋을 생성할 때 권장되는 모범 사례는 커넥터와 함께 저장하는 것입니다. 이를 통해 주어진 커넥터로부터 모든 데이터에 일관되게 권한을 부여하는 패턴을 사용할 수 있어 데이터 파이프라인 생성에 도움이 됩니다. 데이터 파이프라인을 위한 권장 프로젝트 구조에 대해 자세히 알아보세요.
동기화를 생성할 때 소스 탐색을 사용한 경우, 프로젝트를 선택하라는 메시지가 표시되는 동기화 생성... 버튼을 선택합니다. 소스 탐색을 사용하지 않은 경우, 동기화 페이지의 왼쪽 상단에서 Sync to 옵션을 선택합니다. 대화 상자를 사용하여 데이터셋을 저장할 프로젝트를 선택한 다음, 저장을 선택합니다.
동기화를 생성하면, 동기화 페이지로 이동하고 두 가지 주요 동기화 구성이 사용 가능합니다:
출력 데이터셋 위치를 선택하는 것 외에도, 동기화 페이지에서 추가 옵션을 구성할 수 있습니다:
SNAPSHOT
) 또는 증분적으로 추가되는지(APPEND
) 결정합니다. 점진적 동기화에 대해 자세히 알아보세요.이제 동기화를 생성했으므로, 동기화 페이지 왼쪽 상단에 있는 출력 데이터셋 이름을 선택합니다. 이렇게 하면 새 데이터셋에 대한 데이터셋 미리보기로 이동합니다. 지금 데이터를 가져오고 싶다면, 우선 오른쪽 상단의 빌드 버튼 옆 드롭다운을 선택합니다. Force 체크박스를 선택한 다음, 빌드 버튼을 선택하여 데이터 소스에서 Foundry로 데이터를 동기화합니다.
이 튜토리얼에서는 커넥터에서 Foundry 데이터셋으로 데이터를 가져오기 위해 동기화를 생성하는 방법을 배웠습니다. 추천하는 추가 리소스는 다음과 같습니다: