Foundry에서의 데이터 분석 소개2 - 테이블 형식 데이터 정의

본 번역은 검증되지 않았습니다. AIP를 통해 영문원문으로부터 번역되었습니다.

2 - 테이블 형식 데이터 정의

이 내용은 learn.palantir.com ↗에서도 확인할 수 있으며 접근성을 위해 여기에 제공됩니다.

Foundry 데이터셋은 사용자 정의 로직으로 작성된 열, 행, 스키마, 값의 모음입니다. 이 로직이 실행되면 업계의 대부분의 데이터 플랫폼에서 공통적으로 사용되는 테이블 형식 구조를 생성하기 위해 여러 트랜잭션 유형 중 하나를 실행합니다.

배경에서 Foundry는 데이터셋을 더 작은 파일로 분할하고 백업 파일 시스템에 저장합니다. 데이터셋 빌드가 실행되면 (예: 일정에 따라) 입력(백업 파일 시스템의 분할된 데이터셋 파일)을 조립하고 사용자 정의 로직을 실행하여 결과물을 생성합니다.

📚 추천 독서 (~5분 소요)

잠시 시간을 내어 Foundry 데이터셋 구조에 대한 이 개요를 읽어 보세요. 이 튜토리얼의 나머지 부분에서는 이러한 용어와 개념에 익숙하다고 가정합니다.

분산 데이터의 아키텍처는 표준 관계형 데이터베이스 테이블과 다르지만, Foundry의 분석 애플리케이션에서 대부분 추상화되어 있습니다. 그러나 Foundry에서 데이터셋이 어떻게 구성되는지에 대한 대략적인 이해는 분석의 성능을 최적화하고 데이터셋이 어떻게 최신 상태를 유지하는지 이해하는 데 도움이 될 수 있습니다. Foundry에서의 데이터셋이 트랜잭션과 여러 입력 데이터셋을 활용하는 방법에 대한 예는 아래 이미지를 참조하세요.

데이터셋 A와 데이터셋 B가 트랜잭션에 영향을 받아 결과물 데이터셋 파일을 생성하는 아키텍처 플로우차트.