Contour에서의 데이터 분석8 - 데이터 풍부화

본 번역은 검증되지 않았습니다. AIP를 통해 영문원문으로부터 번역되었습니다.

8 - 데이터 풍부화

이 내용은 learn.palantir.com ↗에서도 이용 가능하며 접근성을 위해 여기에 제공됩니다.

📖 작업 소개

데이터셋을 검사하다 보니 지연에 관한 정보가 없습니다. 경로에 대한 정보는 유용하지만 아직 비즈니스 문제를 해결하지 못했습니다. 비행 지연 원인에 대한 패턴을 찾으려고 합니다. 따라서 지연 정보를 추가하여 데이터셋을 풍부하게 만들겠습니다.

🔨 작업 지시사항

  1. 액션 리본에서 조인 카테고리를 클릭합니다.

  2. 조인 보드를 선택합니다.

    ℹ️ Contour의 성능을 최적화하기 위해 데이터를 최대한 필터링한 후에 조인을 수행하도록 합니다.

  3. 조인 유형을 열 추가로 설정한 채 두십니다.

  4. 데이터셋 선택을 클릭한 다음 **데이터셋 선택...**을 클릭합니다.

  5. 아래의 클릭 경로를 따라 지연 데이터셋으로 이동합니다:

    • 모든 프로젝트
    • /Foundry Training and Resources
    • /Example Data
    • /Aviation Ontology
    • /delays
  6. 선택하기를 클릭합니다.

  7. 지연 데이터셋을 선택한 후 해당 데이터셋에서 관련 열을 가져옵니다. 열 추가 옵션에서 두 개의 열을 선택합니다:

    • dep_delay
    • arr_delay
  8. 아래의 일치 조건 섹션에서 모두 일치를 선택하고 ➕ 일치 조건 추가를 클릭합니다. 왼쪽 및 오른쪽 필드 모두에 flight_id를 선택합니다.

  9. 저장하기를 클릭합니다.

📚 추천 읽기

분석을 통해 확인한 바와 같이 조인은 관련되고 영향력 있는 데이터 포인트를 현재 데이터셋에 포함시키는 방법을 통해 데이터셋을 풍부하게 만드는 방법입니다. 조인에 대해 좀 더 알아보세요.