Contour에서의 데이터 분석13 - 상위 500개 지연 필터링

본 번역은 검증되지 않았습니다. AIP를 통해 영문원문으로부터 번역되었습니다.

13 - 상위 500개 지연 필터링

이 내용은 learn.palantir.com ↗에서도 확인하실 수 있으며, 접근성을 위해 여기에 제공됩니다.

📖 작업 소개

피벗 표표현식 보드를 이용하여 각 루트의 평균 지연 시간을 나타내는 새로운 컬럼을 생성했습니다. 이 정보는 가상의 항공 팀에게 즉시 영향을 미칠 것입니다. 그러나 데이터는 4,000개 이상의 행으로 구성되어 있습니다. 따라서 가장 심각한 지연을 보이는 상위 500개의 루트에 대한 조사를 좁혀보겠습니다.

🔨 작업 지시사항

  1. Contour 경로 하단의 막대에서 변형 보드 카테고리를 클릭하고 표현식 보드를 선택합니다.

  2. 표현식 보드 내에서 새 표현식 작성을 진행합니다.

  3. 새로운 컬럼 추가를 기본 선택으로 두고, 새 컬럼의 이름을 ranking으로 입력합니다. 그런 다음 표현식 에디터(즉, "1" 옆)에 아래 제공된 표현식 코드를 추가하고 적용을 클릭합니다.

    rank() OVER (ORDER BY "average_total_delay" DESC)

  4. 이제 Contour 경로 하단의 막대에서 필터 보드 카테고리를 클릭하고 필터 보드를 선택합니다.

  5. 컬럼 선택... 필드를 클릭하고 ranking을 검색합니다.

  6. equal to라고 적힌 중간 드롭다운을 클릭하고 less than or equal to로 변경합니다.

  7. 마지막으로, 이 행에서 가장 오른쪽 필드를 클릭하여 파라미터 또는 항목 추가하고 값 500을 입력합니다. 저장하기를 클릭합니다.

    ℹ️ 이 작업에서 생성하는 필터 보드에 ⚠️경고 조언 메시지가 나타나는 것은 예상된 것입니다. 이것은 표현식 보드에서 생성하는 ranking 컬럼이 결정론적이지 않기 때문에 발생합니다. ORDER BY 절에서 사용된 컬럼에 "무승부"가 있기 때문에 활성 데이터셋의 각 행에 주어진 숫자 순위가 이 보드가 계산될 때마다 바뀔 수 있습니다. 이것이 바람직하지 않다면, 모든 행에서 고유한 값을 가진 다른 컬럼을 생성하고 순위를 매기는 것으로 이를 해결할 수 있습니다. 이 튜토리얼의 경우, 이런 결정론적이지 않은 상황은 우리의 작업에 영향을 미치지 않을 것입니다.

📚 권장 읽기

Contour에서의 결정론적이지 않은 상황에 대한 자세한 정보는 관련 문서의 이 페이지를 참조하십시오.