이 내용은 learn.palantir.com ↗에서도 확인할 수 있으며, 접근성을 위해 여기에도 제공됩니다.
원시 데이터 값 중 일부는 최적의 형식으로 포맷되어 있지 않습니다. 이 연습에서는 Pipeline Builder 변환을 사용하여 데이터를 전처리합니다. 파이프라인 초기에 수정하려는 이상현상은 다음과 같습니다(하지만 이에 한정되지 않습니다):
flight_alerts_raw
의 flightDate 열은 현재 스트링 유형이지만 날짜 유형이어야 합니다.이전 연습에서 "raw" 파이프라인의 입력을 이 단계의 입력으로 사용하게 됩니다. 현재 Pipeline Builder에서는 지정된 결과물에 변환을 추가할 수 없습니다. 따라서 /preprocessed 폴더 경로에 새로운 Pipeline Builder 아티팩트를 생성하고, 방금 /raw에서 생성한 데이터셋을 입력으로 사용하게 됩니다.
../Datasource Project: Flight Alerts/datasets/preprocessed/
폴더를 엽니다.flight_alerts_datasource_preprocessed
라고 이름을 붙입니다.../raw
폴더에 있는 세 개의 데이터셋을 가져옵니다.