이 튜토리얼에서는 Foundry 스트리밍과 Pipeline Builder를 사용하여 센서 온도 정보를 담은 단일 데이터셋 결과물을 가진 간단한 파이프라인을 생성합니다. Foundry에서 스트림을 생성하고, 그 스트림에 레코드를 푸시하고, Pipeline Builder에서 그들을 변환하는 방법을 배울 수 있습니다.
먼저, 새로운 스트림을 생성해야 합니다.
정의 페이지에서, 처리량은 Normal로 선택하고 기본 스키마를 다음과 같이 정의합니다: sensor_id: 스트링
, temperature: Double
.
이제 스트림을 연결할 준비가 되었습니다. 이 시점에서, 소스와 함께 스트리밍 데이터 수집 작업을 설정할 수 있었을 것입니다. 이 튜토리얼에서는 대신 Curl을 사용하여 수동으로 스트림에 레코드를 푸시합니다.
개인 토큰으로 테스트를 선택하고 잠시 사용 가능한 개인 토큰을 생성하기 위한 화면 안내를 따릅니다.
개인 토큰은 프로덕션 파이프라인에 사용해서는 안 됩니다. 프로덕션 파이프라인은 OAuth 토큰 워크플로를 사용해야 합니다.
몇 초 내에 페이지의 스트림 뷰어에 레코드가 나타날 것입니다:
이제 실시간으로 스트리밍 데이터를 수집했습니다. 이제 그 데이터를 변환해봅시다.
이렇게 하면 입력 스트림에 대한 파이프라인이 생성되고, 그래프에 표시됩니다.
입력 스트림 노드를 선택하면 데이터의 미리보기가 표시됩니다. 미리보기는 스트림의 차가운 저장소 뷰에서 실행되므로, 스트림에서 레코드가 표시되기 전에 지연될 수 있습니다.
그래프에서 입력 스트림 노드를 클릭하고, 변환 액션을 선택합니다(입력 노드 옆의 파란색 T 아이콘).
이렇게 하면 스트림의 열 입력 유형에 기반한 현재 지원되는 모든 변환의 목록이 열립니다. 이 튜토리얼에서는 모든 sensor_ids
를 대문자로 변환하고, 그들에서 공백을 제거하고, 세 도를 초과하는 온도에 따라 필터링합니다.
sensor_id
열을 선택한 후 적용을 클릭합니다.sensor_id
열을 선택하고, 적용을 클릭합니다.temperature
열을 선택하고, 필터를 3
보다 큰으로 설정하고, 적용을 선택합니다.변경 사항을 배포하지 않고 저장하면, 파이프라인 로직이 최신 변경 사항으로 업데이트되지 않습니다. 변환 로직의 변경 사항을 캡처하려면 파이프라인을 배포해야 합니다.
이렇게 하면 변환의 출력 스트림이 있는 스트림 미리보기 페이지로 이동합니다.
스트리밍 클러스터가 시작하는 데 약 1분 정도 걸리므로 즉시 레코드가 표시되지 않을 수 있습니다. 그러나 실행되면 클러스터는 모든 새 레코드를 실시간으로 처리합니다.
이제 간단한 스트리밍 파이프라인을 생성하는 방법을 알게 되었으므로, 스트림을 관리하는 방법에 대해 더 알아보기 위해 실패하는 스트림 디버그하는 방법을 탐색해보세요. 더 고급 변환 기능에 대해 알아보려면 Pipeline Builder에 대해 더 알아보세요.