注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。
データセットプレビューセクションから、Parsing options -> Drop jagged rows 機能を使用して不正な行を削除します。
タイムスタンプ: 2024年3月1日
すべてのデータセットを無制限の入力を受け取るユニオンボードに接続するか、すべての入力をドラッグ選択してからユニオントランスフォームオプションをクリックします。
タイムスタンプ: 2024年4月11日
LLM は行ごとに呼び出されますが、操作は速度を向上させるためにエグゼキュータ間で並列化されています。
タイムスタンプ: 2024年3月28日
はい、Pipeline Builder では、PDF text extraction トランスフォームで OCR (光学文字認識) 抽出方法を使用して PDF 内の画像からテキストを抽出できます。
タイムスタンプ: 2024年4月10日
Time bounded drop duplicates 関数は、重複かどうかに関係なく、構成されたイベントタイムウィンドウより遅れて到着した行を削除します。
タイムスタンプ: 2024年3月20日
はい、Pipeline Builder では新しい出力でデータセットを上書きすることができます。これは既存のデータセットの所有権を新しい出力に変更する一度限りのアクションです。必要な権限を持ち、必要な手順に従えば、パイプライン B の出力として希望するデータセットを構成できます。すべてのパイプライン出力スキーマが入力トランスフォームノードスキーマと一致することが重要です。そうでないとエラーが発生し、パイプラインのデプロイに失敗します。
タイムスタンプ: 2024年4月13日
Pipeline Builder でカスタムユーザー定義関数 (UDF) を実装するには、UDF の作成と使用に関するドキュメントおよび Pipeline Builder で任意の Java コードを実行する方法を参照してください。
タイムスタンプ: 2024年4月19日
データセットプレビューの Edit schema オプションで Row number を有効にします。
タイムスタンプ: 2024年4月18日
JSON to string 式を使用して struct 列を JSON 文字列に変換できます。
タイムスタンプ: 2024年6月14日
プレビューで 入力サンプリング戦略 が適用されている場合、不一致が生じる可能性があります。また、非決定的なトランスフォームが行数に影響を与えることも考慮してください。
タイムスタンプ: 2024年6月28日
チェックポイントデータセットを作成したパイプラインをゴミ箱に移動すると、チェックポイントデータセットもゴミ箱に移動されます。
タイムスタンプ: 2024年4月24日
null 文字列値を特定の文字列 (たとえば "no data") にマッピングする方法はありますか?Pipeline Builder パイプラインでこれを実現する方法は 2 つあります:
Coalesce 関数を使用します。たとえば、A = coalesce(A, "no data") とします。A が null の場合、"no data" が返されます。Case ボードを使用します。どちらの方法でも、null 値を指定された文字列にマッピングできます。
タイムスタンプ: 2024年7月11日
null 値を補完する方法はありますか?はい、Apply To Multiple Columns トランスフォームを使用して、異なる列にわたる null 値を補完できます。
タイムスタンプ: 2024年4月24日