データ統合エクスプレッション文字列を分割

注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

文字列を分割

対応している処理方法: バッチ

指定したサイズと区切り文字で文字列を分割します。 式のカテゴリー: 文字列

定義された引数

  • Expression - ドキュメントのテキストを分割する行が含まれています。
    Expression<String>
  • オプション Chunk overlap - この数値前後で、分割された内容の重複を許可します。0 以上、選択した分割サイズ未満でなければなりません。
    Literal<Integer>
  • オプション Chunk size - この数値前後で、分割を作成します。0 より大きくなければなりません。
    Literal<Integer>
  • オプション Keep separator - 出力された分割に区切り文字を含めます。
    Literal<Boolean>
  • オプション Separators - これらの提供された区切り文字で文字列を分割します。デフォルトの区切り文字は、できるだけ段落、文、単語をまとめて保持する効果があります。
    List<Literal<String>>

出力タイプ: Array<String>

例 1 - 基本ケース

引数の値:

  • Expression: string
  • Chunk overlap: null
  • Chunk size: 10
  • Keep separator: null
  • Separators: null
string:arrow_right:出力
hello[ hello ]
hello world. the quick brown fox jumps over the fence.[ hello, world., the quick, brown fox, jumps, over the, fence. ]
hello world.
the quick brown fox
jumps over the fence.[ hello, world., the quick, brown fox, jumps, over the, fence. ]
hello world.
the quick brown fox
jumps over the fence.[ hello, world., the quick, brown fox, jumps, over the, fence. ]

例 2 - 基本ケース

引数の値:

  • Expression: A quick-brown-fox-jumps over the lazy dog
  • Chunk overlap: null
  • Chunk size: 10
  • Keep separator: false
  • Separators: [

, , ] 出力: [ A, quick-brown-fox-jumps, over the, lazy dog ]


例 3 - 基本ケース

引数の値:

  • Expression: A quick brown fox jumps over the lazy dog
  • Chunk overlap: 5
  • Chunk size: 10
  • Keep separator: null
  • Separators: null 出力: [ A quick, brown fox, fox jumps, over the, the lazy, lazy dog ]

例 4 - 基本ケース

引数の値:

  • Expression: Text1|Text2||Text3
  • Chunk overlap: null
  • Chunk size: 10
  • Keep separator: false
  • Separators: [||, |] 出力: [ Text1, Text2, Text3 ]

例 5 - 基本ケース

引数の値:

  • Expression: Text1|Text2||Text3
  • Chunk overlap: null
  • Chunk size: 10
  • Keep separator: null
  • Separators: [||, |] 出力: [ Text1, |Text2, ||Text3 ]

例 6 - 基本ケース

引数の値:

  • Expression: Text1, Text2

Text3 Text4

  • Chunk overlap: null
  • Chunk size: 256
  • Keep separator: null
  • Separators: null 出力: [ Text1, Text2

Text3 Text4 ]


例 7 - 基本ケース

引数の値:

  • Expression: Text1 Text2

Text3 Text4

  • Chunk overlap: null
  • Chunk size: 10
  • Keep separator: null
  • Separators: null 出力: [ Text1, Text2, Text3, Text4 ]