注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

PDF からテキストを抽出

バッチで対応

PDF ファイルのページから生のテキストを抽出します。 表現カテゴリ: メディア

宣言された引数

  • メディア参照 - メディアセット内の PDF ファイルへのメディア参照が含まれる行。
    Expression<Media reference>
  • 任意 終了ページ - ページ範囲の終了、包括的。デフォルトでは、ドキュメントの最後のページです。負のインデックスをサポート。
    Expression<Integer>
  • 任意 開始ページ - ページ範囲の開始、包括的。デフォルトでは、ドキュメントの最初のページ(1)です。
    Expression<Integer>

出力タイプ: Array<String>

例 1 - 基本ケース

引数の値:

  • メディア参照: Media Reference
  • 終了ページ: End Page
  • 開始ページ: Start Page
Media ReferenceStart PageEnd Page:arrow_right:出力
{"mimeType":"application/pdf","reference":{"type":"mediaSetItem","mediaSetItem":{"mediaSetRid":"ri.mio.test.media-set.1","mediaItemRid":"ri.mio.test.media-item.1"}}}12[ 最初のページ, 2つ目のページ ]