注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

PDF からテキストを抽出する

対応: Batch

PDF ファイルのページから生のテキストを抽出します。

式カテゴリ: Media

引数

  • Media reference - メディアセット内の PDF ファイルへのメディアリファレンスを含む列。
    Expression<Media reference>
  • 任意 End page - ページ範囲の終了(含む)。ドキュメントの最後のページがデフォルト。負のインデックスをサポート。
    Expression<Integer>
  • 任意 Start page - ページ範囲の開始(含む)。ドキュメントの最初のページ (1) がデフォルト。
    Expression<Integer>

出力タイプ: Array<String>

例 1: 基本ケース

引数の値:

  • Media reference: Media Reference
  • End page: End Page
  • Start page: Start Page
Media ReferenceStart PageEnd Page出力
{"mimeType":"application/pdf","reference":{"type":"mediaSetItem","mediaSetItem":{"mediaSetRid":"ri.mio.test.media-set.1","mediaItemRid":"ri.mio.test.media-item.1"}}}12[ first page, second page ]