注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

画像からテキストを抽出する (OCR を使用)

サポート対象: Batch

メディアセット内の画像ファイルに対して OCR を実行し、テキストを抽出します。

式のカテゴリ: Media

宣言された引数

  • 検出する言語 - 入力ファイルで検出する言語。
    Set<Enum<Afrikaans, Albanian, Amharic, Arabic, Armenian, Assamese, Azerbaijani, Azerbaijani - Cyrilic, Basque, Belarusian, and more ...>>
  • メディアリファレンス - メディアセット内の画像ファイルへのメディアリファレンスを含む列。
    Expression<Media reference>
  • OCR 出力形式 - 出力は文字列になります。
    Enum<Text, hOCR>
  • 検出するスクリプト - 入力ファイルで検出するスクリプト。
    Set<Enum<Arabic, Armenian, Bengali, Canadian Aboriginal, Cherokee, Cyrillic, Devanagari, Ethiopic, Fraktur, Georgian, and more ...>>
  • オプション エラーハンドリング - 処理に失敗した入力に対するパイプラインの動作を決定します。デフォルトではすぐに失敗します。
    Enum<Fail fast, NULL on error>

出力タイプ: String

例 1: 基本ケース

引数の値:

  • 検出する言語: {ENG}
  • メディアリファレンス: mediaReference
  • OCR 出力形式: {TEXT}
  • 検出するスクリプト: {ARABIC}
  • エラーハンドリング: FAIL_FAST
mediaReferenceOutput
{"mimeType":"image/png","reference":{"type":"mediaSetItem","mediaSetItem":{"mediaSetRid":"ri.mio.main.media-set.a", "mediaItemRid":"ri.mio.main.media-item.a"}}}This text came from the image in the media set.