注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

音声を CPU を使用して json に文字起こしする

対応環境: バッチ

音声ファイルを CPU を使用して json に文字起こしします。

式カテゴリー: メディア

引数

  • メディア リファレンス - メディア セット内の音声ファイルへのメディア リファレンスを含む列。
    式<メディア リファレンス>
  • オプション 言語 - 入力ファイルで検出する言語。言語が指定されていない場合、音声の最初の 30 秒から推測されます。
    audio.Enum<アフリカーンス語、アルバニア語、アムハラ語、アラビア語、アルメニア語、アッサム語、アゼルバイジャン語、バシキール語、バスク語、ベラルーシ語、その他多数...>

出力タイプ: 文字列

例 1: 基本ケース

説明: 音声ファイルを文字起こしする 引数値:

  • メディア リファレンス: mediaReference
  • 言語: null
mediaReference出力
{"mimeType":"audio/mpeg","reference":{"type":"mediaSetItem","mediaSetItem":{"mediaSetRid":"ri.mio.main.media-set.a", "mediaItemRid":"ri.mio.main.media-item.a"}}}{"version":1,"segments":[{"id":"a1f69f02-f780-465b-94da-0930e2e2e7d2","channel":"1d38a2f7-e234-419e-...

例 2: 基本ケース

説明: 音声ファイルを文字起こしする 引数値:

  • メディア リファレンス: mediaReference
  • 言語: null
mediaReference出力
{"mimeType":"audio/mpeg","reference":{"type":"mediaSetItem","mediaSetItem":{"mediaSetRid":"ri.mio.main.media-set.a", "mediaItemRid":"ri.mio.main.media-item.a"}}}{"version":1,"segments":[{"id":"a1f69f02-f780-465b-94da-0930e2e2e7d2","channel":"1d38a2f7-e234-419e-...

例 3: Null ケース

引数値:

  • メディア リファレンス: Media Reference
  • 言語: null
mediaReference出力
nullnull