跳转至

Transcribe audio into text(将音频转录为文本)

Supported in: Batch, Faster

Transcribes an audio file into text.

Expression categories: Media

Declared arguments

  • Media reference: The column containing media references to audio files in a media set.
    Expression\
  • optional Language: The language to detect in the input file. If no language is provided, it will be inferred from the first 30 seconds of audio.
    Enum\
  • optional Output mode: Choose between simply returning the output or returning a struct, containing both the output and any errors.
    Enum\
  • optional Performance mode: The performance mode to use when running transcription. If no mode is provided, we will default to the more economical option.
    Enum\

Output type: String | Struct\

Examples

Example 1: Base case

Description: Transcribe the audio file

Argument values:

  • Media reference: mediaReference
  • Language: null
  • Output mode: null
  • Performance mode: null
mediaReference Output
{"mimeType":"audio/mpeg","reference":{"type":"mediaSetItem","mediaSetItem":{"mediaSetRid":"ri.mio.main.media-set.a", "mediaItemRid":"ri.mio.main.media-item.a"}}} This is an example transcription from Whisper

Example 2: Null case

Argument values:

  • Media reference: Media Reference
  • Language: null
  • Output mode: null
  • Performance mode: null
mediaReference Output
null null


中文翻译

将音频转录为文本

支持模式:批量(Batch)、快速(Faster)

将音频文件转录为文本。

表达式类别: 媒体(Media)

声明的参数

  • 媒体引用(Media reference): 包含媒体集中音频文件媒体引用的列。
    表达式\
  • 可选 语言(Language): 输入文件中要检测的语言。若未提供语言,将根据音频前30秒自动推断。
    枚举\<南非荷兰语, 阿尔巴尼亚语, 阿姆哈拉语, 阿拉伯语, 亚美尼亚语, 阿萨姆语, 阿塞拜疆语, 巴什基尔语, 巴斯克语, 白俄罗斯语, 及其他...>
  • 可选 输出模式(Output mode): 选择仅返回输出结果,或返回包含输出结果及错误信息的数据结构(Struct)。
    枚举\<简单(Simple), 包含错误(With errors)>
  • 可选 性能模式(Performance mode): 运行转录时使用的性能模式。若未提供模式,将默认采用更经济的选项。
    枚举\<更经济(More economical), 更高性能(More performant)>

输出类型: 字符串(String) | 数据结构(Struct)\

示例

示例1:基础案例

描述: 转录音频文件

参数值:

  • 媒体引用: mediaReference
  • 语言: null
  • 输出模式: null
  • 性能模式: null
mediaReference 输出(Output)
{"mimeType":"audio/mpeg","reference":{"type":"mediaSetItem","mediaSetItem":{"mediaSetRid":"ri.mio.main.media-set.a", "mediaItemRid":"ri.mio.main.media-item.a"}}} 这是来自Whisper的示例转录文本

示例2:空值案例

参数值:

  • 媒体引用: 媒体引用(Media Reference)
  • 语言: null
  • 输出模式: null
  • 性能模式: null
mediaReference 输出(Output)
null null