跳转至

Extract rows from a CSV file(从CSV文件中提取行(Extract rows from a CSV file))

Supported in: Batch

Reads a dataset of files and parses each CSV file into rows.

Transform categories: File

Declared arguments

  • Dataset: Dataset of files to process.
    Files
  • Schema: Schema definition used when parsing the CSV files.
    Type\
  • optional Allow multiline: Specifies whether the parsing should allow for rows split across multiple lines. The default is set to false.
    Literal\
  • optional Column delimiter: Provides the delimiter used in the CSV file. The default delimiter is the comma.
    Literal\
  • optional Custom escape character: Sets a single character used for escaping quotes inside an already quoted value.
    Literal\
  • optional Custom quote character: Sets a single character for escaping quoted values where the separator can be part of the value. For reading, if you would like to turn off quotations, set the value to an empty string. The default value is the quote (").
    Literal\
  • optional Encoding: Character encoding of the input files.
    Enum\
  • optional Include last modified timestamp: Specifies whether the output dataset should contain the file's last modified timestamp. The default value is false.
    Literal\
  • optional Includes header: Specifies whether the CSV file contains the header. The default value is false.
    Literal\

中文翻译


从CSV文件中提取行(Extract rows from a CSV file)

支持:批处理模式(Batch)

读取文件数据集并将每个CSV文件解析为行。

转换类别:文件(File)

声明参数(Declared arguments)

  • 数据集(Dataset): 待处理的文件数据集。
    文件(Files)
  • 模式(Schema): 解析CSV文件时使用的模式定义。
    类型\
  • 可选 允许多行(Allow multiline): 指定解析时是否允许行跨越多行。默认值为false。
    字面量\
  • 可选 列分隔符(Column delimiter): 指定CSV文件中使用的分隔符。默认分隔符为逗号。
    字面量\
  • 可选 自定义转义字符(Custom escape character): 设置用于转义已引用值内部引号的单个字符。
    字面量\
  • 可选 自定义引号字符(Custom quote character): 设置用于转义引用值的单个字符,其中分隔符可以是值的一部分。读取时,如需关闭引号功能,请将值设置为空字符串。默认值为双引号(")。
    字面量\
  • 可选 编码(Encoding): 输入文件的字符编码。
    枚举\
  • 可选 包含最后修改时间戳(Include last modified timestamp): 指定输出数据集是否应包含文件的最后修改时间戳。默认值为false。
    字面量\
  • 可选 包含表头(Includes header): 指定CSV文件是否包含表头。默认值为false。
    字面量\