데이터 통합PythonPySpark Reference스트링

본 번역은 검증되지 않았습니다. AIP를 통해 영문원문으로부터 번역되었습니다.

스트링

스트링은 텍스트 데이터를 가리킵니다.

Copied!
1 2 # pyspark.sql의 함수들을 F로 가져옵니다. from pyspark.sql import functions as F

대소문자 변환

  • F.initcap(col)
  • F.lower(col)
  • F.upper(col)

연결, 분할

  • F.concat(*cols)
  • F.concat_ws(sep, *cols)
  • F.split(str, pattern)

부분 문자열

  • F.instr(str, substr)
  • F.locate(substr, str, pos=1)
  • F.substring(str, pos, len)
  • F.substring_index(str, delim, count)

정리, 채우기

  • F.lpad(col, len, pad)
  • F.ltrim(col)
  • F.rpad(col, len, pad)
  • F.rtrim(col)
  • F.trim(col)

정규 표현식

  • F.regexp_extract(str, pattern, idx)
  • F.regexp_replace(str, pattern, replacement)

기타

  • F.ascii(col)
  • F.base64(col)
  • F.bin(col)
  • F.conv(col, fromBase, toBase)
  • F.decode(col, charset)
  • F.encode(col, charset)
  • F.format_number(col, d)
  • F.format_string(format, *cols)
  • F.hex(col)
  • F.length(col)
  • F.levenshtein(왼쪽, 오른쪽)
  • F.repeat(col, n)
  • F.reverse(col)
  • F.translate(srcCol, 일치, 대체)
  • F.unbase64(col)
  • F.unhex(col)