IVF

Chasing Dreams

임팔라 문자열 함수

  • STRING인수를 허용하는 모든 함수는 임팔라 2.0 에 도입 된VARCHARCHAR유형도 허용합니다.
  • VARCHAR또는CHAR값이 문자열 값을 반환하는 함수에 전달될 때마다 반환 형식은STRING로 정규화됩니다. 예를 들어STRING,VARCHARCHAR인수가 혼합된concat()을 호출하면STRING결과가 생성됩니다.

함수 참조:

임팔라는 다음과 같은 문자열 함수를 지원합니다:

  • ASCII
  • BASE64DECODE
  • BASE64ENCODE
  • BTRIM
  • CHAR_LENGTH
  • CHR
  • CONCAT
  • CONCAT_WS
  • FIND_IN_SET
  • GROUP_CONCAT
  • INITCAP
  • INSTR
  • JARO_DISTANCE, JARO_DIST
  • JARO_SIMILARITY,JARO_SIM
  • JARO_WINKER_DISTANCE,JW_DST
  • JARO_WINKER_SIMILARITY,JW_SIM
  • 왼쪽
  • 길이
  • LEVENSHTEIN,LE_DST
  • 를 찾
  • 낮은 LCASE
  • LPAD
  • LTRI
  • PARSE_URL
  • REGEXP_ESCAPE
  • REGEXP_EXTRACT
  • REGEXP_LIKE
  • REGEXP_REPLACE
  • 반복
  • 바꾸기
  • 오른쪽
  • RPAD
  • 공간
  • SPLIT_PART
  • STRLEFT
  • STRRIGHT
  • SUBSTR,하위 문자열
  • 번역
  • UPPER,UCASE

ASCII(STRING str)목적:반환합니다 숫자를 ASCII 코드의 첫 번째 문자의 인수입니다.

반환 유형: 예를 들어,문자열은 다음과 같습니다.: STRING

사용 참고 사항:

함수BASE64ENCODE()BASE64DECODE()는 일반적으로 저장 또는 전송에 문제가있는 임팔라 테이블 문자열 데이터에 저장하기 위해 조합하여 사용됩니다. 예를 들어,이러한 함수를 사용하여 다른 인코딩을 사용하는 문자열 데이터를 저장하거나 파티션 키 열과 같이 아스키 값이 필요한 컨텍스트에서 값을 변환할 수 있습니다. 기본 64 인코딩된 값은 인코딩되지 않은 문자열 값으로 해당 함수를 호출할 때와LENGTH(),MAX()MIN()과 같은 문자열 함수에 대해 다른 결과를 생성합니다.

BASE64ENCODE()에서 생성된 모든 반환 값은 길이가 4 바이트의 배수입니다. BASE64DECODE()에 제공된 모든 인수 값도 길이가 4 바이트의 배수여야 합니다. 그렇지 않으면 기본 64 인코딩된 값의 길이가 다른 경우 후행=문자로 채워져 4 바이트의 배수인 길이에 도달할 수 있습니다.

BASE64DECODE()에 대한 인수 문자열이 허용되는 문자 집합과 같은 임팔라 구현의 제약 조건에 따라 유효한 기준 64 인코딩된 값을 나타내지 않으면 함수는NULL를 반환합니다. 예를 들면 다음과 같습니다.

예:

:STRING

사용 참고 사항:

함수BASE64ENCODE()BASE64DECODE()는 일반적으로 저장 또는 전송에 문제가있는 임팔라 테이블 문자열 데이터에 저장하기 위해 조합하여 사용됩니다. 예를 들어,이러한 함수를 사용하여 다른 인코딩을 사용하는 문자열 데이터를 저장하거나 파티션 키 열과 같이 아스키 값이 필요한 컨텍스트에서 값을 변환할 수 있습니다. 기본 64 인코딩된 값은 인코딩되지 않은 문자열 값으로 해당 함수를 호출할 때와LENGTH(),MAX()MIN()과 같은 문자열 함수에 대해 다른 결과를 생성합니다.

BASE64ENCODE()에서 생성된 모든 반환 값은 길이가 4 바이트의 배수입니다. BASE64DECODE()에 제공된 모든 인수 값도 길이가 4 바이트의 배수여야 합니다. 그렇지 않으면 기본 64 인코딩된 값의 길이가 다른 경우 후행=문자로 채워져 4 바이트의 배수인 길이에 도달할 수 있습니다. 목적:STRING값의 시작과 끝에서 하나 이상의 문자 인스턴스를 모두 제거합니다. 기본적으로 공백만 제거합니다. 비-NULL선택적 두 번째 인수를 지정하면 함수는 문자열의 시작과 끝에서 해당 두 번째 인수에 있는 모든 문자를 제거합니다.

반환 유형: STRING

예:

다음 예제에서는 기본btrim()동작과 선택적 두 번째 인수를 지정할 때 변경되는 내용을 보여 줍니다. 모든 예제에서는btrim()결과에서 선행 또는 후행 공백을 볼 수 있도록 출력 값을으로 구분합니다. 기본적으로 함수는 선행 및 후행 공백의 수를 제거합니다. 두 번째 인수가 지정되면 두 번째 인수에 있는 모든 문자 수가 입력 문자열의 시작과 끝에서 제거됩니다; 이 경우 공백은 제거되지 않으며(두 번째 인수의 일부가 아닌 경우)문자열의 시작 부분이나 끝에 올바르게 오지 않으면 문자의 인스턴스가 제거되지 않습니다.

문자_길이(문자열),문자_길이(문자열)목적:인수 문자열의 문자 길이를 반환합니다.length()함수의 별칭입니다. 목적:10 진수 코드 포인트 값으로 지정된 문자를 반환합니다. 결과 문자의 해석 및 표시는 시스템 로캘에 따라 다릅니다. 임팔라 문자열 값의 일관된 처리는 아스키 범위 내의 값에 대해서만 보장되므로 아스키 문자에 해당하는 값에만 이 함수를 사용하십시오. 특히 255 보다 큰 매개 변수 값은 빈 문자열을 반환합니다.

반환 유형: STRING

사용 참고:문자를 숫자 아스키 코드로 변환하는ascii()함수의 역수로 사용할 수 있습니다. 예:

예:

SELECT chr(65);+---------+| chr(65) |+---------+| A |+---------+SELECT chr(97);+---------+| chr(97) |+---------+| a |+---------+

연결(문자열 ㅏ,문자열 비…)목적:함께 결합 된 모든 인수 값을 나타내는 단일 문자열을 반환합니다.

인수가NULL이면 함수는NULL를 반환합니다.

반환 유형: STRING

사용 참고 사항:concat()concat_ws()은 동일한 행 내의 여러 열의 값을 연결하는 데 적합하며group_concat()은 서로 다른 행의 값을 결합합니다. 문자열은 다음과 같습니다…)목적:지정된 구분 기호로 구분 된 두 번째 및 다음 인수 값을 나타내는 단일 문자열을 반환합니다.

인수가NULL이면 함수는NULL를 반환합니다.

반환 유형: STRING

사용법 주: concat()concat_ws()은 같은 행 내에서 여러 열의 값을 연결하는 데 적합하고group_concat()은 서로 다른 행의 값을 함께 조인합니다. 목적:쉼표로 구분된 문자열 내에서 지정된 문자열의 첫 번째 발생 위치(1 부터 시작)를 반환합니다. 인수가NULL인 경우NULL,검색 문자열을 찾을 수 없는 경우 0 또는 검색 문자열에 쉼표가 포함된 경우 0 을 반환합니다. 다음 예제에서는 다음과 같이 설명합니다.: 결과 집합의 각 행에 대해 함께 연결된 인수 값을 나타내는 단일 문자열을 반환합니다. 선택적 구분 기호 문자열을 지정하면 연결된 각 값 쌍 사이에 구분 기호가 추가됩니다.

반환 유형: STRING

사용 참고 사항:concat()concat_ws()은 동일한 행 내의 여러 열의 값을 연결하는 데 적합하며group_concat()은 서로 다른 행의 값을 결합합니다.

기본적으로 전체 결과 집합을 포함하는 단일 문자열을 반환합니다. 결과 집합에 다른 열이나 값을 포함하거나 행 하위 집합에 대해 연결된 문자열을 여러 개 생성하려면 쿼리에GROUP BY절을 포함합니다.

엄밀히 말하면group_concat()은 집계 함수이지이 목록의 다른 함수와 같은 스칼라 함수가 아닙니다. 자세한 내용 및 예제는GROUP_CONCAT함수를 참조하십시오. 목적:각 단어의 첫 글자가 대문자이고 다른 모든 글자가 소문자로 입력된 문자열을 반환합니다.

반환 유형: STRING

예::

INITCAP("i gOt mY ChiCkeNs in tHe yard.") 반환"I Got My Chickens In The Yard.". 목적:더 긴 문자열 내에서 하위 문자열의 첫 번째 발생 위치(1 부터 시작)를 반환합니다.

반환 유형: INT

사용 참고 사항:

선택적 세 번째 및 네 번째 인수를 사용하면 왼쪽에서 시작하는 첫 번째 인스턴스가 아닌 하위 인스턴스의 인스턴스를 찾을 수 있습니다. 목적:두 입력 문자열 사이의 자로 거리를 반환합니다. 자로 거리는 두 문자열 사이의 유사성을 측정 한 것으로JARO_SIMILARITY(),즉(1-JARO_SIMILARITY())의 보완 적입니다.

반환 유형: DOUBLE

사용 참고 사항:

두 입력 문자열이 동일한 경우 함수는 0.0 을 반환합니다.

입력 문자열 사이에 일치하는 문자가 없으면 함수는 1.0 을 반환합니다.

입력 문자열 중 하나가NULL이면 함수는NULL를 반환합니다.

두 입력 문자열의 길이가 255 자보다 크면 함수는 오류를 반환합니다. 목적:두 문자열의 자로 유사성을 반환합니다. 두 문자열의 자로 유사성이 높을수록 문자열이 더 유사합니다.

반환 유형: DOUBLE

사용 참고 사항:

두 입력 문자열이 동일한 경우 함수는 1.0 을 반환합니다.

입력 문자열 사이에 일치하는 문자가 없으면 함수는 0.0 을 반환합니다.

입력 문자열 중 하나가NULL이면 함수는NULL를 반환합니다.

두 입력 문자열의 길이가 255 자보다 크면 함수는 오류를 반환합니다. 목적:두 개의 입력 문자열의 자로-윙클러 거리를 반환합니다. 그것은JARO_WINKLER_SIMILARITY(),즉 1-JARO_WINKLER_SIMILARITY()의 보완 적입니다.

반환 유형: DOUBLE

사용 참고 사항:

두 입력 문자열이 동일한 경우 함수는 0.0 을 반환합니다.

입력 문자열 사이에 일치하는 문자가 없으면 함수는 1.0 을 반환합니다.

함수는 다음과 같은 경우에 오류를 반환합니다.

  • 두 입력 문자열의 길이가 255 자보다 큽니다.
  • 스케일 화 인자<0.0 또는 스케일 화 인자> 0.25

입력 문자열 중 하나가NULL이면 함수는NULL를 반환합니다.

기본 배율 인자는 0.1 입니다.

프리픽스 가중치는 자로 거리가 선택 사양인 부스트점검을 초과하는 경우에만 적용됩니다. 기본값은 0.7 입니다. 목적:두 입력 문자열 사이의 자로-윙클러 유사성을 반환합니다. 자로-윙클러 유사성은 접두사 가중치를 사용,배율 인자에 의해 지정,이는 세트 접두사 길이에 대해 처음부터 일치하는 문자열에 더 유리한 등급을 제공합니다,최대 네 개의 문자까지.

자로 또는 자로-윙클러 함수를 사용하여 비교적 짧은 문자열에서 퍼지 일치를 수행합니다.

반환 유형: DOUBLE

사용 참고 사항:

두 입력 문자열이 동일하면 함수는 1.0 을 반환합니다.

입력 문자열 사이에 일치하는 문자가 없으면 함수는 0.0 을 반환합니다.

함수는 다음과 같은 경우에 오류를 반환합니다.

  • 두 입력 문자열의 길이가 255 자보다 큽니다.
  • 스케일 화 인자<0.0 또는 스케일 화 인자> 0.25

입력 문자열 중 하나가NULL이면 함수는NULL를 반환합니다.

기본 배율 인자는 0.1 입니다.

접두사 가중치는 자로-유사성이 선택 사항인 부스트레스홀드를 초과하는 경우에만 적용됩니다. 기본값은 0.7 입니다.

왼쪽(문자열,숫자 _차)STRLEFT()함수를 참조하십시오. 길이(문자열)목적:인수 문자열의 문자 길이를 반환합니다. 목적:두 입력 문자열 사이의 레벤스테인 거리를 반환합니다. 두 문자열 사이의 수평 거리는 한 문자열을 다른 문자열로 변환하는 데 필요한 최소 단일 문자 편집 수입니다. 이 함수는 입력 문자열이 얼마나 다른지 나타냅니다.

반환 유형:INT

사용 참고:

입력 문자열이 같으면 함수는 0 을 반환합니다.

두 입력 모두 255 자를 초과하면 함수는 오류를 반환합니다.

입력 문자열이NULL인 경우 함수는NULL를 반환합니다.

한 입력 문자열의 길이가 0 이면 함수는 다른 문자열의 길이를 반환합니다.

예:

LEVENSHTEIN ('welcome', 'We come')은 2 를 반환하고,먼저’w‘을’W‘로 바꾼 다음’l‘을 공백 문자로 바꿉니다. 목적:특정 위치 다음에 선택적으로 더 긴 문자열 내에서 하위 문자열의 첫 번째 발생 위치(1 부터 시작)를 반환합니다.

반환 유형:INT

낮은(문자열),케이스(문자열)목적:모든 소문자로 변환 인수 문자열을 반환합니다.

반환 유형: STRING

사용 노트:

임팔라 2.5 이상에서는ILIKE또는IREGEXP연산자를 대신 사용하여 많은UPPER()LOWER()호출을 사용하여 대소문자를 구분하지 않는 비교를 수행하는 쿼리를 단순화할 수 있습니다. 목적:첫 번째 인수 문자열을 기반으로 지정된 길이의 문자열을 반환합니다. 지정된 문자열이 너무 짧으면 패드 문자열의 문자 시퀀스가 반복되어 왼쪽에 채워집니다. 지정된 문자열이 너무 길면 오른쪽에서 잘립니다. 이 문제를 해결하기 위해 다음과 같은 방법을 사용할 수 있습니다.: 왼쪽에서 두 번째 인수에 의해 지정된 모든 문자가 제거된 인수 문자열을 반환합니다. 두 번째 인수를 지정하지 않으면 공백을 제거합니다.

반환 유형:STRING

부품 인수는 다음과 같을 수 있습니다'PROTOCOL','HOST','PATH','REF','AUTHORITY','FILE','USERINFO', 또는'QUERY'. 이러한 리터럴 값에는 대문자가 필요합니다. 쿼리 문자열의 키-값 쌍에서 연결된 값만 검색할 키를 선택적으로 지정할 수 있습니다.

반환 유형: STRING

사용 참고 사항:이 기능은 웹 로그 해석의 전통적인 하둡 사용 사례에 중요합니다. 예를 들어,웹 트래픽 데이터가 별도의 테이블 열로 분할되지 않은 경우'PATH'또는'FILE'필드를 추출하여 특정 페이지의 방문자를 계산하거나'QUERY'필드에서 해당 키를 추출하여 검색 용어를 분석할 수 있습니다. 따라서 특수 문자가 특수 문자가 아닌 문자 그대로 해석됩니다. 다음 특수 문자는 함수에 의해 이스케이프됩니다.

.\+*?$(){}=!<>|:-

반환 형식: string

이 프로그램은 자바 바이트코드 프로그램의 갯수를 카운트하고,스크립트의 메인 형식을 합계냅니다,그리고 확인되지 않은 실행 텍스트 파일을 찾습니다.. 자세한 내용은 다시 2 설명서를 참조하십시오. 그것은 비 욕심 일치하는.*?을 포함하여 펄,파이썬 등의 정규 표현식에서 익숙한 대부분의 숙어를 가지고 있습니다.

임팔라 2.0 이상에서는 기본 정규식 라이브러리의 변경으로 인해 정규식이 이 함수에 의해 해석되는 방식이 변경 될 수 있습니다. 정규식을 사용하는 쿼리를 테스트하고 필요한 경우 식 패턴을 조정합니다.

임팔라 셸 인터프리터는 이스케이프에\문자를 사용하기 때문에\을 사용하여 임팔라 셸을 통해 제출하는 정규식에서 정규식 이스케이프 문자를 나타냅니다. \d로 이스케이프해야 하는\d대신]와 같은 해당 문자 클래스 이름을 사용하는 것이 좋습니다.

예:

이 예제에서는 재 2 에서 특수 문자 중 하나를 이스케이프하는 방법을 보여 줍니다.

+------------------------------------------------------+| regexp_escape('Hello.world') |+------------------------------------------------------+| Hello\.world |+------------------------------------------------------+

이 예제에서는 재 2 의 모든 특수 문자를 이스케이프 처리합니다. 목적:정규식 패턴을 기반으로 문자열에서 지정된()그룹을 반환합니다. 그룹 0 은 추출 된 전체 문자열을 참조하고 그룹 1,2 등은 첫 번째,두 번째 및(...)부분을 나타냅니다.

반환 유형: STRING

이 프로그램은 자바 바이트코드 프로그램의 갯수를 카운트하고,스크립트의 메인 형식을 합계냅니다,그리고 확인되지 않은 실행 텍스트 파일을 찾습니다.. 자세한 내용은 다시 2 설명서를 참조하십시오. 그것은 비 욕심 일치하는.*?을 포함하여 펄,파이썬 등의 정규 표현식에서 익숙한 대부분의 숙어를 가지고 있습니다.

임팔라 2.0 이상에서는 기본 정규식 라이브러리의 변경으로 인해 정규식이 이 함수에 의해 해석되는 방식이 변경 될 수 있습니다. 정규식을 사용하는 쿼리를 테스트하고 필요한 경우 식 패턴을 조정합니다.

임팔라 셸 인터프리터는 이스케이프에\문자를 사용하기 때문에\을 사용하여 임팔라 셸을 통해 제출하는 정규식에서 정규식 이스케이프 문자를 나타냅니다. \d로 이스케이프해야 하는\d대신]와 같은 해당 문자 클래스 이름을 사용하는 것이 좋습니다.

예:

이 예제는 그룹 0 이()그룹 외부의 부분을 포함하여 전체 패턴 문자열과 일치하는 방법을 보여줍니다:

이 예제에서는 그룹 1 이 패턴 문자열의 첫 번째()그룹 내의 내용만 일치하는 방법을 보여줍니다.

이전 임팔라 릴리스와 달리 임팔라 2.0 에서 사용 된 정규 표현식 라이브러리는 이후 비 욕심 일치에 대한.*?관용구를 지원합니다. 이 예제에서는.*?로 시작하는 패턴 문자열이 소스 문자열의 가능한 가장 짧은 부분과 일치하여 가장 오른쪽 소문자 집합을 반환하는 방법을 보여줍니다. .*?으로 시작하고 끝나는 패턴 문자열은 길이가 같은 두 개의 잠재적 일치 항목을 찾고 발견 된 첫 번째 문자열(가장 왼쪽의 소문자 집합)을 반환합니다.

정규 표현식(문자열 소스,문자열 패턴)목적:true또는false을 반환하여 소스 문자열이 패턴에 의해 주어진 정규 표현식을 그 안에 포함하는지 여부를 나타냅니다. 선택적 세 번째 인수는 대/소문자를 구분하지 않는 일치에 대해i과 같이 일치 수행 방식을 변경하는 문자 플래그로 구성됩니다.

구문:

선택적 세 번째 인수에 포함할 수 있는 플래그는 다음과 같습니다:

  • c: 대/소문자 구분 일치(기본값).
  • i: 대/소문자를 구분하지 않는 일치. ci의 여러 인스턴스가 세 번째 인수에 포함되는 경우 마지막 옵션이 우선합니다.
  • m: 멀티 라인 매칭. ^$연산자는 전체 문자열의 시작 및 끝이 아니라 원본 문자열 내의 모든 줄의 시작 또는 끝과 일치합니다.
  • n: 줄 바꿈 일치. .연산자는 줄 바꿈 문자와 일치할 수 있습니다. .*과 같은 반복 연산자는 여러 줄에 걸쳐 있는 원본 문자열의 일부를 일치시킬 수 있습니다.

반환 유형: BOOLEAN

이 프로그램은 자바 바이트코드 프로그램의 갯수를 카운트하고,스크립트의 메인 형식을 합계냅니다,그리고 확인되지 않은 실행 텍스트 파일을 찾습니다.. 자세한 내용은 다시 2 설명서를 참조하십시오. 그것은 비 욕심 일치하는.*?을 포함하여 펄,파이썬 등의 정규 표현식에서 익숙한 대부분의 숙어를 가지고 있습니다.

임팔라 2.0 이후 기본 정규식 라이브러리의 변경으로 인해 이 함수에 의해 정규식이 해석되는 방식이 변경될 수 있습니다. 정규식을 사용하는 쿼리를 테스트하고 필요한 경우 식 패턴을 조정합니다.

임팔라 셸 인터프리터는 이스케이프에\문자를 사용하기 때문에\을 사용하여 임팔라 셸을 통해 제출하는 정규식에서 정규식 이스케이프 문자를 나타냅니다. \d로 이스케이프해야 하는\d대신]와 같은 해당 문자 클래스 이름을 사용하는 것이 좋습니다.

예:

이 예제는REGEXP_LIKE()이 소스 문자열 내에서 다양한 종류의 정규식 패턴의 존재를 테스트 할 수있는 방법을 보여줍니다:

정규식_대체(문자열 초기,문자열 패턴,문자열 교체)목적:정규식 패턴이 최종 인수 문자열로 대체 된 초기 인수를 반환합니다.

반환 유형: STRING

임팔라 2.확장 정규식 구문을 준수합니다. 자세한 내용은 다시 2 설명서를 참조하십시오. 그것은 비 욕심 일치하는.*?을 포함하여 펄,파이썬 등의 정규 표현식에서 익숙한 대부분의 숙어를 가지고 있습니다.

임팔라 2.0 이상에서는 기본 정규식 라이브러리의 변경으로 인해 정규식이 이 함수에 의해 해석되는 방식이 변경 될 수 있습니다. 정규식을 사용하는 쿼리를 테스트하고 필요한 경우 식 패턴을 조정합니다.

임팔라 셸 인터프리터는 이스케이프에\문자를 사용하기 때문에\을 사용하여 임팔라 셸을 통해 제출하는 정규식에서 정규식 이스케이프 문자를 나타냅니다. \d로 이스케이프해야 하는\d대신]와 같은 해당 문자 클래스 이름을 사용하는 것이 좋습니다.

예:

이 예제에서는 패턴과 일치하는 문자열의 일부를 대체 텍스트로 대체할 수 있는 방법을 보여 줍니다. 역참조 번호는 1 에서 시작하고\문자는\으로 이스케이프되어야 합니다.

문자 패턴을 새 텍스트로 바꾸기:

 > select regexp_replace('aaabbbaaa','b+','xyz');+------------------------------------------+| regexp_replace('aaabbbaaa', 'b+', 'xyz') |+------------------------------------------+| aaaxyzaaa |+------------------------------------------+Returned 1 row(s) in 0.11s

문자 패턴을 일치하는 원본 텍스트를 포함하는 대체 텍스트로 바꿉니다:

 > select regexp_replace('aaabbbaaa','(b+)','<\1>');+----------------------------------------------+| regexp_replace('aaabbbaaa', '(b+)', '<\1>') |+----------------------------------------------+| aaa<bbb>aaa |+----------------------------------------------+Returned 1 row(s) in 0.11s

목적:지정된 횟수만큼 반복되는 인수 문자열을 반환합니다.

반환 유형:STRING

바꾸기(문자열 초기,문자열 대상,문자열 대체)목적: 대상 문자열의 모든 항목이 대체 문자열로 대체된 초기 인수를 반환합니다.

반환 유형: STRING

사용 참고 사항:

이 함수는 정규식 패턴을 사용하지 않으므로 일반적으로 간단한 문자열 대체의 경우REGEXP_REPLACE()보다 빠릅니다.

인수가NULL인 경우 반환 값은NULL입니다.

일치는 대/소문자를 구분합니다.

대체 문자열에 대상 문자열의 다른 인스턴스가 포함되어 있으면 새로 생성된 문자열에 다시 적용하는 대신 확장이 한 번만 수행됩니다.

예:

역(문자열)목적:반전 된 순서로 문자로 인수 문자열을 반환합니다.

반환 유형:STRING

오른쪽(문자열,숫자_차)STRRIGHT함수를 참조하십시오. 목적:첫 번째 인수 문자열을 기반으로 지정된 길이의 문자열을 반환합니다. 지정된 문자열이 너무 짧으면 패드 문자열의 문자 시퀀스가 반복되어 오른쪽에 패딩됩니다. 지정된 문자열이 너무 길면 오른쪽에서 잘립니다. 목적:오른쪽에서 제거 된 두 번째 인수에 의해 지정된 모든 문자 발생과 인수 문자열을 반환합니다. 두 번째 인수를 지정하지 않으면 공백을 제거합니다. 목적:지정된 공백 수의 연결된 문자열을 반환합니다.repeat(' ',n)에 대한 속기.

반환 유형: 목적:입력 소스 문자열의 요청된index부분을 구분 기호로 분할하여 반환합니다.

  • 인덱스가 양수이면 소스 문자열 내에서 왼쪽에서 인덱스 부분을 반환합니다.
  • 인덱스가 음수이면 소스 문자열 내의 오른쪽에서 인덱스 부분을 반환합니다.
  • 인덱스가 0 이면 오류를 반환합니다.

구분 기호는 단일 문자가 아닌 여러 문자로 구성 될 수 있습니다.

구분 기호의 모든 일치는 정규식 패턴을 사용하지 않고 정확하게 수행됩니다.

반환 유형: STRING

예시:

SPLIT_PART('x,y,z',',',2) 반환'y'.

SPLIT_PART('one***two***three','***',2)반환'two'.

SPLIT_PART('[email protected]@[email protected]@ghi', '@@', 3)반환'ghi'.

SPLIT_PART('[email protected]@[email protected]@ghi', '@@', -3)반환'abc'. 목적:문자열의 가장 왼쪽 문자를 반환합니다. 2 개의 인수로substr()에 대한 호출에 대한 속기. 목적:문자열의 가장 오른쪽 문자를 반환합니다. 2 개의 인수로substr()에 대한 호출에 대한 속기. 목적:지정된 지점에서 시작하여 선택적으로 지정된 최대 길이로 문자열의 일부를 반환합니다. 문자열의 문자는 1 부터 인덱싱됩니다.

반환 유형:STRING

변환(문자열 입력,문자열 시작,문자열)목적:from인수의 각 문자가to인수의 해당 문자로 대체된input문자열을 반환합니다. 문자는fromto에 나타나는 순서대로 일치합니다.

예:translate ('hello world','world','earth')'hetta earth'를 반환합니다.

반환 유형: STRING

사용 참고:

fromto보다 많은 문자를 포함하는 경우to의 길이를 초과하는from문자는 결과에서 제거됩니다.

예:

translate('abcdedg', 'bcd', '1') 반환'a1eg'.

translate('Unit Number#2', '# ', '_')반환'UnitNumber_2'.

fromNULL이면 함수는NULL를 반환합니다.

tofrom보다 많은 문자를 포함하는 경우to의 추가 문자는 무시됩니다.

from에 중복 문자가 포함되어 있으면 중복 문자가to의 첫 번째 일치하는 문자로 바뀝니다.

예:translate ('hello','ll','67')'he66o'를 반환합니다.

트림(문자열)목적:선행 및 후행 공백이 모두 제거 된 입력 문자열을 반환합니다. 문자열을LTRIM()RTRIM()모두 전달하는 것과 같습니다.

사용 참고 사항:입력 값이 여전히 주변 공간을 가질 수있는 경우 데이터 정리 작업 중에 자주 사용됩니다. 공백 외에 다른 선행 및 후행 문자를 제거할 수 있는 보다 일반적인 함수에 대해서는BTRIM()을 참조하십시오.

반환 유형:STRING

위(문자열),목적:모든 대문자로 변환 된 인수 문자열을 반환합니다.

반환 유형: STRING

사용 참고 사항:

임팔라 2.5 이상에서는ILIKE또는IREGEXP연산자를 대신 사용하여 많은UPPER()LOWER()호출을 사용하여 대소 문자를 구분하지 않는 비교를 수행하는 쿼리를 단순화할 수 있습니다.

답글 남기기

이메일 주소는 공개되지 않습니다.