국문과 유목민

Python String 관련 함수 본문

IT 견문록/함수 및 코드 (디지털치매 대비)

Python String 관련 함수

논곰 2022. 3. 21. 23:20

Python String 

 파이썬의 String관련 함수들은 자연어 전처리를 수행함에 있어서 가장 기본적인 사항들이라고 생각합니다. 그렇기에 Python String 관련 함수들을 간단하게 정리해두고자 합니다.

대소문자의 변환

함수 설명
upper() 모두 대문자로 변환
lower()  모두 소문자로 변환
capitalize()  문자열의 첫 문자를 대문자로 변환
title()  문자열에서 각 단어의 첫 문자를 대문자로 변환
swapcase()  대문자와 소문자를 서로 변환

검색

함수 설명
count(‘hi’)  문자열에서 hi가 출현한 빈도 리턴
find(‘hi’)  문자열에서 hi가 처음으로 출현한 위치 리턴,S존재하지 않는 경우 -1
find(‘hi’,S3)  문자열의 index에서 3번부터 hi가 출현한 위치 검색
rfind(‘hi’)  문자열에서 오른쪽부터 검사하여 hi가 처음으로 출현한 위치 리턴,S존재하지 않는 경우 -1
index(‘hi’)  find와 비슷한 기능을 하지만 존재하지 않는 경우 예외발생
rindex(‘hi’)  rfind와 비슷한 기능을 하지만 존재하지 않는 경우 예외발생

편집과 치환

함수 설명
strip()  좌우 공백을 제거
rstrip()  오른쪽 공백을 제거
lstrip()  왼쪽 공백을 제거
replace(a,b)  a를 b로 치환

분리와 결합

함수 설명
split()  공백으로 분리
split(‘\t’)  탭을 기준으로 분리
‘ ‘.join(s)  리스트 s에 대하여 각 요소 사이에 공백을 두고 결합
lines.splitlines()  라인 단위로 분리

구성 문자열 판별

함수 설명
isdigit()  숫자 여부 판별
isalpha()  영어 알파벳 여부 판별
isalnum()  숫자 혹은 영어 알파벳 여부 판별
islower()  소문자 여부 판별
isupper()  대문자 여부 판별
isspace() 공백 문자 여부 판별
startswith(‘hi’)  문자열이 hi로 시작하는지 여부 파악
endswith(‘hi’)  문자열이 hi로 끝나는지 여부 파악

 

Comments