논곰
2022. 3. 21. 23:20
Python String
파이썬의 String관련 함수들은 자연어 전처리를 수행함에 있어서 가장 기본적인 사항들이라고 생각합니다. 그렇기에 Python String 관련 함수들을 간단하게 정리해두고자 합니다.
대소문자의 변환
함수 |
설명 |
upper() |
모두 대문자로 변환 |
lower() |
모두 소문자로 변환 |
capitalize() |
문자열의 첫 문자를 대문자로 변환 |
title() |
문자열에서 각 단어의 첫 문자를 대문자로 변환 |
swapcase() |
대문자와 소문자를 서로 변환 |
검색
함수 |
설명 |
count(‘hi’) |
문자열에서 hi가 출현한 빈도 리턴 |
find(‘hi’) |
문자열에서 hi가 처음으로 출현한 위치 리턴,S존재하지 않는 경우 -1 |
find(‘hi’,S3) |
문자열의 index에서 3번부터 hi가 출현한 위치 검색 |
rfind(‘hi’) |
문자열에서 오른쪽부터 검사하여 hi가 처음으로 출현한 위치 리턴,S존재하지 않는 경우 -1 |
index(‘hi’) |
find와 비슷한 기능을 하지만 존재하지 않는 경우 예외발생 |
rindex(‘hi’) |
rfind와 비슷한 기능을 하지만 존재하지 않는 경우 예외발생 |
편집과 치환
함수 |
설명 |
strip() |
좌우 공백을 제거 |
rstrip() |
오른쪽 공백을 제거 |
lstrip() |
왼쪽 공백을 제거 |
replace(a,b) |
a를 b로 치환 |
분리와 결합
함수 |
설명 |
split() |
공백으로 분리 |
split(‘\t’) |
탭을 기준으로 분리 |
‘ ‘.join(s) |
리스트 s에 대하여 각 요소 사이에 공백을 두고 결합 |
lines.splitlines() |
라인 단위로 분리 |
구성 문자열 판별
함수 |
설명 |
isdigit() |
숫자 여부 판별 |
isalpha() |
영어 알파벳 여부 판별 |
isalnum() |
숫자 혹은 영어 알파벳 여부 판별 |
islower() |
소문자 여부 판별 |
isupper() |
대문자 여부 판별 |
isspace() |
공백 문자 여부 판별 |
startswith(‘hi’) |
문자열이 hi로 시작하는지 여부 파악 |
endswith(‘hi’) |
문자열이 hi로 끝나는지 여부 파악 |