파이썬 문자열
파이썬 문자열은 가장 일반적으로 사용되는 데이터 타입이다. 우리는 문자열을 생성 ( '또는 ") 따옴표를 사용할 수 있습니다.
문자열을 만들기만큼 변수 값이 할당 될 때, 매우 간단하다. 예를 들면 :
var1 = 'Hello World!' var2 = "Python w3big"
파이썬 액세스 문자열 값
파이썬은 하나의 문자 형식을 지원하지 않는 단일 문자는 파이썬 문자열로 사용됩니다.
파이썬 액세스 문자열, 당신은 문자열 다음 예를 가로 채기 위해 대괄호를 사용할 수 있습니다 :
#!/usr/bin/python var1 = 'Hello World!' var2 = "Python w3big" print "var1[0]: ", var1[0] print "var2[1:5]: ", var2[1:5]
상기 실시 예의 결과 :
var1[0]: H var2[1:5]: ytho
파이썬 문자열 업데이트
기존 문자열을 수정하고, 다른 변수, 다음의 예에 할당 할 수 있습니다 :
#!/usr/bin/python # -*- coding: UTF-8 -*- var1 = 'Hello World!' print "更新字符串 :- ", var1[:6] + 'w3big!'
상기 결과의 예
更新字符串 :- Hello w3big!
파이썬 이스케이프 문자
당신이 문자에 특수 문자를 사용해야하는 경우, 백 슬래시 (\) 이스케이프 문자와 파이썬. 다음 표에서 :
이스케이프 문자 | 기술 |
---|---|
\ (라인의 끝에서) | ULINK |
\\ | 백 슬래시 |
\ ' | 작은 따옴표 |
\ " | 큰 따옴표 |
\ | 벨 |
\ B | 백 스페이스 (백 스페이스) |
\ E | 탈출 |
\ 000 | 빈 |
\ N | 랩 |
\ V | 수직 탭 |
\ T | 수평 탭 |
\ R | 입력 |
\ F | PAGE |
\ Oyy | 문자 진수는 전년 동기 대비 대표는, 예를 들면 : O12은 줄 바꿈을 나타내는 \ |
\ XYY | 문자 16 진수, 예를 들어 전년 동기 대비 대표 : \의 X0A는 줄 바꿈을 나타냅니다 |
\ 기타 | 일반적인 형식의 다른 문자 출력 |
파이썬 문자열 연산자
다음 표는 인스턴스 변수는 문자열 "안녕하세요", B 변수 값 "파이썬"입니다 :
운영자 | 기술 | 예 |
---|---|---|
+ | 문자열 연결 | A + B 출력 : HelloPython |
* | 반복 출력 문자열 | A * 2 출력 : HelloHello |
[] | 인덱스로 문자열의 문자를 가져옵니다 | A [1] 출력E |
[:] | 문자열 부분의 차단 | A [1 : 4] 출력엘 |
에 | 회원 연산자 - 문자열이 포함 된 경우 지정된 문자는 True를 반환 | 1 출력 H |
하지에 | 회원 연산자 - 문자열이 특정 문자가 포함되지 않은 경우 True를 반환 | M 아닌 1 출력 |
R / R | 원래 문자열 - 원본 문자열 : 모든 문자열이 직접 문자 적 의미에 따라 사용되는, 아니 탈출 특수 문자 또는 인쇄하지 있습니다. 문자 "R"을 첫 번째 인용문 전에 원래 문자열뿐만 아니라 일반 문자열이 거의 동일한 구문으로보다 (경우에 할 수있다). | 인쇄 R '\ n'을 출력 \ n 및 인쇄 R '\ n'을출력 \ n을 |
% | 형식 문자열 | 다음 절을 참조하십시오 |
다음 예는 다음과 같다 :
#!/usr/bin/python # -*- coding: UTF-8 -*- a = "Hello" b = "Python" print "a + b 输出结果:", a + b print "a * 2 输出结果:", a * 2 print "a[1] 输出结果:", a[1] print "a[1:4] 输出结果:", a[1:4] if( "H" in a) : print "H 在变量 a 中" else : print "H 不在变量 a 中" if( "M" not in a) : print "M 不在变量 a 中" else : print "M 在变量 a 中" print r'\n' print R'\n'
위의 프로그램 실행 결과 :
a + b 输出结果: HelloPython a * 2 输出结果: HelloHello a[1] 输出结果: e a[1:4] 输出结果: ell H 在变量 a 中 M 不在变量 a 中 \n \n
파이썬 문자열 서식
파이썬은 출력 형식의 문자열을 지원합니다. 이것은 매우 복잡한 표현을 포함 할 수 있지만, 가장 기본적인 사용법은 문자열 문자열 지정자 % s의에 값을 삽입하는 것입니다.
파이썬에서, 그리고 C 문자열은의 sprintf 함수와 같은 구문을 사용하여 포맷.
다음 예 :
#!/usr/bin/python print "My name is %s and weight is %d kg!" % ('Zara', 21)
위의 출력의 예 :
My name is Zara and weight is 21 kg!
파이썬 문자열 형식 기호 :
상징 | 기술 |
---|---|
%의 C | 서식 문자 및 ASCII 코드 |
%의 | 형식 문자열 |
% D | 정수 형식 |
% 유 | 서명되지 않은 INT 형식 |
% 오 | 서식 부호 진수 |
% X | 부호없는 16 진수 형식 |
% X | 부호없는 16 진수 형식 (대문자) |
% f를 | 포맷 부동 소수점 숫자는 정밀도 소수점 지정할 수 |
% 전자 | 과학 표기법 부동 소수점 형식 |
%의 E | % 전자와 액션, 부동 소수점 형식 과학적 표기법을 사용하여 |
% g | % F와 % E 속기 |
% G | % F % E 및 속기 |
% P | 변수의 진수 주소 형식 번호 |
서식 연산자를 지원 명령 :
상징 | 기능 |
---|---|
* | 너비 또는 소수점 정밀도를 정의 |
- | 왼쪽 DO의 정렬 |
+ | 전면 더하기 기호를 표시 양수 (+) |
<SP> | 양수 전에 디스플레이 공간 |
# | ( '0'), '0X'또는 '0X'16 진수 표시의 앞합니다 (사용 'X'또는 'X'에 따라) 8 진수 앞에 제로보기 |
0 | 그림은 전면 칠을 보여 '0'대신 기본 공간의 |
% | '%%는'하나의 '%'를 출력합니다 |
(VAR) | 변수 매핑 (사전 매개 변수) |
백만 | m 디스플레이의 최소 전체 폭이고, n은 소수 자릿수 (사용 가능한 경우)입니다 |
파이썬 삼중 따옴표 (트리플 따옴표)
세 파이썬 지수는 복잡한 문자열을 복사 할 수 있습니다 :
파이썬 삼중 따옴표는 여러 줄에 걸쳐 문자열, 문자열 줄 바꿈, 탭, 그리고 다른 특수 문자를 포함 할 수 있습니다.
트리플 인용 구문 (일반적으로 쌍) 연속 따옴표 나 큰 따옴표 한 쌍이다.
>>> hi = '''hi there''' >>> hi # repr() 'hi\nthere' >>> print hi # str() hi there
트리플 따옴표는 따옴표 및 특수 문자열 내부의 수렁에서 프로그래머가 WYSIWYG (WYSIWYG) 형식으로 호출되는 작은 형식 문자열을 유지하기 위해 끝까지 시작할 수 있습니다.
일반적인 사용 사례는 HTML이나 SQL을 필요로 할 때, 다음, 문자열의 조합을 사용하는 특수 문자열을 탈출하는 것은 매우 지루한 될 것입니다.
errHTML = ''' <HTML><HEAD><TITLE> Friends CGI Demo</TITLE></HEAD> <BODY><H3>ERROR</H3> <B>%s</B><P> <FORM><INPUT TYPE=button VALUE=Back ONCLICK="window.history.back()"></FORM> </BODY></HTML> ''' cursor.execute(''' CREATE TABLE users ( login VARCHAR(8), uid INTEGER, prid INTEGER) ''')
유니 코드 문자열
파이썬은 유니 코드와 간단하게 정상 문자열의 문자열입니다 :
>>> u'Hello World !' u'Hello World !'
소문자 전에 따옴표는 "u는"여기에 생성 된 유니 코드 문자열을 나타냅니다. 당신은 특수 문자를 추가하려는 경우, 당신은 파이썬 유니 코드 이스케이프 인코딩을 사용할 수 있습니다. 다음 예에서 :
>>> u'Hello\u0020World !' u'Hello World !'
대체 \의 u0020 ID는 유니 코드 문자 인코딩 값 0x0020 (공백 문자)을 삽입하는 특정 위치에 표시했다.
파이썬 문자열은 내장 함수
Python1.6 문자열 방법은 천천히 믹스에 추가 2.0입니다 - 그들은 또한 자이 썬에 추가됩니다.
이 방법은 대부분의 방법 문자열 모듈을 달성, 다음 표는 유니 코드를 내장 현재 문자열 방법의 지원, 모든 방법이 포함되어 지원을 나열, 심지어 특별히 유니 코드에 대한 몇 가지.
방법 | 기술 |
---|---|
첫 번째 문자를 대문자 | |
새 문자열의 폭의 길이에 공백이있는 원 중심의 문자열과 패딩을 돌려줍니다 | |
string.count (캐릭터, 구걸 = 0, 끝 = 렌 (문자열)) | , str을 문자열 str을 내부에 나타나는 횟수 발생할 경우, 구걸 또는 지정된 범위 내에서 반환 지정된 종료를 돌려줍니다 |
string.decode (인코딩 = 'UTF-8 ', 오류 = '엄격한') | 지정된 오류가 아니라면 ValueError를 예외 '무시'또는 경우에 지정된 인코딩 포맷으로 디코딩 문자열 인코딩 기본 에러 메시지 '바꾸기 |
string.encode (인코딩 = 'UTF-8 ', 오류 = '엄격한') | 지정된 오류가 아니라면 ValueError를 예외 '무시'또는 경우에 지정된 인코딩 형식 문자열을 인코딩에서 기본 에러 메시지 '바꾸기 |
string.endswith (OBJ, 구걸 = 0, 끝 = LEN (문자열)) | 구걸을 지정한 경우, 문자열 OBJ 종료 여부를 확인하거나 지정된 범위 내에서 종료하는 OBJ 종료 여부를 확인하고, 만약 그렇다면, 그렇지 않은 경우는 false, True를 반환합니다. |
공간에 탭 기호 문자열 문자열, 공간의 기본 번호에 대한 탭 기호는 8입니다. | |
string.find (캐릭터, 구걸 = 0, 끝 = 렌 (문자열)) | 검색은 사용자가 간청 지정된 범위를 종료하면, 지정된 범위에 포함 여부를 인덱스 값의 시작 리턴의 경우는, 달리 판정 문자열 str을 포함 -1 |
string.index (캐릭터, 구걸 = 0, 끝 = LEN (문자열)) | 찾기 () 같은 방법하지만, 문자열 str을 경우 예외가보고됩니다하지와 함께. |
이 적어도 하나의 문자열이고 경우 모든 문자는 문자 또는 숫자 다시 있습니다 true, 그렇지 않은 경우는 false 반환 | |
이 적어도 하나의 문자열이며, 경우 모든 문자는 True를 반환 문자입니다 그렇지 않으면 False를 반환 | |
문자열은 십진수가 포함되어있는 경우, 그렇지 않은 경우는 false True를 반환합니다. | |
문자열은 True, 그렇지 않으면 거짓 만 자리 수익을 포함합니다. | |
문자열이 적어도 하나의 대소 문자를 구분 문자를 포함하고,이 (대소 문자 구분) 모든 문자가 소문자 인 경우 true, 그렇지 않은 경우는 false 반환 | |
문자열이 숫자 만 포함 된 경우는 true, 그렇지 않은 경우는 false 반환 | |
문자열은 공백이 포함되어 있으면 true, 그렇지 않은 경우는 false를 반환합니다. | |
문자열이 제목 인 경우 true, 그렇지 않은 경우는 false를 반환 (제목 ()를 참조) | |
문자열이 적어도 하나의 대소 문자를 구분 문자를 포함하고,이 (대소 문자 구분) 모든 문자가 대문자 인 경우는 true, 그렇지 않은 경우는 false 반환 | |
구분 기호로 문자열에서,하는 새로운 문자열로 배열의 모든 요소 (캐릭터 라인 표현) | |
새 문자열의 폭의 길이에 공백이 전 왼쪽 정렬, 패딩의 문자열을 반환 | |
모든 대문자에서 문자열을 소문자로 변환. | |
잘린다 문자열 왼쪽 공간 | |
문자를 나타내는 문자열을 변환 할 수 maketrans () 메소드가 두 개의 매개 변수를내어, 문자 매핑 변환 테이블을 만드는 데 사용되는 가장 쉬운 방법이 호출, 첫 번째 인수가되고, 두 번째 매개 변수는 목표 전환의 문자열 표현입니다 . | |
문자열 str을 가장 큰 문자를 돌려줍니다. | |
문자열 str을 작은 문자를 돌려줍니다. | |
찾기 () 및 분할 () 조합의 string_pre_str STR 문자열에 포함하지 않을 경우 3 요소 튜플 (string_pre_str, STR, string_post_str)에 str을 문자열 문자열에서 부상 이후 처음 위치 같은 비트 == 문자열입니다. | |
하려면 string.replace (STR1, STR2, NUM = string.count (STR1)) | 납입이 지정된 경우 STR2에 STR1에서 문자열을 교체, NUM 시간보다 더 이상 교체하지. |
string.rfind (캐릭터, 구걸 = 0, 끝 = 렌 (문자열)) | 찾기 () 함수와 비슷하지만 오른쪽에서 찾고 시작합니다. |
string.rindex (캐릭터, 구걸 = 0, 끝 = LEN (문자열)) | 인덱스 ()와 비슷하지만, 오른쪽부터. |
의 문자열을 반환 이전 정렬 오른쪽 길이 폭의 새로운 문자열에 공백이있는 패딩 | |
string.rpartition (STR) | 파티션 () 함수와 비슷하지만 오른쪽에서 찾고 시작합니다. |
문자열의 공간 문자열 끝을 제거합니다. | |
사항 String.split (STR = "", NUM = string.count (STR)) | str을 분리 슬라이스 문자열, NUM 값이 지정된 경우, 만 문자열 분리 납입 이동합니다 |
행으로 구분, 각 행은 납입의 납입 열 경우 지정된 전용 섹션을 포함하는 목록의 요소로 반환됩니다. | |
string.startswith (OBJ, 구걸 = 0, 끝 = LEN (문자열)) | 문자열 OBJ로 시작 여부는 true, 그렇지 않은 경우는 false 반환 확인합니다. 구걸하고 지정된 값을 종료하는 경우, 지정된 범위 내에서 확인합니다. |
집행 문자열 lstrip ()와 rstrip () | |
경우에 플립 문자열 | |
위로 문자열의 "제목", 즉 대문자로 모든 단어의 시작은 소문자 나머지 () (istitle 참조)입니다 | |
주어진 표 STR (256 문자) 문자열을 변환하는 방법 델 인수로 문자를 필터링 | |
소문자 변환 문자열을 대문자로 | |
길이 폭의 문자열을 반환하는 것은, 원래 문자열 문자열은 바로 앞에 제로와 패딩 정당화 | |
문자열은 소수점 문자가 포함되어 있는지 여부를 isdecimal () 메소드를 확인합니다. 이 방법은 유니 코드 객체에 존재합니다. |