string — Common string operations¶
The concatenation of the ascii_lowercase and ascii_uppercase constants described below. This value is not locale-dependent.
The lowercase letters ‘abcdefghijklmnopqrstuvwxyz’ . This value is not locale-dependent and will not change.
The uppercase letters ‘ABCDEFGHIJKLMNOPQRSTUVWXYZ’ . This value is not locale-dependent and will not change.
The string ‘0123456789’ .
The string ‘0123456789abcdefABCDEF’ .
The string ‘01234567’ .
String of ASCII characters which are considered punctuation characters in the C locale: !"#$%&'()*+,-./:;<=>?@[\]^_`
String of ASCII characters which are considered printable. This is a combination of digits , ascii_letters , punctuation , and whitespace .
A string containing all ASCII characters that are considered whitespace. This includes the characters space, tab, linefeed, return, formfeed, and vertical tab.
Custom String Formatting¶
The built-in string class provides the ability to do complex variable substitutions and value formatting via the format() method described in PEP 3101. The Formatter class in the string module allows you to create and customize your own string formatting behaviors using the same implementation as the built-in format() method.
class string. Formatter ¶
The Formatter class has the following public methods:
The primary API method. It takes a format string and an arbitrary set of positional and keyword arguments. It is just a wrapper that calls vformat() .
Changed in version 3.7: A format string argument is now positional-only .
This function does the actual work of formatting. It is exposed as a separate function for cases where you want to pass in a predefined dictionary of arguments, rather than unpacking and repacking the dictionary as individual arguments using the *args and **kwargs syntax. vformat() does the work of breaking up the format string into character data and replacement fields. It calls the various methods described below.
In addition, the Formatter defines a number of methods that are intended to be replaced by subclasses:
Loop over the format_string and return an iterable of tuples (literal_text, field_name, format_spec, conversion). This is used by vformat() to break the string into either literal text, or replacement fields.
The values in the tuple conceptually represent a span of literal text followed by a single replacement field. If there is no literal text (which can happen if two replacement fields occur consecutively), then literal_text will be a zero-length string. If there is no replacement field, then the values of field_name, format_spec and conversion will be None .
get_field ( field_name , args , kwargs ) ¶
Given field_name as returned by parse() (see above), convert it to an object to be formatted. Returns a tuple (obj, used_key). The default version takes strings of the form defined in PEP 3101, such as “0[name]” or “label.title”. args and kwargs are as passed in to vformat() . The return value used_key has the same meaning as the key parameter to get_value() .
Retrieve a given field value. The key argument will be either an integer or a string. If it is an integer, it represents the index of the positional argument in args; if it is a string, then it represents a named argument in kwargs.
The args parameter is set to the list of positional arguments to vformat() , and the kwargs parameter is set to the dictionary of keyword arguments.
For compound field names, these functions are only called for the first component of the field name; subsequent components are handled through normal attribute and indexing operations.
So for example, the field expression ‘0.name’ would cause get_value() to be called with a key argument of 0. The name attribute will be looked up after get_value() returns by calling the built-in getattr() function.
If the index or keyword refers to an item that does not exist, then an IndexError or KeyError should be raised.
check_unused_args ( used_args , args , kwargs ) ¶
Implement checking for unused arguments if desired. The arguments to this function is the set of all argument keys that were actually referred to in the format string (integers for positional arguments, and strings for named arguments), and a reference to the args and kwargs that was passed to vformat. The set of unused args can be calculated from these parameters. check_unused_args() is assumed to raise an exception if the check fails.
format_field ( value , format_spec ) ¶
format_field() simply calls the global format() built-in. The method is provided so that subclasses can override it.
convert_field ( value , conversion ) ¶
Converts the value (returned by get_field() ) given a conversion type (as in the tuple returned by the parse() method). The default version understands ‘s’ (str), ‘r’ (repr) and ‘a’ (ascii) conversion types.
Format String Syntax¶
The str.format() method and the Formatter class share the same syntax for format strings (although in the case of Formatter , subclasses can define their own format string syntax). The syntax is related to that of formatted string literals , but it is less sophisticated and, in particular, does not support arbitrary expressions.
Format strings contain “replacement fields” surrounded by curly braces <> . Anything that is not contained in braces is considered literal text, which is copied unchanged to the output. If you need to include a brace character in the literal text, it can be escaped by doubling: << and >> .
The grammar for a replacement field is as follows:
In less formal terms, the replacement field can start with a field_name that specifies the object whose value is to be formatted and inserted into the output instead of the replacement field. The field_name is optionally followed by a conversion field, which is preceded by an exclamation point ‘!’ , and a format_spec, which is preceded by a colon ‘:’ . These specify a non-default format for the replacement value.
The field_name itself begins with an arg_name that is either a number or a keyword. If it’s a number, it refers to a positional argument, and if it’s a keyword, it refers to a named keyword argument. An arg_name is treated as a number if a call to str.isdecimal() on the string would return true. If the numerical arg_names in a format string are 0, 1, 2, … in sequence, they can all be omitted (not just some) and the numbers 0, 1, 2, … will be automatically inserted in that order. Because arg_name is not quote-delimited, it is not possible to specify arbitrary dictionary keys (e.g., the strings ’10’ or ‘:-]’ ) within a format string. The arg_name can be followed by any number of index or attribute expressions. An expression of the form ‘.name’ selects the named attribute using getattr() , while an expression of the form ‘[index]’ does an index lookup using __getitem__() .
Changed in version 3.1: The positional argument specifiers can be omitted for str.format() , so ‘<> <>‘.format(a, b) is equivalent to ‘ <0><1>‘.format(a, b) .
Changed in version 3.4: The positional argument specifiers can be omitted for Formatter .
Some simple format string examples:
The conversion field causes a type coercion before formatting. Normally, the job of formatting a value is done by the __format__() method of the value itself. However, in some cases it is desirable to force a type to be formatted as a string, overriding its own definition of formatting. By converting the value to a string before calling __format__() , the normal formatting logic is bypassed.
Three conversion flags are currently supported: ‘!s’ which calls str() on the value, ‘!r’ which calls repr() and ‘!a’ which calls ascii() .
The format_spec field contains a specification of how the value should be presented, including such details as field width, alignment, padding, decimal precision and so on. Each value type can define its own “formatting mini-language” or interpretation of the format_spec.
Most built-in types support a common formatting mini-language, which is described in the next section.
A format_spec field can also include nested replacement fields within it. These nested replacement fields may contain a field name, conversion flag and format specification, but deeper nesting is not allowed. The replacement fields within the format_spec are substituted before the format_spec string is interpreted. This allows the formatting of a value to be dynamically specified.
See the Format examples section for some examples.
Format Specification Mini-Language¶
“Format specifications” are used within replacement fields contained within a format string to define how individual values are presented (see Format String Syntax and Formatted string literals ). They can also be passed directly to the built-in format() function. Each formattable type may define how the format specification is to be interpreted.
Most built-in types implement the following options for format specifications, although some of the formatting options are only supported by the numeric types.
A general convention is that an empty format specification produces the same result as if you had called str() on the value. A non-empty format specification typically modifies the result.
The general form of a standard format specifier is:
If a valid align value is specified, it can be preceded by a fill character that can be any character and defaults to a space if omitted. It is not possible to use a literal curly brace (” < ” or “ >”) as the fill character in a formatted string literal or when using the str.format() method. However, it is possible to insert a curly brace with a nested replacement field. This limitation doesn’t affect the format() function.
The meaning of the various alignment options is as follows:
|
Option |
Meaning |
|---|---|
|
‘<‘ |
Forces the field to be left-aligned within the available space (this is the default for most objects). |
|
‘>’ |
Forces the field to be right-aligned within the available space (this is the default for numbers). |
|
‘=’ |
Forces the padding to be placed after the sign (if any) but before the digits. This is used for printing fields in the form ‘+000000120’. This alignment option is only valid for numeric types. It becomes the default for numbers when ‘0’ immediately precedes the field width. |
|
‘^’ |
Forces the field to be centered within the available space. |
Note that unless a minimum field width is defined, the field width will always be the same size as the data to fill it, so that the alignment option has no meaning in this case.
The sign option is only valid for number types, and can be one of the following:
|
Option |
Meaning |
|---|---|
|
‘+’ |
indicates that a sign should be used for both positive as well as negative numbers. |
|
‘-‘ |
indicates that a sign should be used only for negative numbers (this is the default behavior). |
|
space |
indicates that a leading space should be used on positive numbers, and a minus sign on negative numbers. |
The ‘z’ option coerces negative zero floating-point values to positive zero after rounding to the format precision. This option is only valid for floating-point presentation types.
Changed in version 3.11: Added the ‘z’ option (see also PEP 682).
The ‘#’ option causes the “alternate form” to be used for the conversion. The alternate form is defined differently for different types. This option is only valid for integer, float and complex types. For integers, when binary, octal, or hexadecimal output is used, this option adds the respective prefix ‘0b’ , ‘0o’ , ‘0x’ , or ‘0X’ to the output value. For float and complex the alternate form causes the result of the conversion to always contain a decimal-point character, even if no digits follow it. Normally, a decimal-point character appears in the result of these conversions only if a digit follows it. In addition, for ‘g’ and ‘G’ conversions, trailing zeros are not removed from the result.
The ‘,’ option signals the use of a comma for a thousands separator. For a locale aware separator, use the ‘n’ integer presentation type instead.
Changed in version 3.1: Added the ‘,’ option (see also PEP 378).
The ‘_’ option signals the use of an underscore for a thousands separator for floating point presentation types and for integer presentation type ‘d’ . For integer presentation types ‘b’ , ‘o’ , ‘x’ , and ‘X’ , underscores will be inserted every 4 digits. For other presentation types, specifying this option is an error.
Changed in version 3.6: Added the ‘_’ option (see also PEP 515).
width is a decimal integer defining the minimum total field width, including any prefixes, separators, and other formatting characters. If not specified, then the field width will be determined by the content.
When no explicit alignment is given, preceding the width field by a zero ( ‘0’ ) character enables sign-aware zero-padding for numeric types. This is equivalent to a fill character of ‘0’ with an alignment type of ‘=’ .
Changed in version 3.10: Preceding the width field by ‘0’ no longer affects the default alignment for strings.
The precision is a decimal integer indicating how many digits should be displayed after the decimal point for presentation types ‘f’ and ‘F’ , or before and after the decimal point for presentation types ‘g’ or ‘G’ . For string presentation types the field indicates the maximum field size — in other words, how many characters will be used from the field content. The precision is not allowed for integer presentation types.
Finally, the type determines how the data should be presented.
The available string presentation types are:
|
Type |
Meaning |
|---|---|
|
‘s’ |
String format. This is the default type for strings and may be omitted. |
|
None |
The same as ‘s’ . |
The available integer presentation types are:
|
Type |
Meaning |
|---|---|
|
‘b’ |
Binary format. Outputs the number in base 2. |
|
‘c’ |
Character. Converts the integer to the corresponding unicode character before printing. |
|
‘d’ |
Decimal Integer. Outputs the number in base 10. |
|
‘o’ |
Octal format. Outputs the number in base 8. |
|
‘x’ |
Hex format. Outputs the number in base 16, using lower-case letters for the digits above 9. |
|
‘X’ |
Hex format. Outputs the number in base 16, using upper-case letters for the digits above 9. In case ‘#’ is specified, the prefix ‘0x’ will be upper-cased to ‘0X’ as well. |
|
‘n’ |
Number. This is the same as ‘d’ , except that it uses the current locale setting to insert the appropriate number separator characters. |
|
None |
The same as ‘d’ . |
In addition to the above presentation types, integers can be formatted with the floating point presentation types listed below (except ‘n’ and None ). When doing so, float() is used to convert the integer to a floating point number before formatting.
The available presentation types for float and Decimal values are:
|
Type |
Meaning |
|---|---|
|
‘e’ |
Scientific notation. For a given precision p , formats the number in scientific notation with the letter ‘e’ separating the coefficient from the exponent. The coefficient has one digit before and p digits after the decimal point, for a total of p + 1 significant digits. With no precision given, uses a precision of 6 digits after the decimal point for float , and shows all coefficient digits for Decimal . If no digits follow the decimal point, the decimal point is also removed unless the # option is used. |
|
‘E’ |
Scientific notation. Same as ‘e’ except it uses an upper case ‘E’ as the separator character. |
|
‘f’ |
Fixed-point notation. For a given precision p , formats the number as a decimal number with exactly p digits following the decimal point. With no precision given, uses a precision of 6 digits after the decimal point for float , and uses a precision large enough to show all coefficient digits for Decimal . If no digits follow the decimal point, the decimal point is also removed unless the # option is used. |
|
‘F’ |
Fixed-point notation. Same as ‘f’ , but converts nan to NAN and inf to INF . |
|
‘g’ |
General format. For a given precision p >= 1 , this rounds the number to p significant digits and then formats the result in either fixed-point format or in scientific notation, depending on its magnitude. A precision of 0 is treated as equivalent to a precision of 1 . The precise rules are as follows: suppose that the result formatted with presentation type ‘e’ and precision p-1 would have exponent exp . Then, if m <= exp < p , where m is -4 for floats and -6 for Decimals , the number is formatted with presentation type ‘f’ and precision p-1-exp . Otherwise, the number is formatted with presentation type ‘e’ and precision p-1 . In both cases insignificant trailing zeros are removed from the significand, and the decimal point is also removed if there are no remaining digits following it, unless the ‘#’ option is used. With no precision given, uses a precision of 6 significant digits for float . For Decimal , the coefficient of the result is formed from the coefficient digits of the value; scientific notation is used for values smaller than 1e-6 in absolute value and values where the place value of the least significant digit is larger than 1, and fixed-point notation is used otherwise. Positive and negative infinity, positive and negative zero, and nans, are formatted as inf , -inf , 0 , -0 and nan respectively, regardless of the precision. |
|
‘G’ |
General format. Same as ‘g’ except switches to ‘E’ if the number gets too large. The representations of infinity and NaN are uppercased, too. |
|
‘n’ |
Number. This is the same as ‘g’ , except that it uses the current locale setting to insert the appropriate number separator characters. |
|
‘%’ |
Percentage. Multiplies the number by 100 and displays in fixed ( ‘f’ ) format, followed by a percent sign. |
|
None |
For float this is the same as ‘g’ , except that when fixed-point notation is used to format the result, it always includes at least one digit past the decimal point. The precision used is as large as needed to represent the given value faithfully. For Decimal , this is the same as either ‘g’ or ‘G’ depending on the value of context.capitals for the current decimal context. The overall effect is to match the output of str() as altered by the other format modifiers. |
Format examples¶
This section contains examples of the str.format() syntax and comparison with the old % -formatting.
In most of the cases the syntax is similar to the old % -formatting, with the addition of the <> and with : used instead of % . For example, ‘%03.2f’ can be translated to ‘<:03.2f>‘ .
The new format syntax also supports new and different options, shown in the following examples.
С чего начать?
Я предлагаю использовать PyCharm IDE. По студенческой почте можно активировать студенческий пакет на многие продукты от JetBrains, в том числе PyCharm. Сделать это можно тут.
Но если вам не хочется сразу ставить себе IDE, то можно опробовать Python и онлайн. Для этого можно использовать сайт repl.it.
Переменные
Переменная — это не что иное, как слово, которое несет в себе значение. В Питоне, в отличие от C# или С++, нам не нужно упоминать тип данных переменной, такой как int, String и Float.
Допустим, вы хотите сохранить значение 10 в переменной — посмотрите сами, как это просто:
Объявление переменной
Динамическая семантика Python автоматически рассматривает переменную как Int. Теперь, когда мы знаем, как объявить переменную и присвоить ей значение, следующий шаг — изучить различные типы переменных.
Int, Float, String и Boolean — это основные типы данных, поддерживаемые python. Посмотрите, как объявлять и присваивать им значения:
Основные типы данных в Python
Благодаря простому синтаксису Python мы можем объявить несколько переменных в одном с разными типами данных. Пример:
Основные операции
Теперь, когда мы научились создавать переменные, пришло время изучить основные функциональные возможности — поиск длины строки, преобразование строки в верхний или нижний регистр и многое другое.
Длина строки: Python содержит функцию len(), которая возвращает количество элементов в данном контейнере. В нашем случае контейнер — это строка, а возвращаемое значение — ее длина. Пример:
Индексация: мы можем найти значение или символ, присутствующий в определенной позиции в строке, используя индексацию. Главное, что мы должны иметь в виду, — это то, что индексация начинается с нуля. Пример:
Сложение строк: мы можем соединить две строки в python, используя символ плюс (+). Он похож на синтаксис С#. Пример:
Slicing: это отличная функция в Python, с помощью которой мы можем получить части строки, используя их индекс, как показано ниже:
Strip: с помощью strip мы можем удалить начальные и конечные пробелы в строке. Если вы хотите удалить только начальные пробелы, мы можем использовать lstrip() или удалить пробелы в конце с помощью rstrip().
Find & Replace: это стандартные функции в любом языке программирования — find используется для проверки того, находится ли желаемое значение в фактическом значении, а replace используется для удаления определенного значения, а затем добавления желаемого значения в это место. Пример:
Преобразования: мы можем преобразовать строку в верхний регистр, нижний регистр или регистр заголовка, используя функции upper(), lower() и title() соответственно.
Массивы
До сих пор мы видели различное использование переменных, которые могут содержать одно значение. Но что делать, если мы хотим сохранить список значений — вот где используются массивы.
В Python существует четыре типа массивов:
1) Список
Список представляет собой набор значений, которые могут быть обновлены в любой момент. В Python списки представлены в квадратных скобках. Пример:
Списки могут содержать любые типы данных, как показано ниже:
Мы можем выполнять некоторые полезные операции со списками, такие как добавление или удаление данных, сортировка списка и вставка данных в определенный индекс. Пример:
2) Кортеж
Кортеж похож на список, но вы не можете добавить данные после инициализации, и он представлен круглыми скобками, как показано ниже:
Мы не можем добавлять/удалять данные в кортеже, но мы можем сделать некоторые полезные вещи, такие как поиск максимального/минимального значения, количество элементов в кортеже и индекс элемента. Пример:
3) Множество
Множество — это массив, который не индексируется и неупорядочен. В множестве не допускается дублирование значений. Множество представляется фигурными скобками, как показано ниже:
Как и в других типах массивов, мы можем добавлять, удалять и обновлять данные в множествах. Пример:
4) Словарь
Словарь — это другой тип массивов. Словарь содержат данные в парах ключ-значение. Дубликаты элементов не допускаются.
Мы можем получить все ключи или значения в словаре с помощью двух уникальных функций, называемых keys() и values() соответственно. Пример:
Операторы
Логические операторы
Логические операторы являются одним из фундаментальных операторов в любом языке. Python имеет три логических оператора, таких как and, or, not.
And: возвращает true, если все состояния истинны.
Or: возвращает true, если какое-либо из утверждений истинно.
Not: он сделает результа ”обратным”, предположим, что если он истинен, то он вернет false.
Операторы истинности
В python есть два оператора истинности — is и is not
is: возвращает true, если обе переменные одинаковы.
is not: возвращает true, если обе переменные не совпадают.
Циклы
Здесь мы рассмотрим циклы while и for в Python. Оба имеют схожую функциональность, но различаются по синтаксису.
Цикл while
while выполняет серию операторов многократно до тех пор, пока данное условие не будет выполнено. Взгляните на синтаксис:
Здесь i ≤ 5-это условие. Первоначально значение i равно 1, и на каждой итерации i увеличивается на 1. На 5-й итерации значение i равно 6, и условие не выполняется, поэтому цикл завершается.
Цикл for
Цикл for чаще всего используется для прохождения по всему массиву.
Здесь последовательность является массивом, и для каждой итерации значение в массиве по этому индексу будет присвоено iterator_var, к которому мы можем получить доступ внутри цикла. Итерация завершается на конечном индексе списка.
Ниже приведен общий синтаксис цикла for:
for iterator_var in sequence:
statements(s)
Давайте сделаем простой пример цикла for — у нас есть список с номерами 1, 2, 3, 4, и цель здесь состоит в том, чтобы получить сумму элементов в списке, используя цикл for. Пример:
Условные операторы
Некоторые из основных условных операторов Python — это if, elif, continue и break. Давайте посмотрим, как их использовать:
- if — Оператор if записывается с помощью ключевого слова if, за которым следует условие и заканчивается двоеточием. Если условие выполнено, то операторы внутри него будут выполняться. Если условие не выполнено, то мы можем выполнить другой набор операторов, используя ключевое слово else, как показано ниже.
- elif — elif удобно, когда у нас есть более двух условий. Давайте возьмем приведенный выше пример, если i равен нулю, то он отображается как четный, но 0 не является ни четным, ни нечетным — это можно решить с помощью elif, как показано ниже:
- Continue — это ключевое слово, которое удобно использовать с циклами. С помощью этого ключевого слова мы можем пропустить текущую итерацию. Пример:
- break похож на continue, но когда вы вызываете break вместо пропуска текущих итераций, он завершает весь цикл.
Что еще крутого умеет Python?
Print
Как мы уже видели, существует два способа использования печати для отображения данных в консоли: один — это передача значения непосредственно в функции печати, а другой-передача аргументов, разделенных запятыми. Пример:
Комментарии
При работе на любом языке разработчики включают комментарии в код, чтобы сделать его понятным для других разработчиков. Python предоставляет два типа комментариев — однострочные и многострочные.
Однострочный: этот тип комментариев представлен символом # в начале, как показано ниже:
Многострочный: этот тип комментария полезен для написания длинного объяснения функции или для комментирования фрагмента кода. Тройные кавычки представляют собой многострочный комментарий в начале и конце сообщения. Пример:
Range
range() -это встроенная функция в Python. Проще говоря, функция range() позволяет пользователям генерировать ряд чисел в заданном диапазоне. И обычно он используется для зацикливания, например:
Надеемся, что этот текст позволил вам кратко окунуться в Python. Возможно, что вам стало страшно и непонятно…как с этим бороться?
Строки в Python
Cтрока — это последовательность символов. Например, «hello» — это строка, состоящая из набора символов: ‘h’ , ‘e’ , ‘l’ , ‘l’ и ‘o’ .
Для представления строки в Python могут использоваться двойные или одинарные кавычки. Например:
Пример использования строк в Python:
Python
I love Python.
Здесь создаются строковые переменные: name и message , содержащие значения: «Python» и «I love Python» соответственно. Хотя в данном примере для представления строк используются двойные кавычки, могут использоваться и одинарные.
Доступ к символам строки в Python
Доступ к символам строки в Python может осуществляться тремя способами:
Индексация: рассмотрение строки как списка и получение доступа к символу по его индексу. Например:
Отрицательная индексация: подобно списку, в Python разрешена отрицательная индексация для доступа к символам строки. Например:
Срез: получение доступа к диапазону символов строки посредством оператора среза : . Например:
Примечание: Если попытаться получить доступ к индексу за пределами диапазона или использовать числа, отличные от целых (например, числа с плавающей точкой), то Python выдаст ошибку.
Иммутабельность строк в Python
Строки в Python иммутабельны. Это означает, что составляющие их символы не могут быть изменены. Например:
TypeError: ‘str’ object does not support item assignment
Однако, переменной можно присвоить новое строковое значение. Например:
Многострочные строки в Python
В Python существуют многострочные строки. Для их создания используются тройные двойные «»» или тройные одинарные »’ кавычки. Например:
Never gonna give you up
Never gonna let you down
Здесь все то, что заключено в тройные кавычки, является одной многострочной строкой.
Операции со строками в Python
Возможность осуществления множества операций со строками делает этот тип данных одним из самых часто используемых в Python.
Сравнение двух строк
Для сравнения двух строк используется оператор == . Если строки одинаковые, оператор вернет True , в противном случае — False . Например:
В данном примере:
str1 и str2 не одинаковые. Следовательно, результат False .
str1 и str3 одинаковые. Следовательно, результат True .
Сочетание (конкатенация) двух и более строк
В Python две и более строки могут быть объединены (конкатенированы) с помощью оператора + . Например:
Здесь оператор + используется для конкатенации двух строк: greet и name .
Итерация по строке
В Python можно итерироваться по строке посредством цикла for. Например:
Длина строки в Python
Узнать длину строки в Python можно с помощью метода len() . Например:
Проверка на принадлежность к строке
Проверить, содержится ли заданная подстрока в строке, можно при помощи ключевого слова in . Например:
Методы для работы со строками в Python
Помимо упомянутых выше, в Python имеется множество различных методов для работы со строками. Вот некоторые из них:
| Метод | Описание |
| upper() | Приводит строку к верхнему регистру. |
| lower() | Приводит строку к нижнему регистру. |
| partition() | Возвращает кортеж из трех частей строки, согласно указанному разделителю. |
| replace() | Заменяет подстроку внутри строки. |
| find() | Возвращает индекс первого вхождения заданной подстроки в строку. |
| rstrip() | Удаляет все указанные символы, начиная с конца строки. |
| split() | Разделяет строку согласно указанному разделителю. |
| startswith() | Проверяет, начинается ли строка с указанной строки. |
| isnumeric() | Проверяет, все ли символы строки являются цифрами. |
| index() | Возвращает индекс подстроки. |
Escape-последовательности в Python
Управляющие последовательности (или «Escape-последовательности») используются для экранирования определенных символов в строке.
Предположим, вам нужно включить в строку как двойные, так и одинарные кавычки:
Урок 4
Работа со строками

Последовательности в Python
Последовательность(Sequence Type) — итерируемый контейнер, к элементам которого есть эффективный доступ с использованием целочисленных индексов.
Последовательности могут быть как изменяемыми, так и неизменяемыми. Размерность и состав созданной однажды неизменяемой последовательности не может меняться, вместо этого обычно создаётся новая последовательность.
-
— изменяемая — неизменяемая — неизменяемая
- Строка (str, unicode) — неизменяемая
2. С помощью тройных кавычек.
Главное достоинство строк в тройных кавычках в том, что их можно использовать для записи многострочных блоков текста. Внутри такой строки возможно присутствие кавычек и апострофов, главное, чтобы не было трех кавычек подряд. Пример:


Экранированные последовательности — это служебные наборы символов, которые позволяют вставить нестандартные символы, которые сложно ввести с клавиатуры.
В таблице перечислены самые часто используемые экранированные последовательности:
«Сырые строки»
Если перед открывающей кавычкой стоит символ ‘r’ (в любом регистре), то механизм экранирования отключается.
Это может быть нужно, например, в такой ситуации:
str = r’C:\new_file.txt’


Итак, строки в Python поддерживают две группы методов:
-
( list ) ( tuple ) ( range ).
- Обработки двоичных данных( binary data ) и
- Текстовых строк( str ).


Далее будем рассматривать базовые операции, которые можно выполнять со строками. Начнем со сложения и умножения строк. Они, как мы уже выяснили выше, относятся к группе общих операций над последовательностями. Итак:
1. Оператор сложения строк +
+ — оператор конкатенации строк. Он возвращает строку, состоящую из совокупности других строк.
Например:

Срезы так же относятся к группе общих операций — они используются для всех последовательностей, а значит и для строковых переменных. Рассмотрим подробнее, что это такое и с чем его едят.
Срез (slice) — извлечение из данной строки одного символа или некоторого фрагмента подстроки или подпоследовательности.
Индекс — номер символа в строке (а также в других структурах данных: списках, кортежах). Обратите внимание, что нумерация начинается с 0 . Если указать отрицательное значение индекса, то номер будет отсчитываться с конца, начиная с номера -1 .
Есть три формы срезов:
1. Самая простая форма среза — взятие одного символа строки — S[i] , где S — строка, i — индекс. Пример:

Задачи по темам

Функции поиска
Как вы уже могли заметить, в Python существует две похожих функции для поиска подстроки — find() (относится к группе строковых методов) и index() (общий метод для SequenceType данных) . Разница в том, что find() вернет -1 , если не найдет искомое, а index() выкинет исключение ValueError .
Кроме того, необходимо помнить, что если нужно только удостовериться, что подстрока присутствует внутри строки — можно просто воспользоваться методом in :
>>> ‘Py’ in ‘Python’
True


В Python версии 3.6 был представлен новый способ форматирования строк. Эта функция официально названа литералом отформатированной строки, но обычно упоминается как f-string . Способов форматирования в Python довольно много, но работу с f-строками мы считаем самым удобным и перспективным способом, поэтому рассмотрим именно его.
Одной простой особенностью f-строк, которую вы можете начать использовать сразу, является интерполяция переменной. Вы можете указать имя переменной непосредственно в f-строковом литерале ( f’string’ ), и Python заменит имя соответствующим значением.
Например, предположим, что вы хотите отобразить результат арифметического вычисления. Это можно сделать с помощью простого print() и оператора , , разделяющего числовые значения и строковые: