Python 简明教程—2.4. 基本语法


(Edisonfang) #1

基础知识

仅仅打印输出 hello world 是不够的,对吧?你想要做的远不止这些——你想要得到一些输入,操作它并从中得到一些东西。我们可以使用常量和变量在 Python 中实现这一点,在本章中我们还会学习其它的一些概念。

注释

注释# 符号右侧的任何文本,主要用作程序读者的注释。

比如:

print('hello world') # 注意,print 是一个函数。

或者:

#注意,print 是一个函数。
print('hello world')

在程序中要使用尽可能多的有用注释:

  • 解释假设(或者前提/条件)
  • 解释重要的决定
  • 解释重要的细节
  • 解释你想要解决的问题
  • 解释你在程序中试图克服的问题,等等。

代码告诉你方式,注释告诉你原因.

这对程序的读者非常有用,这样他们就可以很容易地理解程序正在做什么。请记住,在六个月之后,读者可能就是你自己!

文字常量

一个文字常量的例子是一个数字,如, 51.23;或者是一个字符串,如, 'This is a string'"It's a string!"

它被称为文字,是因为它是 文字的 ——你使用的是它的字面上的值。 数字 2 就是代表它自己,而不代表其它——它是一个 常量,因为它的值不能改变。因此,所有这些都被称为文字常量。

数字

数字主要有两种类型——整数和浮点数。

整数的一个例子是 2,它只是一个整数。

浮点数(floating point numbers,或者简称为 floats )的例子有 3.2352.3E-4。 其中, E 表示 10 的幂。在这种情况下, 52.3E-4 就等于 52.3 * 10^-4

经验丰富的程序员的注意事项

没有单独的 long 类型。 int 类型可以是任意大小的整数。

字符串

字符串是 字符序列 。字符串本质上就是一堆单词。

在 Python 程序中,字符串基本上是无处不在,所以一定要注意下面的内容。

单引号

你可以用单引号指定字符串,如 'Quote me on this'

所有的空格,即引号内的空格和制表符,均保持原样。

双引号

双引号中的字符串与单引号中的字符串完全相同。如, "What's your name?"

三引号

你可以使用三引号——("""''')指定多行字符串。你可以在三引号中自由地使用单引号和双引号。例如:

'''This is a multi-line string. This is the first line.
This is the second line.
"What's your name?," I asked.
He said "Bond, James Bond."
'''

字符串是不可改变的

这就意味着,一旦你创建了一个字符串,你就不能再改变它了。尽管这看上去不是什么好事,但是事实却恰恰相反。在接下来的各种程序中,我们将会了解到为什么这不是一个限制。

C/C++ 程序员请注意

在 Python 中,没有单独的 char 数据类型。根本就没有必要拥有单独的 char 数据类型,并且我保证,你不会对它心心念念的。

Perl/PHP 程序员请注意

要记住,单引号字符串和双引号字符串是相同的——他们没有任何区别。

format 方法

有时候我们可能想从其它信息中构造字符串。这就是 format() 方法可以发挥作用的地方。

将下面几行内容保存为 str_format.py 文件:

age = 20
name = 'Swaroop'

print('{0} was {1} years old when he wrote this book'.format(name, age))
print('Why is {0} playing with that python?'.format(name))

输出:

$ python str_format.py
Swaroop was 20 years old when he wrote this book
Why is Swaroop playing with that python?

它是如何工作的

字符串可以使用某些规范(这里的规范,类似于标签),然后可以调用 format 方法,用 format 方法的相关参数替换这些规范。

看一下我们第一次使用 {0} 的地方,它对应于变量 name ,这是 format 方法的第一个参数。类似地,第二个规范是 {1} ,对应于 age ,这是 format 方法的第二个参数。注意, Python 从 0 开始计数,这就意味着第一个位置的索引号是 0 ,第二个位置的索引号是 1 ,依次类推。

注意,我们也可以使用字符串连接实现相同的效果:

name + ' is ' + str(age) + ' years old'

但是,这样长得太难看,更容易出错。其次,对字符串的转换,通过 format 方法可以自动完成,而不像在本例中一样需要显式地转换为字符串。第三,当使用 format 方法时,我们可以更改消息,而不需要处理使用的变量,反之亦然。

还要注意一点,这些数字是可选的,可填可不填,所以你也可以这样写:

age = 20
name = 'Swaroop'

print('{} was {} years old when he wrote this book'.format(name, age))
print('Why is {} playing with that python?'.format(name))

这里的输出和前一个程序的输出安全相同。

Python 在 format 方法中的作用就是将每一个参数值替换为规范的位置。可以有更加详细的规范,例如:

# 取十进制小数点后的精度为 3 ,得到的浮点数为 '0.333'
print('{0:.3f}'.format(1.0/3))
# 填充下划线 (_) ,文本居中
# 将 '___hello___' 的宽度扩充为 11 
print('{0:_^11}'.format('hello'))
# 用基于关键字的方法打印显示 'Swaroop wrote A Byte of Python'
print('{name} wrote {book}'.format(name='Swaroop', book='A Byte of Python'))

输出:

0.333
___hello___
Swaroop wrote A Byte of Python

由于我们正在讨论的是格式,要注意 print 总是以一个不可见的 「新的一行」 字符(\n)作为结尾,因此对 print 的重复调用将在每个单独的行上打印输出。为了防止这个换行符被打印输出,你可以指定它以一个空(即,什么都没有)作为 end

print('a', end='')
print('b', end='')

输出为:

ab

或者你可以用空格作为 end

print('a', end=' ')
print('b', end=' ')
print('c')

输出为:

a b c

转义序列

假如,你想要一个字符串含有一个单引号('),那该怎么办?例如,字符串是 "What's your name?"。你不能直接用 'What's your name?' 因为 Python 会混淆字符串的起始和结尾位置。因此,你必须指定这个单引号不是代表字符串的结尾。这可以通过所谓的 转义序列 来实现。你可以将单引号指定为 \' :注意是反斜杠。现在,你可以将字符串指定为 'What\'s your name?'

指定特殊字符串的另一个方法是 "What's your name?" 即,使用双引号。类似地,要想在双引号字符串中使用双引号本身,仍然必须要使用转移序列。另外,只能使用转移序列 \\ 表示反斜杠本身。

如果你想要指定两行字符串呢?一种方法是使用 前面 所示的三引号字符串,或者你可以对换行符 \n 使用转义序列来表示开始新的一行。比如:

'This is the first line\nThis is the second line'

另一个非常有用的转移序列是制表符: \t 。还有很多其它的转义序列,但我在这里只提到了最有用的几个转移序列。

需要注意的一点是,在字符串中,行末尾的单个反斜杠表示字符串在下一行中继续,但不添加换行符。例如:

"This is the first sentence.\
This is the second sentence."

等价于

"This is the first sentence. This is the second sentence."

原始字符串

如果你需要指定一些没有特殊处理(转义序列等)的字符串,那么你需要指定一个 原始 字符串,指定方法是在字符串前面加上 r 或者 R 。例如:

r"Newlines are indicated by \n"

正则表达式的用户请注意

在处理正则表达式时,我们一般使用原始字符串。否则,可能需要进行大量的反向操作。例如,可以用 '\\1'r'\1' 进行反向引用。

变量

仅仅使用文字常量的话,很快就会变得枯燥乏味——我们需要某种方法来存储和操作任何信息。这就是 变量 出现的原因。变量,正如这个名字所暗示的——它们的值可以变化,即,你可以使用变量存储任何内容。变量只是存储信息的计算机内存当中的一部分。和文字常量不同的是,你需要一些方法来访问这些变量,因此你需要为它们命名。

标识符命名

变量是标识符的例子。 标识符 是用来标识 某事物 的名名称。在命名标识符的时候必须遵循一些规则:

  • 标识符的第一个字符必须是字母(大写 ASCII 或小写 ASCII 或 Unicode 字符)或者下划线 (_)。
  • 标识符的其余部分可以由字母、下划线 (_) 或者数字 (0-9) 组成。
  • 标识符的名称区分大小写。例如, mynamemyName 相同的。注意前者中的小写 n 和后者中的大写 N
  • 有效 标识符名称的例子有 iname_2_3无效 标识符名称的例子有 2thingsthis is spaced outmy-name 以及 >a1b2_c3

数据类型

变量可以保存不同类型(数据类型)的值。基本类型是数字和字符串,我们已经讨论过了。在后面的章节中,我们将看到如何使用 classes 创建自己的类型。

对象

记住,在 Python 中,一切皆 对象 。这意味着一般情况下,在 Python 中,我们不会说「某物」而是说「对象」。

面向对象编程的程序员请注意:

从某种意义上说,Python 的面向对象是非常纯粹的,因为一切皆对象,包括数字、字符串和函数。

现在我们来看一下,如何使用变量和文字常量。请保存下面的例子并且运行程序。

如何编写 Python 程序?

此后,保存和运行 Python 程序的标准流程如下:

对于 PyCharm

  1. 打开 PyCharm.
  2. 用之前提到的文件名创建新的文件。
  3. 输入例子中给出的程序代码。
  4. 右击并运行当前文件。

注意:当你需要提供 命令行参数 时,点击 Run(运行) -> Edit Configurations(编辑配置) 然后在 Script parameters:(脚本参数) 部分中键入参数,然后点击 OK(确定) 按钮:

对于其它的编辑器

  1. 打开你选择的编辑器。
  2. 键入例子中给出的程序代码。
  3. 将文件保存为前面提到的文件名。
  4. 在解释器中运行命令 python program.py ,以此运行程序。

例子:使用变量和文字常量

键入并运行下面的程序:

# 文件名: var.py
i = 5
print(i)
i = i + 1
print(i)

s = '''This is a multi-line string.
This is the second line.'''
print(s)

输出:

5
6
This is a multi-line string.
This is the second line.

它是如何工作的

下面是这个程序的工作原理。首先,我们使用赋值运算符 (=) 将常量 5 赋值给变量 i 。这一行我们称之为(陈述)语句,因为它陈述了需要完成一些事情,在本例中,我们将变量名 i 与值 5 连接起来。接下来,我们使用 print 语打印输出 i 的值,不言而喻,它会将变量的值打印输出到屏幕上。

然后,我们令 i 中的值加 1 ,并将新值保存到 i 中。然后我们打印输出 i ,不出意外的话,我们会得到 6

同样,我们也可以将文本字符串赋值给变量 s 然后将其打印输出。

静态语言程序员请注意

变量可以直接通过赋值来使用。不需要任何声明或者数据类型定义。

逻辑行和物理行

物理行是当你写程序的时候,你眼睛 看到 的行。逻辑行是 Python 看到 的一个程序语句。Python 默认每一个 物理行 对应一个 逻辑行

一个逻辑行的一个例子就是一个语句,如 print 'hello world' ——如果这是单独一行(正如你在编辑器中看到的那样),那么这也对应于一个物理行。

默认情况下,Python 推荐一行一个语句,这会使代码更具有可读性。

如果你希望在单个物理行中编写更多的逻辑行,则必须使用分号 (;) 显式地指定此逻辑行/此语句的结尾。例如:

i = 5
print(i)

实际上,这等价于

i = 5;
print(i);

也等价于

i = 5; print(i);

等价于

i = 5; print(i)

然而,我 强烈建议 你坚持 一行最多一个语句 ,不要使用分号。事实上,我 从来没有 在 Python 程序中使用过或看到过分号。

在某种情况下,这个观念非常有用,如:有一行很长的代码,你可以使用反斜杠将其分解为多个物理行。我们称之为 显式行连接

s = 'This is a string.\
This continues the string.'
print(s)

输出:

This is a string. This continues the string.

同样,

i =\
5

等价于

i = 5

有时候,有一种隐含的假设,你不需要使用反斜杠。在这种情况下,逻辑行有开始括号、开始方括号或者开始花括号,但是没有结束括号。我们称之为 隐式行连接 。在后面的章节中,当我们使用 list(列表) 编程时,你就可以看到这一点。

缩进

空格在 Python 中非常重要。实际上, 行首的空格非常重要 。这就是所谓的 缩进 。逻辑行开头的前导空格(空格和制表符)用于确定逻辑行的缩进级别,然后用于确定语句的分组。

这就意味着同一组的语句 必须 有相同的缩进。每一个这样的语句集被称为 语句块 。我们将在后面章节中的例子中看到语句块有多么重要。

需要牢记的一件事情是,错误的缩进会导致报错。例如:

i = 5
# 错误如下!注意,在行的开头处有一个空格
 print('Value is', i)
print('I repeat, the value is', i)

当你运行该程序时,你会得到下面的错误:

  File "whitespace.py", line 3
    print('Value is', i)
    ^
IndentationError: unexpected indent

注意,第二行的开头处有一个空格。 Python 指示的错误告诉我们,程序的语法无效,即程序没有按照正确的语法规则编写。对你来讲,这意味着 你不能随意开始一个新的语句块 (当然,你一直使用的默认主语句块除外)。可以使用新语句块情况,我们将会在后面的章节中详细介绍。例如, 控制流

如何缩进

使用四个空格进行缩进。这是 Python 语言的官方建议。优秀的编辑器会自动为你完成缩进操作。要确保你缩进时使用的空格数量一致,否则,程序将无法运行或出现意外的情况。

静态语言程序员请注意

Python 将始终使用缩进进行分块,永远不会使用花括号。运行 from __future__ import braces 可以了解更多信息。

总结

现在我们已经了解了很多细节,那我们就可以继续讨论更加有趣的内容了,比如,控制流语句。务必熟悉本章所述的内容。