1 | Python 速查表中文版 |
- 字符串可通过多种方式格式化:
1 | template = '%.2f %s haha $%d'; |
- **NoneType(None)**:Python
null
值(只有 None 对象的一个实例中存在)。None
不是一个保留关键字,而是 NoneType 的一个唯一实例。None
通常是可选函数参数的默认值:
1 | def func1(a, b, c = None) |
None
的常见用法:
1 | if variable is None : |
- datatime:Python 内建的 datetime 模块提供了
datetime
、data
以及time
类型。datetime
组合了存储于date
和time
中的信息。
1 | #从字符串中创建 datetime |
注:Python 中的绝大多数对象都是可变的,只有字符串和元组例外。
数据结构
注:所有的 non-Get 函数调用,比如下面例子中的 ****list1.sort()**
都是原地操作,即不会创建新的对象,除非特别声明。**
元组
元组是 Python 中任何类型的对象的一个一维、固定长度、不可变的序列。
1 | #创建元组 |
元组应用:
1 | #交换两个变量的值 |
列表
列表是 Python 中任何类型的对象的一个一维、非固定长度、可变(比如内容可以被修改)的序列。
1 | #创建列表 |
- 使用 + 连接列表会有比较大的开支,因为这个过程中会创建一个新的列表,然后复制对象。因此,使用
extend()
是更明智的选择; insert
和append
相比会有更大的开支(时间/空间);- 在列表中检查是否包含一个值会比在字典和集合中慢很多,因为前者需要进行线性扫描,而后者是基于哈希表的,所以只需要花费常数时间。
内建的 bisect
模块
- 对一个排序好的列表进行二分查找或插入;
bisect.bisect
找到元素在列表中的位置,bisect.insort
将元素插入到相应位置。用法:
1 | import bisect |
注:**bisect**
** 模块中的函数并不会去检查列表是否排序好,因为这会花费很多时间。所以,对未排序好的列表使用这些函数也不会报错,但可能会返回不正确的结果。**
针对序列类型的切片
序列类型包括 str
、array
、tuple
、list
等。
用法:
1 | list1[start:stop] |
注:切片结果包含 ****start**
索引,但不包含 **stop**
索引;****start/stop**
** 索引可以省略,如果省略,则默认为序列从开始到结束,如 **list1 == list1[:]**
。**
step
的应用:
1 | #取出奇数位置的元素 |
字典(哈希映射)
1 | #创建字典 |
- 如果键不存在,则会出现
KeyError Exception
。 - 当键不存在时,如果
get()
不提供默认值则会返回None
。 - 以相同的顺序返回键列表和值列表,但顺序不是特定的,又称极大可能非排序。
有效字典键类型
- 键必须是不可变的,比如标量类型(
int
、float
、string
)或者元组(元组中的所有对象也必须是不可变的)。 - 这儿涉及的技术术语是
hashability
。可以用函数hash()
来检查一个对象是否是可哈希的,比如hash('This is a string')
会返回一个哈希值,而hash([1,2])
则会报错(不可哈希)。
集合
- 一个集合是一些无序且唯一的元素的聚集;
- 你可以把它看成只有键的字典;
1 | #创建集合 |
集合操作
- 并(又称或):
set1 | set2
- 交(又称与):
set1 & set2
- 差:
set1 - set2
- 对称差(又称异或):
set1 ^ set2
函数
Python 的函数参数传递是通过引用传递。
- 基本形式
1 | def func1(posArg1, keywordArg1 = 1, ..) |
注
- 关键字参数必须跟在位置参数的后面;
- 默认情况下,Python 不会“延迟求值”,表达式的值会立刻求出来。
函数调用机制
- 所有函数均位于模块内部作用域。见“模块”部分。
- 在调用函数时,参数被打包成一个元组和一个字典,函数接收一个元组
args
和一个字典kwargs
,然后在函数内部解包。
“函数是对象”的常见用法:
1 | def func1(ops = [str.strip, user_define_func, ..], ..): |
返回值
- 如果函数末尾没有
return
语句,则不会返回任何东西。 - 如果有多个返回值则通过一个元组来实现。
1 | return (value1, value2) |
匿名函数(又称 LAMBDA 函数)
- 什么是匿名函数?
匿名函数是一个只包含一条语句的简单函数。
1 | lambda x : x * 2 |
- 匿名函数的应用:’curring’,又称利用已存在函数的部分参数来派生新的函数。
1 | ma60 = lambda x : pd.rolling_mean(x, 60) |
一些有用的函数(针对数据结构)
enumerate()
返回一个序列(i, value)
元组,i
是当前item
的索引。
1 | for i, value in enumerate(collection): |
应用:创建一个序列中值与其在序列中的位置的字典映射(假设每一个值都是唯一的)。
sort()
可以从任意序列中返回一个排序好的序列。
1 | sorted([2, 1, 3]) => [1, 2, 3] |
应用:
1 | sorted(set('abc bcd')) => [' ', |
zip()
函数可以把许多列表、元组或其他序列的元素配对起来创建一系列的元组。
1 | zip(seq1, seq2) => [('seq1_1', 'seq2_1'), (..), ..] |
zip()
可以接收任意数量的序列作为参数,但是产生的元素的数目取决于最短的序列。
应用:多个序列同时迭代:
1 | for i, (a, b) in enumerate(zip(seq1, seq2)): |
unzip
:另一种思考方式是把一些行转化为一些列:
1 | seq1, seq2 = zip(zipOutput) |
reversed()
将一个序列的元素以逆序迭代。
1 | list(reversed(range(10))) |
**reversed()**
** 会返回一个迭代器,****list()**
** 使之成为一个列表。**
控制流
- 用于
if-else
条件中的操作符:
1 | #检查两个变量是否是相同的对象 |
注:Python 中使用 ****and**
**、**or**
、**not**
** 来组合条件,而不是使用 **&&**
**、**||**
、**!**
** 。**
for
循环的常见用法:
1 | #可迭代对象(list、tuple)或迭代器 |
pass
:无操作语句,在不需要进行任何操作的块中使用。- 三元表达式,又称简洁的
if-else
,基本形式:
1 | value = true-expr if condition else false-expr |
- Python 中没有
switch/case
语句,请使用if/elif
。
面向对象编程
- 对象是 Python 中所有类型的根。
- 万物(数字、字符串、函数、类、模块等)皆为对象,每个对象均有一个类型(type)。对象变量是一个指向变量在内存中位置的指针。
- 所有对象均为引用计数。
1 | sys.getrefcount(5) => x |
- 类的基本形式:
1 | class MyObject(object): |
- 有用的交互式工具:
1 | dir(variable1) #列出对象的所有可用方法 |
常见字符串操作
1 | #通过分隔符连接列表/元组 |
对列表和字典以及元组的深入理解
异常处理
- 基本形式:
1 | try: |
- 手动引发异常:
1 | raise AssertionError # 断言失败 |
对列表和字典以及元组的深入理解
语法糖(syntactic sugar)会使代码变得更加易读易写。
对列表的理解
将一些元素通过一个简短的语句传入一个过滤器进行过滤和转化,然后可以组成一个新的列表。
1 | #基本形式 |
可以省略过滤条件,只留下表达式。
对字典的理解
基本形式:
1 | {key-expr : value-expr for value in collection if condition} |
对集合的理解
基本形式:和列表一样,只是应该使用 ()
而不是 []
。
嵌套列表
基本形式:
1 | [expr for val in collection for innerVal in val if condition] |