本教程是 Python 官方网站上 《Tutorial》 部分文档的翻译,本文档与 官方文档授权一致 。
os
模块提供了许多与操作系统交互的函数:
>>> import os >>> os.getcwd() # Return the current working directory 'C:\\Python38' >>> os.chdir('/server/accesslogs') # Change current working directory >>> os.system('mkdir today') # Run the command mkdir in the system shell 0
一定要使用 import os
而不是 from os import *
。这将避免内建的 open()
函数被 os.open()
隐式替换掉,它们的使用方式大不相同。
内置的 dir()
和 help()
函数可用作交互式辅助工具,用于处理大型模块,如 os
:
>>> import os >>> dir(os) >>> help(os)
对于日常文件和目录管理任务,shutil
模块提供了更易于使用的更高级别的接口:
>>> import shutil >>> shutil.copyfile('data.db', 'archive.db') 'archive.db' >>> shutil.move('/build/executables', 'installdir') 'installdir'
glob
模块提供了一个在目录中使用通配符搜索创建文件列表的函数:
>>> import glob >>> glob.glob('*.py') ['primes.py', 'random.py', 'quote.py']
通用实用程序脚本通常需要处理命令行参数。这些参数作为列表存储在 sys
模块的 argv 属性中。例如,以下输出来自在命令行运行 Python demo.py one two three
>>> import sys >>> print(sys.argv) ['demo.py', 'one', 'two', 'three']
argparse
模块提供了一种更复杂的机制来处理命令行参数。以下脚本可提取一个或多个文件名,并可选择要显示的行数:
import argparse parser = argparse.ArgumentParser(prog = 'top', description = 'Show top lines from each file') parser.add_argument('filenames', nargs='+') parser.add_argument('-l', '--lines', type=int, default=10) args = parser.parse_args() print(args)
当在通过 Python top.py --lines=5 alpha.txt beta.txt
在命令行运行时,该脚本会将 args.lines
设为 5
并将 args.filenames
设为 ['alpha.txt', 'beta.txt']
。
sys
模块还具有 stdin,stdout 和 stderr 的属性。后者对于发出警告和错误消息非常有用,即使在 stdout 被重定向后也可以看到它们:
>>> sys.stderr.write('Warning, log file not found starting a new one\n') Warning, log file not found starting a new one
终止脚本的最直接方法是使用 sys.exit()
。
re
模块为高级字符串处理提供正则表达式工具。对于复杂的匹配和操作,正则表达式提供简洁,优化的解决方案:
>>> import re >>> re.findall(r'\bf[a-z]*', 'which foot or hand fell fastest') ['foot', 'fell', 'fastest'] >>> re.sub(r'(\b[a-z]+) \1', r'\1', 'cat in the the hat') 'cat in the hat'
当只需要简单的功能时,首选字符串方法因为它们更容易阅读和调试:
>>> 'tea for too'.replace('too', 'two') 'tea for two'
math
模块提供对浮点数学的底层 C 库函数的访问:
>>> import math >>> math.cos(math.pi / 4) 0.70710678118654757 >>> math.log(1024, 2) 10.0
random
模块提供了进行随机选择的工具:
>>> import random >>> random.choice(['apple', 'pear', 'banana']) 'apple' >>> random.sample(range(100), 10) # sampling without replacement [30, 83, 16, 4, 8, 81, 41, 50, 18, 33] >>> random.random() # random float 0.17970987693706186 >>> random.randrange(6) # random integer chosen from range(6) 4
statistics
模块计算数值数据的基本统计属性(均值,中位数,方差等):
>>> import statistics >>> data = [2.75, 1.75, 1.25, 0.25, 0.5, 1.25, 3.5] >>> statistics.mean(data) 1.6071428571428572 >>> statistics.median(data) 1.25 >>> statistics.variance(data) 1.3720238095238095
SciPy 项目 <https://scipy.org> 有许多其他模块用于数值计算。
有许多模块可用于访问互联网和处理互联网协议。其中两个最简单的 urllib.request
用于从 URL 检索数据,以及 smtplib
用于发送邮件:
>>> from urllib.request import urlopen >>> with urlopen('http://tycho.usno.navy.mil/cgi-bin/timer.pl') as response: …… for line in response: …… line = line.decode('utf-8') # Decoding the binary data to text. …… if 'EST' in line or 'EDT' in line: # look for Eastern Time …… print(line)
Nov. 25, 09:43:32 PM EST >>> import smtplib >>> server = smtplib.SMTP('localhost') >>> server.sendmail('soothsayer@example.org', 'jcaesar@example.org', …… """To: jcaesar@example.org …… From: soothsayer@example.org …… …… Beware the Ides of March. …… """) >>> server.quit()
(请注意,第二个示例需要在 localhost 上运行的邮件服务器。)
datetime
模块提供了以简单和复杂的方式操作日期和时间的类。虽然支持日期和时间算法,但实现的重点是有效的成员提取以进行输出格式化和操作。该模块还支持可感知时区的对象。
>>> # dates are easily constructed and formatted >>> from datetime import date >>> now = date.today() >>> now datetime.date(2003, 12, 2) >>> now.strftime("%m-%d-%y. %d %b %Y is a %A on the %d day of %B.") '12-02-03. 02 Dec 2003 is a Tuesday on the 02 day of December.' >>> # dates support calendar arithmetic >>> birthday = date(1964, 7, 31) >>> age = now - birthday >>> age.days 14368
常见的数据存档和压缩格式由模块直接支持,包括:zlib
, gzip
, bz2
, lzma
, zipfile
和 tarfile
。:
[版权声明] :本文文字、代码及图片版权归原作者所有,任何媒体、网站或个人未经本网协议授权不得采集、整理、转载或以其他方式复制发表。已经本站协议授权的媒体、网站,在使用时必须注明“稿件来源:学研谷”。