Select Language

AI社区

AI技术百科

8.10、Python os模块用法详解

在本章的最后,我们来介绍一下 os 模块中有关进程的一些接口函数。在前面已经用到了该模块一些接口函数,如得到当前进程的 PID。这些接口函数比较基础,在不太复杂的环境中也是非常有用的。

如果必须使用进程的一些高级特性,还是推荐使用 multiprocessing 模块或者 subprocess 模块。

1) system():启动进程

可以使用 system() 接口函数来启动一个进程,格式如下:

os.system(命令字符串)

system() 接口函数接收一个字符串格式的命令,然后启动一个进程去运行该命令,并且在该命令返回之前,该接口函数是不会返回的。该函数的返回值是该命令的返回码。

这应该是最常用的一个接口函数,我们可以用其来运行任意的可执行文件或者脚本。注意参数是一个字符串,就是我们在 shell 中输入的内容。

>>> os.system("date")           # date是命令
Mon Jul  1 15:23:27 CST 2019    # 这是date命令的输出
0                               # 这是system()的返回值,就是date命令的返回码

我们可以在命令行字符串中带上参数,如下面的用法:

>>> os.system("echo hello python")
hello python
0

我们还可以使用重定向符、管道等,如下面的用法:

>>> os.system("ps | grep grep")
23645 ttys006    0:00.00 sh -c ps | grep grep
23647 ttys006    0:00.00 grep grep     
0                                             #这是命令的返回码,0表示成功

总之,能够在 shell 中执行的任何命令都可以用这种方式来执行。

2) popen():启动进程并得到输出

system() 接口函数只能够得到子进程的返回码,不能得到子进程的输出。如果希望得到子进程的输出信息,可以使用 open() 接口函数,该接口函数的定义如下:

os.popen(命令行参数字符串)

使用 popen() 可以解决得到标准输出信息这个问题,但是却得不到子进程的返回码。下面的例子演示了得到子进程的标准输出的方法。

>>> r = os.popen("date", "r", 1)        # 第二个参数r表示仅读出
>>> stdout = r.read()                   # 读出子进程的输出
>>> stdout                              # 查看输出
'Mon Jul  1 21:55:27 CST 2019\n'        # 这就是date命令的输出

如果希望为子进程提供输入,可以将第二个参数改为 w,就是我们可以为该子进程写入一些信息。

下面的例子使用了命令 cat-|grep python>a.txt,该命令的意思是从标准输入读入数据,然后通过 grep 来得到所有包含 python 的行,并将这样的行写入到文件 a.txt 中。

# 构造这个命令
>>> w = os.popen("cat - | grep python > a.txt", "w", 1)  # 给cat -这个命令输入一行,注意最后的\n表示换行符
>>> w.write("line1: abcd\n")
                              # 写入的字节数
>>> w.write("line2: love python\n")    # 给cat -这个命令输入另外一行
                              # 写入的字节数
>>> w.close()                          # 关闭w,相当于按下Ctrl+D组合键
>>> fd = open('a.txt', 'r')            # 打开文件a.txt,即命令的输出
>>> fd.read()                          # 读出文件内容
'line2: love python\n'                 # 第二行被保存到a.txt中
>>> fd.close()                         # 关闭a.txt

3) getpid():得到当前进程ID

该函数定义如下:

os.getpid()

该函数返回当前 Python 解释器的进程 ID。

>>> os.getpid()                        # 得到当前Python解释器的进程ID
21028
>>> os.system("ps | grep python")      # 通过ps命令得到Pyhton相关的进程
21028 ttys006    0:00.17 python3       # 这就是当前的Python解释器对应的进程
24741 ttys006    0:00.00 grep python
25399 ttys006    0:00.00 sh -c ps | grep python
25401 ttys006    0:00.00 grep python

4) getppid():得到父进程ID

该函数返回当前 Python 解释器的父进程 ID。

>>> os.getppid()               # 得到当前Python解释器的父进程,就是一个bash进程
15747
>>> os.system("ps a | grep bash")      # 通过ps来查看相关的bash进程
15747 s006  S      0:00.11 -bash       # 这就是得到当前Python解释器的父进程
25427 s006  S+     0:00.00 sh -c ps a | grep bash
25429 s006  S+     0:00.00 grep bash

除了这些接口函数之外,在 Linux 或者 macOS 版的 Python 中还提供了其他的进程相关的接口函数,如 fork()、kill()、execv(),这些和 C 语言版的进程操作接口函数类似,但是仅在类 UNIX 系统中才存在,所以这些接口函数在 Windows 平台上并不存在,这里也不相关介绍。


我要发帖
  • 10

    条内容
进程是资源分配的单位,线程是操作系统能够调度的最小单位。
通常情况下,一个进程包括至少一个线程,如果有多个线程,其中包括一个主线程。同一个进程内的所有线程共享系统资源,但它们有各自独立的栈、寄存器环境和本地存储。
多线程的好处是可以同时执行多个任务,如果系统有多个计算单元,那么多个线程可以在各自的计算单元并行运行,这样可以极大提升系统的处理效率。
多数情况下进程比线程大,通常一个进程可以包含多个线程。进程的隔离效果比线程好,所以使用多进程会比使用多线程更加安全。多进程相对多线程的缺点是其调度比较重,效率比较低。