Python进程使用的总内存?


265

Python程序是否有办法确定当前正在使用多少内存?我已经看到了有关单个对象的内存使用情况的讨论,但是我需要的是该过程的总内存使用情况,以便可以确定何时需要开始丢弃缓存的数据。

Answers:


301

是适用于各种操作系统(包括Linux,Windows 7等)的有用解决方案:

import os
import psutil
process = psutil.Process(os.getpid())
print(process.memory_info().rss)  # in bytes 

在我当前使用psutil 5.6.3安装的python 2.7中,最后一行应为

print(process.memory_info()[0])

相反(API发生了变化)。

注意:pip install psutil如果尚未安装,请执行此操作。


3
psutil是跨平台的,并且可以返回与ps命令行工具相同的值:pythonhosted.org/psutil/#psutil.Process.memory_info
amos 2014年

1
文档(psutil
Cecilia

2
为什么这个数字与流程浏览器中的数字不匹配?psutil中的数字似乎总是增加了大约10%。
wordforthewise

39
请注意,psutil不在标准库中
grisaitis

12
对于的最新版本psutilpsutil.Process()等同于psutil.Process(os.getpid())。这是您需要记住的少一件事。
rnorris '19

208

对于基于Unix的系统(Linux,Mac OS X,Solaris),可以使用getrusage()标准库模块中的功能resource。产生的对象具有属性ru_maxrss,该属性给出了调用过程的峰值内存使用情况:

>>> resource.getrusage(resource.RUSAGE_SELF).ru_maxrss
2656  # peak memory usage (kilobytes on Linux, bytes on OS X)

Python文档不记单位。请参阅您特定系统的man getrusage.2页面以检查单位的值。在Ubuntu 18.04上,单位记为千字节。在Mac OS X上,它是字节。

getrusage()还可以提供该功能resource.RUSAGE_CHILDREN以获取子进程的使用情况,以及(在某些系统上)resource.RUSAGE_BOTH总(自身和子)进程的使用情况。

如果你只关心Linux的,则可以选择阅读/proc/self/status/proc/self/statm在其他的答案对这个问题,并描述文件一个了。


2
好吧,会的。我不确定SO是否有合并问题的流程或什么。重复的帖子部分是为了向人们展示在两个问题上都有一个标准的图书馆解决方案……部分是针对销售代表的。;)我应该删除此答案吗?
内森·克雷克

6
Mac OS绝对以字节为单位返回RSS,Linux以千字节为单位返回。
尼尔

13
单位不是千字节。它与平台有关,因此您必须使用resource.getpagesize()进行查找。给定的Python文档(docs.python.org/2/library/resource.html#resource-usage)实际上非常清楚。我的盒子里是4096。
本林

5
@BenLin那些Python文档显然是错误的,或者Mac版本上存在错误。getrusage使用的单位和getpagesize返回的值肯定是不同的。
安德鲁

6
该问题询问当前的用法。请注意,这是最大用法。(这仍然是一个有用的答案,只是警告错误地将其粘贴粘贴的人。)
卢克,

65

在Windows上,您可以使用WMI(主页Cheeseshop):


def memory():
    import os
    from wmi import WMI
    w = WMI('.')
    result = w.query("SELECT WorkingSet FROM Win32_PerfRawData_PerfProc_Process WHERE IDProcess=%d" % os.getpid())
    return int(result[0].WorkingSet)

在Linux上(来自python cookbook http://code.activestate.com/recipes/286222/

import os
_proc_status = '/proc/%d/status' % os.getpid()

_scale = {'kB': 1024.0, 'mB': 1024.0*1024.0,
          'KB': 1024.0, 'MB': 1024.0*1024.0}

def _VmB(VmKey):
    '''Private.
    '''
    global _proc_status, _scale
     # get pseudo file  /proc/<pid>/status
    try:
        t = open(_proc_status)
        v = t.read()
        t.close()
    except:
        return 0.0  # non-Linux?
     # get VmKey line e.g. 'VmRSS:  9999  kB\n ...'
    i = v.index(VmKey)
    v = v[i:].split(None, 3)  # whitespace
    if len(v) < 3:
        return 0.0  # invalid format?
     # convert Vm value to bytes
    return float(v[1]) * _scale[v[2]]


def memory(since=0.0):
    '''Return memory usage in bytes.
    '''
    return _VmB('VmSize:') - since


def resident(since=0.0):
    '''Return resident memory usage in bytes.
    '''
    return _VmB('VmRSS:') - since


def stacksize(since=0.0):
    '''Return stack size in bytes.
    '''
    return _VmB('VmStk:') - since

14
Windows代码对我不起作用。此更改确实:return int(result[0].WorkingSet)
John Fouhy 2010年

1
即使修改了John Fouhy的注释,此Windows代码也不适用于Windows 7 x64。
Basj 2014年

我有这个错误:在self._raw_query(wql)中为obj返回[ wmi_object(obj,instance_of,字段)。]文件“ C:\ Python27 \ lib \ site-packages \ win32com \ client \ util.py”,第84行,在下一个返回_get_good_object_(self._iter .next(),resultCLSID = self.resultCLSID)pywintypes.com_error:(-2147217385,'OLE error 0x80041017',None,None)是否有人可以帮助我?我赢了8 x64,但在x32上使用了python
Radu Vlad

注意:在检查了wmi模块的(最新)源之后,我按照John Fouhy的建议更新了Windows示例。另见(1)(2)
jedwards

33

在UNIX上,您可以使用该ps工具进行监视:

$ ps u -p 1347 | awk '{sum=sum+$6}; END {print sum/1024}'

其中1347是某个进程ID。此外,结果以MB为单位。


7

Linux,Python 2,Python 3和pypy上当前进程的当前内存使用情况,没有任何导入:

def getCurrentMemoryUsage():
    ''' Memory usage in kB '''

    with open('/proc/self/status') as f:
        memusage = f.read().split('VmRSS:')[1].split('\n')[0][:-3]

    return int(memusage.strip())

在Linux 4.4和4.9上进行了测试,但即使是早期的Linux版本也可以使用。

在文件中man proc查找信息并进行搜索/proc/$PID/status,它提到了某些字段的最低版本(例如Linux 2.6.10的“ VmPTE”),但是“ VmRSS”字段(我在这里使用)没有提及。因此,我认为它从早期版本就已经存在。


5

我喜欢,谢谢@bayer。我现在有一个特定的过程计数工具。

# Megabyte.
$ ps aux | grep python | awk '{sum=sum+$6}; END {print sum/1024 " MB"}'
87.9492 MB

# Byte.
$ ps aux | grep python | awk '{sum=sum+$6}; END {print sum " KB"}'
90064 KB

附上我的流程清单。

$ ps aux  | grep python
root       943  0.0  0.1  53252  9524 ?        Ss   Aug19  52:01 /usr/bin/python /usr/local/bin/beaver -c /etc/beaver/beaver.conf -l /var/log/beaver.log -P /var/run/beaver.pid
root       950  0.6  0.4 299680 34220 ?        Sl   Aug19 568:52 /usr/bin/python /usr/local/bin/beaver -c /etc/beaver/beaver.conf -l /var/log/beaver.log -P /var/run/beaver.pid
root      3803  0.2  0.4 315692 36576 ?        S    12:43   0:54 /usr/bin/python /usr/local/bin/beaver -c /etc/beaver/beaver.conf -l /var/log/beaver.log -P /var/run/beaver.pid
jonny    23325  0.0  0.1  47460  9076 pts/0    S+   17:40   0:00 python
jonny    24651  0.0  0.0  13076   924 pts/4    S+   18:06   0:00 grep python

参考


只是避免多管道的代码优化ps aux | awk '/python/{sum+=$6}; END {print sum/1024 " MB"}'
NeronLeVelu 17-10-4

4

对于Python 3.6和psutil 5.4.5,更容易使用此处memory_percent()列出的函数。

import os
import psutil
process = psutil.Process(os.getpid())
print(process.memory_percent())

1
这需要LIB psutil
confiq

4

甚至比/proc/self/status:更容易使用/proc/self/statm。这只是几个统计信息之间用空格分隔的列表。我无法判断两个文件是否总是存在。

/ proc / [pid] / statm

提供有关内存使用情况的信息,以页为单位。这些列是:

  • 大小(1)程序总大小(与/ proc / [pid] / status中的VmSize相同)
  • 常驻(2)常驻集大小(与/ proc / [pid] / status中的VmRSS相同)
  • 共享(3)个常驻共享页面(即由文件支持)的数量(与/ proc / [pid] / status中的RssFile + RssShmem相同)
  • 文字(4)文字(代码)
  • lib(5)库(从Linux 2.6开始不使用;始终为0)
  • 数据(6)数据+堆栈
  • dt(7)脏页(自Linux 2.6起未使用;始终为0)

这是一个简单的例子:

from pathlib import Path
from resource import getpagesize

PAGESIZE = getpagesize()
PATH = Path('/proc/self/statm')


def get_resident_set_size() -> int:
    """Return the current resident set size in bytes."""
    # statm columns are: size resident shared text lib data dt
    statm = PATH.read_text()
    fields = statm.split()
    return int(fields[1]) * PAGESIZE


data = []
start_memory = get_resident_set_size()
for _ in range(10):
    data.append('X' * 100000)
    print(get_resident_set_size() - start_memory)

生成的列表看起来像这样:

0
0
368640
368640
368640
638976
638976
909312
909312
909312

您可以看到在大约分配了3个100,000字节后,它跳了约300,000字节。


4

下面是我的函数装饰器,它可以跟踪该过程在函数调用之前消耗了多少内存,在函数调用之后使用了多少内存以及执行了多长时间。

import time
import os
import psutil


def elapsed_since(start):
    return time.strftime("%H:%M:%S", time.gmtime(time.time() - start))


def get_process_memory():
    process = psutil.Process(os.getpid())
    return process.memory_info().rss


def track(func):
    def wrapper(*args, **kwargs):
        mem_before = get_process_memory()
        start = time.time()
        result = func(*args, **kwargs)
        elapsed_time = elapsed_since(start)
        mem_after = get_process_memory()
        print("{}: memory before: {:,}, after: {:,}, consumed: {:,}; exec time: {}".format(
            func.__name__,
            mem_before, mem_after, mem_after - mem_before,
            elapsed_time))
        return result
    return wrapper

因此,当您用它装饰一些功能时

from utils import track

@track
def list_create(n):
    print("inside list create")
    return [1] * n

您将能够看到以下输出:

inside list create
list_create: memory before: 45,928,448, after: 46,211,072, consumed: 282,624; exec time: 00:00:00

3
import os, win32api, win32con, win32process
han = win32api.OpenProcess(win32con.PROCESS_QUERY_INFORMATION|win32con.PROCESS_VM_READ, 0, os.getpid())
process_memory = int(win32process.GetProcessMemoryInfo(han)['WorkingSetSize'])

7
可以通过解释其功能和工作方式来改进此功能。
ArtOfWarfare 2014年

2
基于返回的大量数字(8位数字)以及我什么都不做,我猜测这必须是字节?因此,一个相当空闲的交互式实例大约需要28.5 MB。(哇...我什至没有意识到上面的评论是4年前的我了...这很奇怪。)
ArtOfWarfare

3

对于Unix系统time,如果通过-v,则命令(/ usr / bin / time)会为您提供该信息。参见Maximum resident set size下文,这是程序执行期间使用最大(峰值)实际(非虚拟)内存

$ /usr/bin/time -v ls /

    Command being timed: "ls /"
    User time (seconds): 0.00
    System time (seconds): 0.01
    Percent of CPU this job got: 250%
    Elapsed (wall clock) time (h:mm:ss or m:ss): 0:00.00
    Average shared text size (kbytes): 0
    Average unshared data size (kbytes): 0
    Average stack size (kbytes): 0
    Average total size (kbytes): 0
    Maximum resident set size (kbytes): 0
    Average resident set size (kbytes): 0
    Major (requiring I/O) page faults: 0
    Minor (reclaiming a frame) page faults: 315
    Voluntary context switches: 2
    Involuntary context switches: 0
    Swaps: 0
    File system inputs: 0
    File system outputs: 0
    Socket messages sent: 0
    Socket messages received: 0
    Signals delivered: 0
    Page size (bytes): 4096
    Exit status: 0

1
请注意,如果仅尝试使用time而不是,则可能会失败/usr/bin/time。请参阅:askubuntu.com/questions/434289/...
abought

1

使用sh和os来了解python Bayer的答案。

float(sh.awk(sh.ps('u','-p',os.getpid()),'{sum=sum+$6}; END {print sum/1024}'))

答案以兆字节为单位。


4
应该注意的是,“ sh”不是stdlib模块。它可以通过pip安装。
于尔根A.艾哈德
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.