如何使用Python计算目录中的文件数

224

我需要计算使用Python的目录中的文件数。

我猜最简单的方法是len(glob.glob('*'))，但这也将目录本身视为文件。

有什么方法可以只计算目录中的文件吗？

— 寻求
source

要保留目录，可以对要查找的任何文件扩展名执行“ * .fileextension”。

275

os.listdir()比使用会更有效率glob.glob。要测试文件名是否是普通文件（而不是目录或其他实体），请使用os.path.isfile()：

import os, os.path

# simple version for working with CWD
print len([name for name in os.listdir('.') if os.path.isfile(name)])

# path joining version for other paths
DIR = '/tmp'
print len([name for name in os.listdir(DIR) if os.path.isfile(os.path.join(DIR, name))])

— 丹尼尔·斯图兹巴赫
source

14

如果您不在cwd上，请记住添加folder_path内部内容os.path.filename(name)。 stackoverflow.com/questions/17893542/…–

— 拉斐尔·奥利维拉

1

这不计算嵌套文件夹中的文件。

— codersofthedark 2015年

5

为了递归计数嵌套在目录中的文件，使用os.walk（）解决方案可能会更好。

— Joel B

使用os.path.join(DIR, name)over有DIR + '/' + name什么好处？后者比前者更短，而且海事组织更清楚。也许存在某些OS：es，后者将在其中失败吗？

— HelloGoodbye

@HelloGoodbye正是原因。

— Ellockie '16

102

import os

path, dirs, files = next(os.walk("/usr/lib"))
file_count = len(files)

— 路加
source

2

这不是递归的

— 凯尔·布莱恩斯汀

48

对于所有类型的文件，都包含以下子目录：

import os

list = os.listdir(dir) # dir is your directory path
number_files = len(list)
print number_files

仅文件（避免使用子目录）：

import os

onlyfiles = next(os.walk(dir))[2] #dir is your directory path as string
print len(onlyfiles)

— 吉列尔莫·佩雷拉（Guillermo Pereira）
source

这不是递归的

— 凯尔·布莱恩斯汀

32

这是fnmatch派上用场的地方：

import fnmatch

print len(fnmatch.filter(os.listdir(dirpath), '*.txt'))

更多详细信息：http : //docs.python.org/2/library/fnmatch.html

— 恩吉克
source

3

如果您知道要查找的模式，则速度要快得多（大约是我在具有10,000个文件的目录上进行测试的时间的一半），而不是os.path.isfile()像接受的答案那样对每个文件进行测试。也比快得多glob.glob()。

— CivFan

13

如果要计算目录中的所有文件（包括子目录中的文件），则最Python化的方法是：

import os

file_count = sum(len(files) for _, _, files in os.walk(r'C:\Dropbox'))
print(file_count)

我们使用的总和要比显式添加文件计数（正在等待的时间）更快

— Mr_and_Mrs_D
source

1

您好，我试图理解这个代码（代码工作完美），我知道我们可以用_一个for循环。os.walk我也知道。但是不确定sum函数中的下划线是怎么回事，请您详细说明一下。谢谢！

— Ejaz

1

Unsderscore只是一个变量名@Ejaz，按惯例，当我们忽略该变量时使用-这就是我们在这里所做的-我们称为walk，只计算每个目录中的文件数，而忽略root和dirs walk返回值

— Mr_and_Mrs_D

12

import os
print len(os.listdir(os.getcwd()))

— 皮疹
source

2

有时这可能有用，但是它也包括子目录

— Brian Burns

10

def directory(path,extension):
  list_dir = []
  list_dir = os.listdir(path)
  count = 0
  for file in list_dir:
    if file.endswith(extension): # eg: '.txt'
      count += 1
  return count

— Ninjrok
source

9

我很惊讶没有人提到os.scandir：

def count_files(dir):
    return len([1 for x in list(os.scandir(dir)) if x.is_file()])

— ed
source

与Python 3.6完美搭配！

— 青木Ahishatsu

7

这可以使用os.listdir并适用于任何目录：

import os
directory = 'mydirpath'

number_of_files = len([item for item in os.listdir(directory) if os.path.isfile(os.path.join(directory, item))])

可以使用生成器简化此过程，并通过以下方法使速度更快一点：

import os
isfile = os.path.isfile
join = os.path.join

directory = 'mydirpath'
number_of_files = sum(1 for item in os.listdir(directory) if isfile(join(directory, item)))

— 华金
source

5

def count_em(valid_path):
   x = 0
   for root, dirs, files in os.walk(valid_path):
       for f in files:
            x = x+1
print "There are", x, "files in this directory."
return x

取自这篇文章

— 克里斯蒂安·达米安（Kristian Damian）
source

2

1. files是一个清单。2. OP不在寻找递归计数

— SilentGhost 2010年

4

import os

def count_files(in_directory):
    joiner= (in_directory + os.path.sep).__add__
    return sum(
        os.path.isfile(filename)
        for filename
        in map(joiner, os.listdir(in_directory))
    )

>>> count_files("/usr/lib")
1797
>>> len(os.listdir("/usr/lib"))
2049

— 佐特
source

4

卢克的代码重新格式化。

import os

print len(os.walk('/usr/lib').next()[2])

— 奥科巴卡
source

4

这是我发现有用的简单单行命令：

print int(os.popen("ls | wc -l").read())

— 博扬·通古兹（Bojan Tunguz）
source

ls尽管在shell上这不是一个坏的“快速和肮脏”的方法，但是通常不赞成解析输出（这可能经常引起问题）。ls -1不过，您应该使用，这样可以保证每个文件一行。

— 血腥

3

虽然我同意@DanielStutzbach提供的答案：os.listdir()将比使用效率更高glob.glob。

但是，如果要计算文件夹中特定文件的数量，则需要额外的精度len(glob.glob())。例如，如果您要计算要使用的文件夹中的所有pdf，请执行以下操作：

pdfCounter = len(glob.glob1(myPath,"*.pdf"))

— 磅
source

2

很简单：

print(len([iq for iq in os.scandir('PATH')]))

它只计算目录中的文件数，我使用列表推导技术遍历特定目录，以返回所有文件。“ len（返回列表）”返回文件数。

— 阿哈·萨德（Agha Saad）
source

1

欢迎使用堆栈溢出。可以通过添加以下解释来提高此答案的质量：如何回答

— Elletlar '18

1

谢谢Elletlar，我已经编辑了我的答案，我将确保以更全面的方式回应：D

— Agha Saad

1

import os

total_con=os.listdir('<directory path>')

files=[]

for f_n in total_con:
   if os.path.isfile(f_n):
     files.append(f_n)


print len(files)

— 莫希特·达巴斯（Mohit Dabas）
source

OP要求提供文件数，这也会列出目录。

— Korem 2014年

1

如果您将使用操作系统的标准外壳，则可以更快地获得结果，而不是使用纯pythonic方式。

Windows示例：

import os
import subprocess

def get_num_files(path):
    cmd = 'DIR \"%s\" /A-D /B /S | FIND /C /V ""' % path
    return int(subprocess.check_output(cmd, shell=True))

— 造型师
source

1

但是它不会那么便携。

— Politank-Z 2015年

1

我找到了另一个可能是正确的答案。

for root, dirs, files in os.walk(input_path):    
for name in files:
    if os.path.splitext(name)[1] == '.TXT' or os.path.splitext(name)[1] == '.txt':
        datafiles.append(os.path.join(root,name)) 


print len(files)

— 伊斯梅尔
source

0

我用过glob.iglob类似的目录结构

data
└───train
│   └───subfolder1
│   |   │   file111.png
│   |   │   file112.png
│   |   │   ...
│   |
│   └───subfolder2
│       │   file121.png
│       │   file122.png
│       │   ...
└───test
    │   file221.png
    │   file222.png

以下两个选项均返回4（如预期，即不计算子文件夹本身）

len(list(glob.iglob("data/train/*/*.png", recursive=True)))
sum(1 for i in glob.iglob("data/train/*/*.png"))

— 用户名
source

0

我这样做了，这返回了文件夹（Attack_Data）中文件的数量。

import os
def fcount(path):
    #Counts the number of files in a directory
    count = 0
    for f in os.listdir(path):
        if os.path.isfile(os.path.join(path, f)):
            count += 1

    return count
path = r"C:\Users\EE EKORO\Desktop\Attack_Data" #Read files in folder
print (fcount(path))

— 山姆·埃科罗
source