大家好,欢迎来到IT知识分享网。
Python 列出目录中的所有文件
8 分钟阅读
使用各种 Python 方法来列出目录中的所有文件,例如 、glob() 和递归函数。每种方法都包含一个不言自明的示例,以便您轻松掌握它们。最后,你会发现一个表格,比较这些方法,并建议哪个最合适。os.walk()os.listdir()os.scandir()
类似地,Python 的 Glob 模块有一个 glob() 方法,用于检查当前目录中的指定文件。但是还有更深入地了解列出目录中所有文件的每种方法。
列出目录中所有文件的 Python 方法
在这里,我们将演示帮助遍历文件系统和搜索现有文件的函数。
Os.walk() 方法
它通过自上而下或自下而上遍历目录来收集目录中存在的文件名。它返回以下三个元组:
根:仅从输入中获取文件夹。
目录:从根目录获取子目录。
文件:从给定的根目录和目录中获取所有文件。
查找目录和子目录中的所有文本文件
下面是列出给定目录和子目录中所有文件的示例 Python 代码。
import os location = 'c:/test/temp/' files_in_dir = [] # r=>root, d=>directories, f=>files for r, d, f in os.walk(location): for item in f: if '.txt' in item: files_in_dir.append(os.path.join(r, item)) for item in files_in_dir: print("file in dir: ", item)
执行后,结果如下:
c:/test/temp/notes/readme.txt c:/test/temp/release/artifact_list.txt c:/test/temp/dist/doc/readme.txt c:/test/temp/dist/samples/sample.txt
列出给定目录和子目录下的所有目录
检查下面的 Python 代码以查找并打印给定 .dir/subdir
import os location = 'c:/test/temp/' dirs_in_dir = [] # r=>root, d=>directories, f=>files for r, d, f in os.walk(location): for item in d: if '.txt' in item: dirs_in_dir.append(os.path.join(r, item)) for item in dirs_in_dir: print("Dirs under dir: ", item)
执行后,结果如下:
c:/test/temp/notes/ c:/test/temp/release/ c:/test/temp/dist/ c:/test/temp/dist/doc/ c:/test/temp/dist/samples/
Glob.glob() 方法
很多时候,我们必须遍历目录中名称与模式匹配的文件列表。在这种情况下,Python glob 模块有助于捕获给定目录中具有特定扩展名的文件列表。
glob() 函数
此函数获取根据路径名中的给定模式过滤的文件列表。我们可以采用绝对和相对的路径名。通配符,如 * 和 ?也是允许的符号。
List all files in the current directory having “.py” extension
列出当前目录中扩展名为“.py”的所有文件
例如 – 以下 Python 代码列出了当前目录中扩展名为“.py”的所有文件。
import glob location = 'c:/test/temp/' fileset = [file for file in glob.glob(location + "/*.py", recursive=True)] for file in fileset: print(file)
执行后,结果如下:
c:/test/temp/notes/get_sample.py c:/test/temp/release/test1.py c:/test/temp/dist/doc/core.py c:/test/temp/dist/samples/first_sample.py
获取指定目录和子目录中的所有目录
import glob location = 'c:/test/temp/' folderset = [folder for folder in glob.glob(location + "/", recursive=True)] for folder in folderset: print(folder)
运行上述代码后,结果如下:
c:/test/temp/notes/ c:/test/temp/release/ c:/test/temp/dist/ c:/test/temp/dist/doc/ c:/test/temp/dist/samples/
用Path.iterdir()
该函数存在于模块中。它是 Python 3.4 中较新的模块,它提供了一种更强大的方法来处理路径。该方法可用于列出目录中的文件和目录。Path.iterdir()PathlibPath.iterdir()
让我们找出这个 Python 模块如何列出目录中的文件。
from pathlib import Path # Get a list of all the files in the current directory files = Path().iterdir() # Print the list of files for file in files: print(file)
使用该函数os.scandir()
这也是一个相对较新的函数,它返回目录条目的生成器。如果您需要以更有效的方式循环访问目录中的文件,这可能很有用。os.scandir()
下面的 Python 代码,演示了如何使用列出目录中的所有文件。os.scandir()
import os def list_files_with_details(directory): """Lists all of the files in a directory and prints some additional details about each file, such as the file size and the file type.""" # Get a generator of directory entries entries = os.scandir(directory) # Iterate over the directory entries and print some details about each file for entry in entries: # Get the file size file_size = entry.stat().st_size # Get the file type file_type = entry.stat().st_mode # Print the file name, file size, and file type print(f"{entry.name}: {file_size} bytes ({file_type})") # List the files in the current directory and print some additional details about each file list_files_with_details(".")
此代码示例将打印当前目录中所有文件的列表,以及每个文件的文件大小和文件类型。可以修改此代码示例以打印有关所需目录中文件的任何其他信息。例如,您可以打印文件创建日期、文件的上次修改日期或文件权限。
列出目录中所有文件的 Python 递归方法
在 Python 中,要列出目录中的文件及其所有子目录,我们可以使用递归函数。以下函数将以递归方式列出目录中的所有文件及其所有子目录:
import os def list_files_recursively(directory): """Lists all of the files in a directory and all of its subdirectories, recursively.""" files = [] # Iterate over the files and directories in the directory for entry in os.scandir(directory): # If the entry is a directory, recursively list the files in that directory if entry.is_dir(): files += list_files_recursively(entry.path) # If the entry is a file, add it to the list of files elif entry.is_file(): files.append(entry.path) return files # Get a list of all the files in the current directory and all of its subdirectories files = list_files_recursively(".") # Print the list of files for file in files: print(file)
比较不同的方法
下表比较了所有方法,它们的性能,如何决定选择哪种方法以及哪种方法最好:
方法 |
性能 |
如何选择 |
最适合 |
os.listdir() |
简单高效 |
如果您只需要列出目录中的文件 |
一般用途 |
Pathlib.Path.iterdir() |
比os.listdir() |
如果您需要使用模块的更高级功能,例如处理符号链接Pathlib |
使用路径 |
glob.glob() |
功能强大且灵活,可根据模式列出文件 |
当您需要根据模式列出文件时,例如目录中的所有 Python 文件 |
模式匹配 |
os.scandir() |
比循环访问目录中的文件更有效os.listdir() |
如果您需要以更有效的方式循环访问目录中的文件 |
循环访问文件 |
os.walk() |
递归列出目录中的文件和目录及其所有子目录 |
当您需要列出目录中的文件和目录及其所有子目录时 |
具有自定义逻辑的递归列表 |
递归函数 |
可用于列出目录中的文件及其所有子目录 |
如果需要列出目录中的文件及其所有子目录,并且希望更好地控制递归 |
具有自定义逻辑的递归列表 |
这些方法的性能将取决于目录中的文件数和搜索模式的复杂性。通常,该函数将最有效地遍历目录中的文件。它通过避免不必要的系统调用和缓存文件信息来实现此目的。os.scandir()
模块的性能将取决于搜索模式的复杂性。如果搜索模式很简单,那么它会相对较快。glob
结论
有很多方法可以在 Python 中列出目录中的文件。最佳使用方法将取决于您的特定需求。
- 如果需要列出目录中的文件及其所有子目录,则可以使用该方法。
- 当您需要根据模式列出目录中的文件时,可以使用该模块。
- 如果需要以更有效的方式循环访问目录中的文件,则可以使用该函数。os.listdir()os.walk()globos.scandir()
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/92020.html