Python遍历磁盘找出占用空间最大的文件

软件开发大郭
0 评论
/
20 阅读
/
1195 字
01 2023-02

一. 前言

今早发现电脑的磁盘空间莫名其妙的占满了…也不知道是哪个文件占用了大量的内存空间。就随手写了个python,把磁盘空间全部遍历一遍,找到了大量占用磁盘空间的罪魁祸首。

二. 深度遍历磁盘下所有文件(递归)

因为Windows的目录结构采用的是树形结构,所以可以使用深度遍历或广度遍历来遍历所有的文件,这里采用的是递归方法来实现深度遍历:

import os

def get_files(path):
    global lst
    if not os.path.exists(path): # 判断路径是否存在
        return
    if not os.path.isdir(path):  # 判断路径是否为文件夹,若不是,则结束
        return

    # 获取该路径中所有文件\文件夹的名称
    file_list = os.listdir(path)
    
    # 遍历该路径下所有内容:
    for filename in file_list:
        try: 
            subpath = os.path.join(path, filename) # 拼接路径,获取每个次级目录下的文件路径
            if os.path.isfile(subpath):
                fsize = os.path.getsize(subpath)  # 获取该文件的大小
                fsize = fsize / float(1024 * 1024)  # 将单位转换为MB
                lst.append((fsize, subpath))
            else:
                get_files(subpath)  # 递归
        except:
            pass

if __name__ == '__main__':
    lst = []
    get_files('C:/')  # 查找C盘下的大文件
    lst.sort(key= lambda k:k[0], reverse=True) # 按照文件大小依次排序
    for i in range(50):
        print('文件路径: %s, 大小:%s MB' %(lst[i][1], round(lst[i][0], 2)))
标签:
    暂无数据