网站上有一堆文件名有序的图片,希望通过重命名来避免被人批量抓取。
# 2024-02-20
# 重命名目录下指定后缀的文件,重命名为原文件名+随机数哈希计算后的字符串
# 重命名前会检查目录下是否存在同名文件,如果存在会再次获取随机数计算哈希,直到没有重复
# 可以重复运行
import hashlib,os,random
# 需要更改的文件的后缀,会更改当前目录下所有符合后缀的文件的文件名
suffix = ".png"
target_filename_list = []
for filename in os.listdir():
if filename[-1*len(suffix):] == suffix:
target_filename_list.append(filename)
print("待处理文件数量:{}".format(len(target_filename_list)))
for filename_remove in target_filename_list:
while True:
rename_new_name = hashlib.md5((filename_remove[:-1*len(suffix)]+str(random.random())).encode()).hexdigest()+suffix
if not os.path.exists(rename_new_name):
os.rename(filename_remove,rename_new_name)
print("{} -> {}".format(filename_remove,rename_new_name))
break
print("处理完成")
为什么要带上源文件名哈希多此一举?
因为一开始只想哈希文件名,随机数是后来为了防爬和防重复才加的。