-
Notifications
You must be signed in to change notification settings - Fork 0
/
count_pdf_pages_p33.py
71 lines (63 loc) · 2.29 KB
/
count_pdf_pages_p33.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
# -*- coding: utf-8 -*-
import os
import datetime
import fitz
import regex
import io
from natsort import natsorted, natsort_keygen
nkey = natsort_keygen()
###########################################################
czasstart = datetime.datetime.now()
print("~~~~~~START~~~~~~\t" + str(czasstart).split(".")[0])
countope = 1
ile = 1
###########################################################
tutaj = r"I:\INOWROCŁAW\DANE_IRON_MOUNTAIN\20190614\ZADANIE 5\INOWROCŁAW CAŁOŚĆ"
plikwynik = r"I:\INOWROCŁAW\DANE_IRON_MOUNTAIN\20190614\ZADANIE 5\INOWROCŁAW CAŁOŚĆ\kontrole\wiecej_niz_1_strona.txt" # noqa
bledny = r"I:\INOWROCŁAW\DANE_IRON_MOUNTAIN\20190614\ZADANIE 5\INOWROCŁAW CAŁOŚĆ\kontrole\nie_udalo_sie_policzyc_stron.txt" # noqa
# with open(
# r"I:\INOWROCŁAW\DANE_IRON_MOUNTAIN\20190614\ZADANIE 5\INOWROCŁAW CAŁOŚĆ\kontrole\sciezki.txt", # noqa
# "r",
# encoding="utf-8",
# ) as sciezki:
# for line in sciezki:
# tutaj = line.strip()
for subdir, dirs, files in os.walk(tutaj):
dirs.sort(key=nkey)
if not any(
fname.upper().endswith(".PDF") for fname in os.listdir(subdir)
):
continue
nrope = (
os.path.basename(os.path.dirname(subdir))
+ "_"
+ os.path.basename(subdir)
)
print(str(countope) + "\t" + nrope)
# print(str(ile) + "_" + str(countope) + "\t" + nrope)
countope += 1
for file in natsorted(files):
if file.upper().endswith(".PDF") and regex.match(
r"^.+(-SZK-|-M-|-Z-).+\.PDF", file.upper()
):
plik = os.path.join(subdir, file)
try:
doc = fitz.open(plik)
strony = doc.pageCount
if not strony == 1:
with io.open(
plikwynik, "a", encoding="utf-8"
) as wynik:
wynik.write(str(strony) + "\t" + plik + "\n")
continue
except:
with io.open(bledny, "a", encoding="utf-8") as bl:
bl.write(plik + "\n")
continue
# ile += 1
czaskoniec = datetime.datetime.now()
roznicaczas = czaskoniec - czasstart
czastrwania = roznicaczas.total_seconds() / 60
print("Czas trwania (min):")
print("%.2f" % czastrwania)
input("THE END. Press something...")