Zvočne knjige postajajo vse bolj priljubljene v primerjavi s tradicionalnimi e-knjigami. So bolj priročni, saj jih lahko poslušate kadarkoli in kjer koli.

E-knjigo PDF lahko pretvorite v zvočno knjigo s preprostim skriptom Python. Z nekaj preprostimi knjižnicami lahko razvijete projekt, ki bo prebral PDF in shranil zvočno knjigo kot novo datoteko.

Namestitev zahtevanih paketov

Namestiti morate PyPDF3, pyttsx3, in pdfvodovodar paketi za začetek. Te pakete lahko namestite z upraviteljem paketov pip. Prepričajte se, da ste že nameščen pip v vašem sistemu. Zaženite naslednji ukaz v ukaznem pozivu, da namestite pakete:

pip namestite PyPDF3 pyttsx3 pdfvodovodar
  • Lahko uporabite PyPDF3 knjižnica za branje in urejanje datotek PDF v Pythonu.
  • The pyttsx3 knjižnica omogoča pretvorbo besedila v govor.
  • pdfvodovodar je knjižnica, ki vam omogoča ekstrahiranje besedila in tabel iz datotek PDF.

Koda, uporabljena v tem projektu, je na voljo v a Repozitorij GitHub in je brezplačen za uporabo pod licenco MIT.

instagram viewer

Pretvarjanje PDF-ja v zvočno knjigo z uporabo Pythona

Ko namestite zgornje pakete, ste pripravljeni, da jih uvozite v datoteko python:

uvoz PyPDF3
uvoz pyttsx3
uvoz pdfvodovodar

Navesti morate ime in lokacijo datoteke PDF, ki jo želite pretvoriti. Zaradi enostavnosti lahko uporabite katero koli vzorčno datoteko PDF. Kopirajte ga v isti imenik kot vaš skript in shranite njegovo ime v spremenljivko; če se imenuje Lorem.pdf, na primer:

datoteka = 'Lorem.pdf'

Nato ustvarite datotečni objekt za datoteko PDF in objekt bralnika PDF:

knjiga = odpri (datoteka, 'rb')
pdfReader = PyPDF3.PdfFileReader (knjiga)

Kasneje se boste pomikali po vseh straneh datoteke PDF. Če želite poiskati skupno število strani, uporabite numPages lastnina:

strani = pdfReader.numPages

Zdaj ste pripravljeni izvleči besedilo iz datoteke PDF:

končnobesedilo = ""

z pdfvodovodar.odpri(mapa) kot pdf:
za i v obsegu (0, strani):
stran = pdf.strani[i]
besedilo = page.extract_text()
finalText += besedilo

Uporabite zanko for za ponavljanje po vseh straneh in ekstrahiranje besedila iz PDF-ja. S paketom pdfplumber lahko odprete datoteko pdf in izvleček_besedila metoda za pridobivanje besedila s strani.

S celotnim besedilom, shranjenim v spremenljivki, ga lahko nadalje obdelate, odvisno od vaših zahtev. Če želite besedilo pretvoriti v zvok in ga shraniti v novo datoteko, uporabite naslednjo kodo:

motor = pyttsx3.init()
engine.save_to_file (končnobesedilo, 'lorem.mp3')
motor.runAndWait()

Ko ti zaženite to kodo Python, bo v svojem imeniku ustvaril datoteko zvočne knjige.

Če ne želite shraniti zvočne knjige in želite na primer recitirati datoteko PDF, lahko namesto tega uporabite naslednjo kodo:

motor = pyttsx3.init()
motor.povej(finalText)
motor.runAndWait()

Ko zaženete ta skript, bo recitiral datoteko PDF.

Razvijajte projekte z uporabo Pythona

Python je znan po svoji vsestranskosti. Z uporabo Pythona lahko preprosto ustvarite projekte s praktičnimi aplikacijami.

Če si želite umazati roke s kodo Python, lahko začnete z razvojem mini projektov. Nekatere dobre začetne ideje so aplikacija za kviz, klepetalni robot, igra kača, skrajševalec URL-jev, spletno strgalo ali pretvornik enot.