Accéder au contenu.
Menu Sympa

linux-31 - Re: Extraction du texte d'un PDF (lecture d'un document pdf en terminal et vocalisation)

Objet : Discussions sur le logiciel libre

Archives de la liste

Re: Extraction du texte d'un PDF (lecture d'un document pdf en terminal et vocalisation)


Chronologique Discussions 
  • From: Pierre ESTREM <peterpan31 AT free.fr>
  • To: Bernard Schoenacker <bernard.schoenacker AT free.fr>, Linux 31 <linux-31 AT culte.org>
  • Subject: Re: Extraction du texte d'un PDF (lecture d'un document pdf en terminal et vocalisation)
  • Date: Wed, 21 Jul 2021 01:58:05 +0200
  • Authentication-results: pic2s.le-pic.org; dkim=pass (2048-bit key; unprotected) header.d=free.fr header.i= AT free.fr header.b="WKiftOto"; dkim-atps=neutral

Bonjour,

Merci Bernard pour ces bons tuyaux précieux  et Mélanie se joint à moi pour te remercier.

pierre estrem




Le 18/07/2021 à 10:38, Bernard Schoenacker a écrit :
----- Mail original -----
De: "Pierre ESTREM"<linux-31 AT culte.org>
À: "Linux 31"<linux-31 AT culte.org>
Envoyé: Dimanche 18 Juillet 2021 04:51:10
Objet: Extraction du texte d'un PDF

Bonjour,

J'ai un outil qui permet de lire vocalement du texte comme ceci ;

$ espeak -v fr "Hello"
ou
$ cat mon.txt | espeak -v fr
ou
$ espeak -v fr < mon.txt

Dans le cas où le fichier est un PDF contenant du texte , comment
éviter
de lire les "commandes de formatage" ?
Je voudrais éviter les manipulations avec Acrobat.
J'ai envie d'écrire un truc du genre :

$ cat mon.pdf | ... | espeak -v fr

Et en utilisant la commande pdftotext et un pipe ?

Une idée les libristes ?
Bonjour,


J'ai consulté les questions et réponses données
où il est question de pouvoir lire un document
*.pdf dans un terminal :

pdftotext -layout mon.pdf - | tee | espeak -v fr

documentation d'origine :
https://unix.stackexchange.com/questions/41362/view-pdf-file-in-terminal

autrement il faut également installer le paquet :

brltty-espeak


pour ma part je préfère coupler mbrola dans la chaine
car la voix est plus "humaine" et moins synthétique


en version corrigée, voici la solution qui est plus
élégante :

pdftotext -layout ~/PDF/Scientologie.pdf - | espeak -a 200 -v mb-fr1 -s 150

pour plus de détail :
https://raspberry-pi.fr/faire-parler-raspberry-pi-espeak/


Merci pour ton aimable participation

Bien à toi

Bernard



Archives gérées par MHonArc 2.6.19+.

Haut de le page