Accéder au contenu.
Menu Sympa

linux-31 - Re: Supprimer toutes les entêtes

Objet : Discussions sur le logiciel libre

Archives de la liste

Re: Supprimer toutes les entêtes


Chronologique Discussions 
  • From: Albert ARIBAUD <albert AT aribaud.net>
  • To: linux-31 AT culte.org
  • Subject: Re: Supprimer toutes les entêtes
  • Date: Mon, 22 Nov 2021 12:43:05 +0100

Le dimanche 21 novembre 2021 à 23:22 +0100, Jean-Marc MONGRELET a
écrit :
> Bonsoir,
>
> Le 21/11/2021 20:07, peterpan31 a écrit :
> >
> > Je souhaite n'afficher que le "texte utile" de fichiers .eml (et si
> > possible y compris ceux rédigés en HTML, c-è-d enéjectant les
> > balises).
> >
> > N'existe-t-il pas un outil près à l'emploi faisant cela ?
>
> Une piste à suivre est de passer par le format PDF...
>
> https://forum.framasoft.org/viewtopic.php?t=36341
>
> puis:
> https://doc.ubuntu-fr.org/poppler-utils#extraction_de_texte
>
> Bon hack, ;-)
>
> JM
>
> --

Ça n'aurait aucun effet : aucun des outils proposés sur la page de
framasoft ne fait de filtrage intelligent basé sur le fait que la
source est un courriel, c'est juste de la conversion de format de
document.

Donc là :

- avec a2ps, on prend un fichier texte brut (supposé ASCII)
partiellement voire totalement illisible, on le convertit en un fichier
Postscript toujours partiellement voire totalement illisible ;

- avec ps2pdf, on prend ce fichier Postscript partiellement voire
totalement illisible, on le convertit en un fichier PDF toujours
partiellement voire totalement illisible ;

- avec popler, on prend ce fichier PDF partiellement voire totalement
illisible, on le convertit en un fichier texte brut (ou Postscript, ou
HTML) toujours partiellement voire totalement illisible.

Amicalement,
Albert.




Archives gérées par MHonArc 2.6.19+.

Haut de le page