estrarre il testo da un PDF

A volte non basta il semplice copia/incolla per prendere il testo da un pdf e poterlo usare in un altro documento.

Per questa necessità ho trovato un comando Linux molto utile per salvare il testo del pdf in un file di testo semplice

gs -sDEVICE=txtwrite -o destinazione.txt origine.pdf

Naturalmente origine.pdf è il file da cui voglio estrarre il testo e destinazione.txt il file di testo semplice da cui fare copia/incolla, oppure, come nel mio caso per ricostruire una tabella senza dover riscrivere il testo.

Il comando gs (ghostscript) dovrebbe essere standard in ogni distribuzione Linux. Ha moltissime opzioni, qui viene usata solo quella per inviare su file di testo semplice.

Per sapere come ricodificare un pdf a risoluzione più bassa e ottenere un file più piccolo vedere qui:
https://www.nimbo.it/index.php/2021/03/20/comprimere-un-pdf/