Копирование прямого текста из сгенерированного файла latex

Я пытаюсь внести некоторые исправления в документ PDF, созданный из latex.

чтобы сделать исправления, я сначала копирую текст из PDF.

что происходит, так это то, что в сгенерированном PDF, слова вырезаются справа, когда они не соответствуют полям, например, когда слово "абзац" слишком большой, чтобы соответствовать, он будет сокращен как:

word1 word2n 
word3 para-n
graph word4n

также разрывы строк не делаются при необходимости, но всегда находятся в конце текста.

I нет доступа к оригиналу. Так что это проблема, когда я копирую текст для редактирования где-то, так как я в конечном итоге с кучей ненужных разрывов строк и разрывов слов (не знаю, как они называются на самом деле).

есть ли способ правильно скопировать текст из pdf-файла?

это то, что PDF-файл не на слова страницы аккуратно, без текста оправдание?

5
задан Der Hochstapler
источник

1 ответов

эти два регулярных выражения, выполненные в таком порядке, должны работать.

s/-\n//g
s/([^.])\n/ /g
0
отвечен fullmooninu 2014-09-18 20:35:35
источник

Другие вопросы latex pdf text-editing