Копирование прямого текста из сгенерированного файла latex

Я пытаюсь внести некоторые исправления в документ PDF, созданный из latex.

чтобы сделать исправления, я сначала копирую текст из PDF.

что происходит, так это то, что в сгенерированном PDF, слова вырезаются справа, когда они не соответствуют полям, например, когда слово "абзац" слишком большой, чтобы соответствовать, он будет сокращен как:

word1 word2n 
word3 para-n
graph word4n

также разрывы строк не делаются при необходимости, но всегда находятся в конце текста.

I нет доступа к оригиналу. Так что это проблема, когда я копирую текст для редактирования где-то, так как я в конечном итоге с кучей ненужных разрывов строк и разрывов слов (не знаю, как они называются на самом деле).

есть ли способ правильно скопировать текст из pdf-файла?

это то, что PDF-файл не на слова страницы аккуратно, без текста оправдание?

8
задан Der Hochstapler
20.01.2023 21:22 Количество просмотров материала 2428
Распечатать страницу

1 ответ

эти два регулярных выражения, выполненные в таком порядке, должны работать.

s/-\n//g
s/([^.])\n/ /g
0
отвечен fullmooninu 2023-01-22 05:10

Постоянная ссылка на данную страницу: [ Скопировать ссылку | Сгенерировать QR-код ]

Ваш ответ

Опубликуйте как Гость или авторизуйтесь

Имя
Вверх