Как удалить разрывы строк (или возврат каретки) только из определенных частей блока текста?

Question

Как удалить разрывы строк (или возврат каретки) только из определенных частей блока текста?

всякий раз, когда я копирую форматированный текст из файла PDF, который отформатирован, чтобы иметь разрывы строк (или возврат каретки), мне нужно найти способ удалить эти разрывы строк без удаления формата абзаца.

чтобы сделать это, мне нужно использовать регулярное выражение (Regex), чтобы удалить только разрывы строк, которым не предшествует точка.

Так, например, если строка текста имеет разрыв строки сразу после точки, это, очевидно, почти всегда законный разрыв строки, который начнется новый абзац. Если строка текста имеет разрыв строки в середине слова или после слова без точки, это просто часть плохого форматирования, от которого мне нужно избавиться.

моя проблема в том, что я не знаю, как использовать регулярное выражение, чтобы удалить только теги ^p в word или CRLF или разрывы строк в любом формате при условии, что он пропускает их после периода.

28

задан Luke Allen

14.03.2023 20:32

4 ответа

108	65	32	76	5	9	11	6	4	22

Ваш ответ

Опубликуйте как Гость или авторизуйтесь

Имя

Email

Похожие вопросы про тегам:

carriage-return

linebreaks

score 3 · Answer 1

решение для MS Word:

Открыть Поиск И Замена ( Ctrl+H) и установите флажок "Использовать подстановочные знаки". Если параметр "использовать подстановочные знаки" не отображается, нажмите кнопку "Дополнительно".
скопируйте следующее В поле "найти что":([!.])^0013
скопируйте следующее В поле "заменить что":
Нажмите "Заменить Все"

пояснение:

[!.] означает "найти все символ, кроме точки"
^0013 - это Знак абзаца, поэтому в "Найди то, что" мы найдем всех-точка следуют символ абзаца
скобки означают, что мы поместим этот символ в память, чтобы использовать его позже
\1 заменяет наш заученный символ в том месте, где мы его находим

отметим, что ^0013 не находится внутри скобок, поэтому окончательный текст будет без знаков абзаца.

score 0 · Answer 2

в Word попробуйте найти и заменить ручной разрыв строки ^l с абзаца ^p.

score 0 · Answer 3

потому что предложения могут заканчиваться большим количеством знаков препинания, чем период, который я обновил hsawires’ ответ to:

найти каждый символ, кроме точки, вопросительный знак, восклицательный знак, закрыть кавычки или двоеточие.
кроме того, в некоторых случаях вы хотите добавить пробел после в поле" заменить что", чтобы избежать объединения последнего слова в одной строке с первым словом в следующей строке.

решение для MS Слово:

Открыть Поиск И Замена (Ctrl+H) и установите флажок "Использовать подстановочные знаки".
если вы не видите опцию "Использовать подстановочные знаки", нажмите кнопку "Подробнее."
скопируйте следующее В поле "найти что":([!.\?\!"':])^0013
скопируйте следующее В поле "заменить что":
Нажмите " Заменить Все."

объяснение:

[!.\?\!"':] означает "найти каждого символа кроме точки, вопросительного знака, восклицательного знака, закрывающей кавычки или двоеточия." - ^0013 - это Знак абзаца, поэтому в "Найти то, что" мы найдем каждый символ без точки, за которым следует Знак абзаца. - Скобки означают, что мы поместим этот символ в память, чтобы использовать его позже. - заменяет наш заученный символ в том месте, где мы его находим.

отметим, что ^0013 не находится внутри скобок, поэтому окончательный текст будет без знаков абзаца.

score 0 · Answer 4

гораздо более простой способ создать / изменить блок адресов перед вырезанием и вставкой его в электронное письмо или другой документ-объявить таблицу строк 3/4 и ввести данные адреса в каждую строку. Тогда избавься от веревок.

Apple	$173,24	+0,81%
Amazon	$114,49	-1,94%
Microsoft	$325,19	+3,61%
Google	$123,44	+2,11%
Netflix	$364,74	-0,03%
Intel	$27,45	-5,34%
Facebook	$254,49	+2,11%
Tesla	$185,54	+1,44%
Tencent	$322,40	-3,01%