вы можете использовать регулярное выражение для удаления последовательных дублированных слов в строке, однако я не думаю, что можно удалить дублированные слова, которые не являются последовательными (e.g dangerous, hazardous, dangerous
).
используйте это регулярное выражение в окне заменить в Notepad++, и не забудьте выбрать "регулярное выражение" в качестве опции режима поиска ниже:
это регулярное выражение удалит все подряд повторяющиеся слова - будь то 2 дублированных слова или 10 повторяющихся слов подряд: \b(\w+)(?:,\s+\b)+
.
таже без запятых регекс быть: \b(\w+)(?:\s+\b)+
(может быть полезно для других пользователей).
если вы хотите регулярное выражение специально только для двух дублированных слов (Double), используйте это регулярное выражение: (\b\w+\b)\W+
.
поместите это регулярное выражение в заменить на поле, чтобы сохранить одно вхождение слова (в противном случае все повторяющиеся слова будут удалены):
.
эти регулярные выражения исправят ситуацию, подобную описанной в вашем вопросе в качестве примера. Первое регулярное выражение будет работать для каждого числа повторяющихся слов (e.g dangerous, dangerous, dangerous, dangerous, hazardous
), в то время как вторая версия будет работать только для двух дублированных слов (e.g dangerous, dangerous, hazardous
).
Примечание: регулярное выражение будет применяться только к формату, описанному в вопросе, а это означает, что такие форматы, как two words, two words, anotherword
,two-words, two-words, anotherword
,three words expression, three words expression, anotherword
не будет изменено, потому что регулярное выражение к ним не будет применяться.