Удаление всех разрывов строк между двумя соответствующими переменными в notepad++

Итак, я пытаюсь в конечном счете сделать таблицу из целой кучи текста, но это вызывает у меня головную боль. В основном вот представление о том, что происходит:

    matchingvariablelengthupccode1 productdescription1 value value value value value value value value matchingvariablelengthupccode1

matchingvariablelengthupccode2 product
description2 value value value value value value value value value matchingvariablelengthupccode2

и в описании продукта иногда случайно есть разрывы строк. Также upc в конце и начале соответствуют друг другу, но уникальны для каждого продукта.

даже после того, как я разберусь с этим, мне придется выяснить, как иметь дело с описаниями продуктов, имеющими пробелы, но предполагаемыми столбец, когда значения и коды upc уже разделены пробелами. Кроме того, описания продуктов иногда начинаются с числа, чтобы сделать вещи более трудными.

попытка использовать регулярное выражение в notepad++, но это очень сложная проблема.

13
задан Areck Degeneffe
23.03.2023 19:00 Количество просмотров материала 2710
Распечатать страницу

1 ответ

есть способ без программирования.

часть 1.поместить каждую запись в одну строку заменяя разрывы строк в описаниях элементов пробелами.

часть 2: Удалите завершающие коды UPC.

часть 3: преобразуйте первые N слов, разделенных пробелами, в colums, rest (>N) в последний столбец.


Приготовление: использовать найти команда (set Режим Поиска в нормальный), чтобы найти уникальный символ, не встречающийся в файле. Я буду использовать #. Если вы нашли другое одно, то пожалуйста отрегулируйте под шагами соответственно.

Часть 1.

Шаг 1:

использовать regex найти и заменить:

найти: (\R)(\d+\l* )

заменить на: # (обратите внимание на наш специальный символ)

Режим Поиска: Регулярное Выражение

". матчи строки": переполнение

→ Каждый UPC код имеет префикс # в этот момент в начале строки.

Шаг 2:

найти: \R

заменить: (пробел)

Режим Поиска: Регулярное Выражение

". матчи строки": переполнение

→ все тексты являются единой линии.

Шаг 3:

найти: # (обратите внимание на наш специальный символ)

заменить: \r\n

Режим Поиска: Регулярное Выражение

". матчи строки": переполнение

→ все записи теперь на своих линиях. Исправьте исключения вручную, если они есть.

Часть 2:

Шаг 1:

использовать regex найти и заменить:

найти: ^(.*) (.*)$

заменить на:

Режим Поиска: Регулярное Выражение

". соответствует новой строке": Непроверенный

→ последнее слово из каждой записи (предположительно, это был UPC-код) было удалено.

Часть 3.

Шаг 1:

использовать regex найти и заменить:

найти: ^(.*?) (после))

заменить на: # (обратите внимание на наш специальный символ)

Режим Поиска: Регулярное Выражение

". матчи строки": переполнение

→ первый пробел в строке теперь #.

Шаг 2:

повторяйте Шаг 1, Пока все пробелы между колоннами (но не в описании товара) не превратятся в #'s.

→ места в описании товара. Есть # между всеми столбцами.

Шаг 3:

вставьте все записи в Microsoft Excel и используйте мастер импорта текста для импорта значений в таблицу.

тип данных: разделителями (не фиксируется width)

разделитель: другое: # (не отмечать все другие варианты разделителей!)

→ у вас есть данные в Столбцах в Excel.

0
отвечен miroxlav 2023-03-25 02:48

Постоянная ссылка на данную страницу: [ Скопировать ссылку | Сгенерировать QR-код ]

Ваш ответ

Опубликуйте как Гость или авторизуйтесь

Имя
Вверх