Как извлечь идентификаторы электронной почты из документа с помощью Word или Writer

У меня есть документ(.doc) с сотнями идентификаторов электронной почты, размещенных случайным образом в тексте. Как изолировать идентификаторы электронной почты, чтобы экспортировать их в контакты Gmail?

Я хотел бы решение этой проблемы с помощью регулярных выражений на писателя или с помощью функции поиска по слову или любым другим способом.

9
задан abel
28.01.2023 16:23 Количество просмотров материала 2524
Распечатать страницу

1 ответ

полное, тщательное решение для этого было бы огромной проблемой с любой поддерживаемой регулярным выражением средой, Word / Writer тем более. см. этот пост, почему регулярные выражения не являются панацеей для всех проблем с текстом / электронной почтой, которые возникают. Что отказ от ответственности в сторону, давайте посмотрим, если практическое решение находится в пределах досягаемости...

для меня практическое решение, вероятно, будет включать использование регулярных выражений в какой-то момент процесса, но не без предварительного беспокойства по поводу наличие таких возможностей в данных:bob@company.organica@yahoo.com... Если бы электронные письма действительно были случайным образом распределены в текстовом файле, нужно было бы учитывать этот случай-возможность найти 2 письма рядом друг с другом, без очевидного разделителя. Это bob@company и organica@yahoo.com или company.organica@yahoo.com с первоначальным текстом bob@ просто тарабарщина? Я предполагаю, что подобные убедительные примеры можно найти.

разумный первый удар по проблеме может быть где-то рядом с этим строки:

  1. найти соответствующий электронной почте регулярное выражение я могу жить с (нет такой вещи,как идеальный!)
  2. найти все письма в текстовом файле, используя это регулярное выражение, и поместить их на новые строки, добавляя какой-то текст маркера, как "w00t" в начале
  3. заказать файл (через :приказ), отделяя все 'w00t' линии, те письма, которые мы нашли, от остальных непревзойденной нежелательной
  4. пройти несовпадающие линии по чтобы убедиться, что вы не хватает реальных данных. Если вы обнаружите, что это так, вернитесь назад и измените регулярное выражение в #1 или вручную извлеките эти сообщения, прежде чем продолжить выполнение шага #2. В противном случае существует опасность того, что вы разделяете электронное письмо (которое не соответствует регулярному выражению) на части, сохраняя одну часть и выбрасывая другую.
1
отвечен drapkin11 2023-01-30 00:11

Постоянная ссылка на данную страницу: [ Скопировать ссылку | Сгенерировать QR-код ]

Ваш ответ

Опубликуйте как Гость или авторизуйтесь

Имя

Похожие вопросы про тегам:

email
microsoft-word
openoffice-writer
regex
Вверх