Проблема с документом: недопустимый байт 3 из 3-байтовой последовательности UTF-8

Я пытаюсь использовать xml-документ, но сталкиваюсь с этой ошибкой:

Invalid byte 3 of 3-byte UTF-8 sequence

мой документ выглядит примерно так, но с большим количеством тегов и контента. пожалуйста не фокусируйтесь на документе ниже. Я использую несколько документов в этом формате. Я считаю, что это символ в моем документе, который недействителен, но я просто не знаю, как его лучше всего найти, потому что он настолько велик.

любые идеи или инструменты, которые я мог бы использовать? Благодаря.

спасибо!

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE map PUBLIC "-//OASIS//DTD DITA Map//EN" "file:C:/Documentum/Viewed/map.dtd">
<map xmlns:dctm="http://www.documentum.com" dctm:obj_status="Read-Only" dctm:obj_id="09002af8800af696" dctm:version_label="CURRENT" xmlns:ditaarch="http://dita.oasis-open.org/architecture/2005/">
    <title>Overview of the Commercial General Liability (CGL) Insurance Coverages  </title><moreTagsHere><!-- more tags here... --></moreTagsHere>
</map>
5
задан Chris W. Rea
29.01.2023 18:34 Количество просмотров материала 3629
Распечатать страницу

6 ответов

в моем xml была недопустимая фигурная кавычка.

1
отвечен joe 2023-01-31 02:22

Я бы попробовал XMLStarlet:

[...] XMLStarlet-это набор из командной строки утилиты (инструменты), которые можно использовать для преобразование, запрос,проверка и редактировать XML-документы и файлы с помощью простой набор команд оболочки аналогичным образом это делается для текстовых файлов с помощью Патч для Unix grep, в СЭД, как awk, дифф , команды join, etc. [...]

[выделено мной]

0
отвечен Chris W. Rea 2023-01-31 04:39

У меня есть подозрение, что вы можете использовать инструмент Microsoft.

по моему опыту, Expression Web использовал для размещения информации о заголовках в текстовых файлах, чтобы идентифицировать их как формат, в котором они были - ничто другое не узнавало их, и они появлялись как случайные символы. Это особенно проблема с PHP, как он сломался.

0
отвечен salmonmoose 2023-01-31 06:56

забудьте о том, что это XML, вам нужно проверить UTF-8. Может быть, просто открыть в Firefox и искать символ�? В противном случае см. проверка UTF-8 при переполнении стека.

0
отвечен Arjan 2023-01-31 09:13

вы, вероятно, использовали редактор, который добавляет метка порядка байтов (BOM) в файл. многие / большинство редакторов xml / Редакторы веб-сайтов позволяет сохранить документ с / без спецификации. Проверьте параметры сохранения в любом редакторе, который вы использовали.

вероятно, потребуется удалить спецификацию, чтобы избежать ошибки.

Если ваш редактор не поддерживает эту опцию, я могу порекомендовать отличный Notepad++

0
отвечен Paxxi 2023-01-31 11:30

Если вы используете tomcat вам proably нужно настроить кодировку, я использую tomcat в качестве службы в Windows, и в параметрах конфигурации следующий commmand сделал трюк для меня:

Dfile.encoding=UTF-8

надеюсь, что это помогает.

0
отвечен Alfonso Leon 2023-01-31 13:47

Постоянная ссылка на данную страницу: [ Скопировать ссылку | Сгенерировать QR-код ]

Ваш ответ

Опубликуйте как Гость или авторизуйтесь

Имя
Вверх