Копирование китайских иероглифов из PDF

Я на ноутбуке Windows 7, который я считаю предустановлено все языковые пакеты. Я могу видеть китайские иероглифы без каких-либо проблем и, как правило, можно скопировать их нормально. (От браузера до Microsoft Office работает отлично). У меня есть много PDF-файлов с китайскими символами в них - всякий раз, когда я пытаюсь скопировать и вставить их в другую программу (например, браузер, Microsoft Office и т. д.), Я просто получаю странные иностранные символы, такие как:

ô tıng wˇo шо слушать me

Это копирование строки. Именно в таком порядке: китайские иероглифы, пиньинь (Китайский в латинском алфавите), а затем английский перевод.

пиньинь также становится запутанным, так как тональные знаки (акценты) о каждой букве перемещаются в собственное пространство.

любые идеи, как это исправить?

24
задан 3498DB
25.02.2023 15:23 Количество просмотров материала 3587
Распечатать страницу

1 ответ

из того, что я вижу в вашем примере текста PDF-файл не содержит представление Юникода китайского текста. Скорее, он, вероятно, использует специальный встроенный шрифт для представления китайских иероглифов и обычных шрифтов для представления китайских акцентов пиньинь:

ô tıng wˇo Шуо

должно быть

聽我說 tīng wǒ shuō

Я надеюсь, что вы видите, что диакритические (tīng wǒ shuō) просто построены из нескольких символов, расположенных друг над другом, в то время как идеограммы не показаны вообще. Вместо U+01D2 на ǒ вы получаете U+02C7 на ˇ и o.

вы можете легко проверить, можно ли копировать и вставлять китайские знаки, хранящиеся в Юникоде, загрузив и играя с этот файл. Это правильный Юникод PDF и у меня нет проблем копирование и вставка символов между Юникод приложений на Windows 7 Профессиональная система (немецкий MUI).

если это не работает, чем вы должны установить поддержку китайских шрифтов на вашей системе.

если это работает, то вы, вероятно, можете найти обходной путь, проверяя ваш PDF-файл и ищет встроенные шрифты. Попробуйте найти эти шрифты в интернете и установить их на свою систему-тогда вы увидите больше, чем просто бессмысленные знаки. Однако это только применится к первоначально китайским знакам; Pinyin не может быть спасенный.

2
отвечен Alexander Galkin 2023-02-26 23:11

Постоянная ссылка на данную страницу: [ Скопировать ссылку | Сгенерировать QR-код ]

Ваш ответ

Опубликуйте как Гость или авторизуйтесь

Имя

Похожие вопросы про тегам:

chinese
copy-paste
language
language-pack
special-characters
Вверх