Bug #1496
closedОшибка при импорте pdf документа
100%
Description
Результат импорта документа
"\\NORD\work\Vimpelcom\Новые проекты\ComversOne-SAPI\COMONE_3_6_APIs-For-VIP-3.6.pdf"
не открывается ни в редакторе разметки, ни в браузере с диагностикой:
XML Parsing Error: not well-formed
Location: file:///C:/Tools/eclipse/requality-3.7/workspace/t/root/Documents/COMONE_3_6_APIs-For-VIP-3.6.xhtml_resources/COMONE_3_6_APIs-For-VIP-3.6.xhtml
Line Number 118, Column 6:
offers parent bundle.
-----^
На этом месте стоит апостроф типа запятой сверху, код 0x92
Updated by Alexey Demakov over 13 years ago
Похоже, что есть проблемы с импортом русских букв в документах любых форматов - doc, docx, pdf. Возможно, проблема касается только windows.
Updated by Vladimir Fedotov over 13 years ago
- Status changed from New to Resolved
- % Done changed from 0 to 100
Applied in changeset r2099.
Updated by Vladimir Fedotov over 13 years ago
Данный фикс спасет от убитого документа, но не спасет от нечитаемого русского текста. Т.к. импорт pdf полностью полагается на pdfBox, баги с кодировками также относятся к нему: https://issues.apache.org/jira/browse/PDFBOX-398
Updated by Alexey Demakov over 13 years ago
- Assignee changed from Vladimir Fedotov to Alexey Demakov
OutputWriter создавался как FileWriter без указания кодировки (то есть, с системной кодировкой по умолчанию). Вместо этого надо использовать OutputStreamWriter( FileOutputStream, "UTF-8" ).
Костыли с decodeUtf8 убраны.
Updated by Alexey Demakov over 13 years ago
- Status changed from Resolved to Closed