Project

General

Profile

Actions

Task #908

closed

User Story #984: Импорт документов

Определение кодировки при рекурсивном импорте

Added by Roman Zybin about 13 years ago. Updated almost 13 years ago.

Status:
Closed
Priority:
Normal
Category:
-
Target version:
Start date:
03/02/2011
Due date:
% Done:

100%

Estimated time:
Detected in build:
svn
Published in build:
0.11.77

Description

При импорте большого количества документов необходимо определять их кодировку без участия пользователя
Предлагается использовать информацию из тега meta документа.
В случае его отсутствия считать по умолчанию, что кодировка utf-8.

Возможно имеет смысл воспользоваться каким-нибудь модулем распознования кодировки, например jChardet.


Files

10.html (4.89 KB) 10.html документ с кривой кодировкой Vladimir Fedotov, 05/24/2011 04:16 PM
Actions

Also available in: Atom PDF