Перекодировщики
кириллицы
лПДЙТПЧЛБ — ЬФП ЧБЦОП.
В смысле, кодировка — это важно. Именно таким образом будет выглядеть
данная фраза, будучи записанной в кодировкеKOI8-R. Очевидно, что если
разработчик какой-либо web-страницы ненароком спутает кодировку или
просто установит ее значение неправильно, посетители будут долго любоваться
на подобный бессмысленный набор символов, но прочитать его, увы, не
смогут.
Как вы уже знаете,
некоторые http-серверы умеют автоматически изменять кодировку web-страниц
в зависимости от настроек пользовательского броузера, однако на самом
сервере документы хранятся в какой-либо одной кодировке. Если конкретной
информации о том, в какой кодировке следует загружать страницы на сервер,
администрация узла не предоставляет, в девяноста процентах случаев из
ста по умолчанию используется кодовая страница windows-1251, а в остальных
это, скорее всего, KOI8-R. Известно, что программное обеспечение, работающее
под управлением операционной системы Microsoft Windows, в том числе
текстовый редактор Notepad, сохраняет файлы на диск в кодировкеwindows-1251.
Как быть, если согласно требованиям сайта, предоставляющего вам web-хостинг,
необходимо размещать данные в другой кодировке? Вот для этого и существуют
многочисленные программы-перекодировщики кириллицы.
ConvHTML
Программа ConvHTML,
разработанная С. Поповым из Усинска, автоматически перекодирует текстовые
файлы и документы HTML из Windows 1251 в KOI8-Rи обратно. Интерфейс
ее предельно прост (рис. 9.1).
Рис. 9.1. Интерфейс
программы ConvHTML
Рабочее окно ConvHTML
разделено на две вертикальные части: в левой указывается список документов,
подлежащих перекодированию, а в правой отображается результат работы
программы. Панель инструментов в интерфейсе ConvHTML отсутствует, вместо
нее имеется селектор, с помощью которого можно указать, в какую кодировку
вы намерены транслировать файл. Конвертация web-страниц с использованием
программы ConvHTML осуществляется достаточно быстро: в меню Файл следует
выбрать пункт Открыть и указать нужный документ, после чего программа
спросит вас, желаете ли вы перекодировать только этот документ или все
файлы, содержащиеся в данной директории. Для того чтобы выполнить конвертацию
документа, необходимо выбрать пункт Перекодировать и сохранить в том
же меню. Программа сохранит отконвертированный файл под старым именем
в исходной папке.
К достоинствам утилиты
ConvHTML можно отнести простой и доступный интерфейс, возможность работы
с файловыми списками, возможность преобразовывать из кодировки в кодировку
как html-документы с расширениями .htm и .html, так и текстовые файлы.
Главным недостатком является то, что данная программа умеет обращаться
только с двумя кодовыми страницами, которых на практике используется
значительно больше, а также то, что она сохраняет файл с использованием
его первоначального имени, замещая при этом старый, и не дает возможности
сохранить перекодированный документ в другой директории.
СОВЕТ
Преобразуя составляющие ваш сайт html-документы в другую кодировку,
сделайте копию папки, в которой они хранятся. Если процесс конвертации
прошел с ошибкой или впоследствии у вас возникла необходимость внести
изменения в уже перекодированный документ, вы можете использовать исходную
копию, заместив ею старый файл и перекодировав донную web-страницу заново.
Программа ConvHTML
доступна для свободного копирования на многочисленных сайтах Интернета,
предлагающих посетителям бесплатное программное обеспечение. К примеру,
ее можно поискать на сервере, расположенном по адресу http://www.freeware.ru.
SNKDEcode
Программа-перекодировщик
SNK DEcode (рис. 9.2) была создана специалистами российской компании
«Тихая Гавань М», она доступна для бесплатной загрузки на
сайте http://www.book.ru/snk. В отличие
от утилиты ConvHTML SNKDEcode является полнофункциональным приложением,
предназначенным для трансляции кириллицы из одной кодировки в другую.
Эта программа поддерживает следующие направления конвертации файлов:
KOI8-R -> Windows-1251и обратно, Alt DOS -» Windows-1251 и
обратно, KOI8-R -> Windows-1251,ISO - Windows-1251, MAC - Windows-1251
и, наконец, Unicode - Windows-1251. Возможна также конвертация файлов
по заданной пользователем схеме, с преобразованием какого-либо файла
из одной кодировки в другую в произвольном порядке.
Рис. 9.2. Интерфейс
программы SNK DEcode
SNK DEcode поддерживает
конвертацию текстовых файлов и документов HTML, файлов RTF, а также
текстовых файлов с произвольным расширением. Главная панель содержит
стандартные кнопки очистки рабочего пространства программы, открытия
файла, копирования и вставки фрагментов кода из буфера обмена, сохранения
текущего документа в произвольную директорию, вывода обрабатываемого
кода на принтер, а также несколько других весьма полезных кнопок. Функция
Перезагрузить в начальном виде позволяет восстановить состояние окон
после внесения в документы каких-либо изменений, функция Запомнить —
сделать «моментальный снимок» рабочего пространства программы,
которое восстанавливается при нажатии кнопки Перезагрузить в начальном
виде, и, наконец, функция Поменять местами меняет местами рабочие окна.
Перекодировка осуществляется
нажатием соответствующей кнопки на панели инструментов. При выборе пункта
По схеме программа выводит на экран диалоговое окно, позволяющее пользователю
задать произвольный алгоритм трансляции файла (рис. 9.3).
Рис. 9.3. Диалоговое
окно настройки пользовательской схемы трансляции файла
Пользовательская
схема перекодировки формируется следующим образом: вменю, появляющемся
при нажатии на расположенную в левом верхнем углу окна кнопу, следует
выбрать исходную кодировку, а в меню, появляющемся при нажатии на кнопку,
расположенную правее, — кодировку, в которую осуществляется трансляция.
Включение пары кодировок в список осуществляется нажатием кнопки Добавить,
отправка созданного списка на исполнение — нажатием кнопки Выполнить.
Сформированный таким образом список кодовых пар отображается в левом
поле диалогового окна настройки пользовательской схемы трансляции, правое
окно содержит перечень сохраненных на диске схем. Управлять этим перечнем
можно с использованием кнопок Сохранить и Удалить. При нажатии на первую
из них текущая схема записывается на диск, а при помощи второй можно
уничтожить неиспользуемую схему. Кнопка Очистить удаляет все компоненты
списка кодовых пар и, наконец, кнопка Закрыть закрывает данное диалоговое
окно.
Рабочее пространство
программы SNK DEcode разделено на два вертикальных поля аналогично программе
ConvHTML: в одном из них отображается исходный текст преобразуемого
файла, в другом — его отконвертированная версия.
Помимо основных программных
свойств SNK DEcode имеет еще целый ряд полезных дополнительных функций,
вызываемых с применением меню Сервис. Для их использования необходимо
выделить при помощи мыши в окне исходного текста какую-либо символьную
последовательность и выбрать соответствующий пункт указанного меню.
Функции Верхний регистр и Нижний регистр преобразуют символы выделенной
фразы соответственно в заглавные или строчные, функции Lat - Cyr и Cyr
- Lat изменяют латинские символы на символы кириллицы и обратно в соответствии
с их расположением на клавиатуре компьютера. Команда Убрать пробелы
удаляет все лишние пробелы из выделенного участка преобразуемого документа,
сокращая итоговый размер файла, и, наконец, функция Убрать теги удаляет
из исходного файла все элементы разметки HTML, оставляя в нем лишь содержательный
текст.
Не лишена эта программа
и существенных недостатков. Главное упущение разработчиков SNK DEcode
заключается в том, что данное приложение умеет открывать файлы с расширением
.htm, но, увы, не распознает документы с расширением .html, что вызывает
ряд ощутимых неудобств у пользователей.
Exclude
Symbols
Небольшая утилита
Exclude Symbols, автором которой является Александр Вардугин из Кемерово,
отличается поразительной функциональностью и нетрадиционным англоязычным
интерфейсом (рис. 9.4).
Данная утилита позволяет
работать с файловыми списками, иными словами —перекодировать содержимое
целых директорий, а кроме того, умеет автоматически распознавать кодировку
исходного текста. Это очень удобно в случае, если какая-либо папка содержит
подлежащие обработке файлы в различных кодировках: вам не надо указывать
отдельные настройки для каждого из преобразуемых документов, Exclude
Symbols самостоятельно определит исходную кодировку и решит, необходимо
транслировать файл или нет. Программа поддерживает четыре кодовые страницы:
KOI8-R, Windows-1251, DOS-866 и ISO, в пределах этих стандартов возможна
трансляция текстовых файлов и документов HTML. Помимо прямых функций
Exclude Symbols позволяет выполнять еще целый ряд полезных действий:
преобразование всех содержащихся в документе символов в заглавный или
строчный регистр, произвольную замену одних символов в исходном файле
другими, замену пробелов отступами табуляции и оптимизацию файлов методом
удаления из них лишних пробелов. Эту удобную утилиту можно бесплатно
загрузить с сервера http://perecod.chat.ru.
Рис. 9.4. Интерфейс
программы Exclude Symbols
Перекодировка
кириллицы
Небольшая программа
Виктора Степанова со скромным названием «Перекодировка кириллицы»
(рис. 9.5) доступна для бесплатного копирования с сайта http://perecod.chat.ru
или с домашней странички разработчика (http://www.glasnet.
ru/~victors). Она не требует инсталляции и готова к запуску сразу после
загрузки с удаленного сервера.
Рис. 9.5. Внешний
вид программы Перекодировка кириллицы
Среди особенностей
этой программы следует отметить расширенные возможности работы с файловыми
списками: она позволяет обрабатывать как отдельные файлы формата TXT,
HTML и RTF, так и целые каталоги с вложенными подкаталогами. Примечательно,
что помимо кодовых страниц Windows-1251,KOI8-R, DOS, ISO и MAC, в которых
может быть сохранен исходный файл, Перекодировка кириллицы может преобразовывать
текст обрабатываемых документов в Unicode и транслит с сохранением всех
правил записи слов русского языка в транслитеральной кодировке. Интерфейс
программы (см. рис. 9.5)состоит из трех функциональных полей: в верхнем
можно указать исходный файл или директорию (а можно набрать путь с клавиатуры
или воспользоваться кнопкой Открыть), в меню Кодировка следует выбрать
исходную кодовую страницу преобразуемых файлов из предложенного списка,
в поле Результат указывается целевая кодировка. Еще одной полезной особенностью
данной утилиты является меню Строки, с помощью которого можно задать
преобразование символов переноса строк транслируемого текста в стандарт
различных операционных систем.
Как видите, ассортимент
программного обеспечения, предназначенного для конвертирования файлов
из одной кодировки кириллицы в другую, чрезвычайно велик. Выбирайте
любую программу, соответствующую вашим вкусам, целям или потребностям,
и перекодируйте на здоровье.