2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 TEX4HT, русские буквы и кодировка windows-1251
Сообщение29.11.2008, 13:51 
Нужно сделать, чтобы TEX4HT перевёл LaTeX-овский документ в HTML с кодировкой WINDOWS-1251.
Если набираю

Код:
htlatex 111.tex "html,word"


то HTML получается в нужной кодировке, но в нём русские буквы заменены последовательностями типа Д, что увеличивает размер в 8 раз (это недопустимо). Как сделать, чтобы русские буквы нормальные получались (по байту на символ)?

Добавлено спустя 1 минуту 58 секунд:

Или вообще пофигу на кодировку, но чтобы русские буквы были по 1 байту на символ.

 
 
 
 
Сообщение01.12.2008, 14:32 
Воспользуйтесь обычным latex2html. С кодировками проблем не будет. Другой вариант - написать скрипт или програмку для декодирования текста (тоже сложности никакой нет, если знаете какой-нибудь язык программирования или bash).
Если же вы в мастдае работаете - попробуйте найти latex2html.

 
 
 
 
Сообщение02.12.2008, 00:13 
Уже написал скрипт :)
Там, оказывается, кроме кодировки ещё много чего исправлять надо было (ссылки на картинки (в частности, чтобы одинаковые картинки имели одиныковые ссылки), некоторые span'ы убрать, пробелы в начале строк и многое другое).

 
 
 [ Сообщений: 3 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group