2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 11:46 
Аватара пользователя
Раньше на Linux использовал примерно такую скудную "шапку", стыренную откуда-то в интернете (оставил только языковое-шрифтовое):
Используется синтаксис LaTeX
\usepackage[cp1251]{inputenc}
\usepackage[T2A]{fontenc}
\usepackage[english,russian]{babel}
\usepackage{amssymb}

+Что-то выставлял ещё в настройках программы TeXMaker (тоже виндовую кодировку, наверное)

Были проблемы, полный список уже не помню. Если открыть tex-файл в системном блокноте, то вместо русского языка - кракозябры. И вообще чувствовалось: система недовольна.
Умные люди вразумили, что такое cp1251 и почему оно не комильфо. Уже года 2 использую нижеследущее. Не помню :oops: , какая строка тут за что отвечает, поэтому кидаю сразу всё, что может иметь отношение к делу:
Используется синтаксис LaTeX
\usepackage[utf8]{inputenc}
\usepackage[T2A]{fontenc}
\usepackage[english,russian]{babel}
\usepackage[unicode]{hyperref}
\usepackage{amssymb}
\usepackage{mathtext}
\usepackage{amsmath}


Сегодня обнаружил, что скопировать русский текст из просмотрщика PDF-ок не представляется возможным, тоже абракадабра.
Посоветуйте что-нибудь! :-)

 
 
 
 Re: Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 12:38 
Аватара пользователя
Из под какого просмотрщика pdf копируете текст? Какой дистрибутив линукс?
попробуйте с:
\usepackage{cmap}

 
 
 
 Re: Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 12:40 
Legioner93 в сообщении #922812 писал(а):
Сегодня обнаружил, что скопировать русский текст из просмотрщика PDF-ок не представляется возможным, тоже абракадабра.
Возможно, потому, что pdf из tex можно делать по-разному. Я использую miktex, а там есть такие варианты: tex->pdf, tex->dvi->pdf, tex->dvi->ps->pdf. Так вот, в 1-м варианте абракадабра, а в двух других всё окей. Почему так происходит, понятия не имею. Да, преамбула у моих tex-файлов столь же примитивная.

 
 
 
 Re: Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 13:57 
Аватара пользователя
Что ставить в опцию inputenc?

Это зависит от того, в какой кодировке текстовый редактор пишет (но приличный текстовый редактор должен позволять менять кодировку). Разумеется, utf8 лучше всего, т.к. он поддерживает много разных языков (см [url=http://dxdy.ru/post824193.html#p824193] где я "ботал по казахски" :D). Разумеется, для некоторых языков придется заменить или добавить опции в fontenc

Рекомендуется сразу после класса загрузить пакет cmap (character map), который однако не работает с dvips , но работает с pdftex и dvipdfmx (т.е. с tex->pdf, tex->dvi->pdf, но не с tex->dvi->ps->pdf). Есть еще весьма сырой mmap который должен улучшить копирование мат символов на выходе)

 
 
 
 Re: Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 13:59 
Аватара пользователя
Просмотрщик Evince.
jamesjames в сообщении #922814 писал(а):
\usepackage{cmap}

Огромное спасибо! Теперь копируется!
nnosipov
Ваши варианты у меня тоже есть (и ещё куча всяких), но ни один не заработал :-) Вероятно, надо что-то дополнительное настраивать. Попробуйте, кстати, команду jamesjames

-- Сб окт 25, 2014 15:04:32 --

Red_Herring в сообщении #922828 писал(а):
Есть еще весьма сырой mmap который должен улучшить копирование мат символов на выходе

А как он должен улучшить? Пока у меня с той шапкой, что в 1-ом посте (без cmap) копируются символы типа φ, λ, ∈

-- Сб окт 25, 2014 15:07:59 --

Интересно, возможно ли копировать в таком смешанном стиле, как λ^2. Это конечно не $\lambda ^2$, но приятнее, чем \lambda^2

 
 
 
 Re: Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 14:15 
Legioner93 в сообщении #922829 писал(а):
Попробуйте, кстати, команду jamesjames
Попробовал, действительно всё окей. Вот теперь думаю, переделывать ли все свои tex-и или ограничиться только pdf-ми :-)

 
 
 
 Re: Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 14:24 
Аватара пользователя
М-да, у меня половина текста копируется, а половина - нет. А важно, в какое место вставлять этот cmap?

 
 
 
 Re: Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 14:26 
Аватара пользователя
Legioner93 в сообщении #922829 писал(а):
Просмотрщик Evince.

Странно то, что у меня на Gentoo в TexLive 2013 с utf8 всё отлично, причём без cmap. :-)
Legioner93 в сообщении #922829 писал(а):
Огромное спасибо! Теперь копируется!

Всегда пожалуйста.
Legioner93 в сообщении #922838 писал(а):
М-да, у меня половина текста копируется, а половина - нет. А важно, в какое место вставлять этот cmap?

В преамбулу же. Думаю лучше всего сразу после \documentclass.

 
 
 
 Re: Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 14:36 
Аватара пользователя
А я в самый конец преамбулы пихнул... Теперь точно всё копируется. 8-)
Не могли бы вкратце рассказать про порядок подключения пакетов? Или ссылку хорошую. Как ошибок не делать таких.

 
 
 
 Re: Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 14:45 
Аватара пользователя
Legioner93 в сообщении #922829 писал(а):
А как он должен улучшить? Пока у меня с той шапкой, что в 1-ом посте (без cmap) копируются символы типа φ, λ, ∈

Тут еще от пдф-браузерта зависит. Например cmap был в какой-то момент существенен для adobe acrobat/reader. Я не следил за этим по-крайней мере год, а эти знания устаревают.

На самом деле тут важно следующее: если у меня код в одном месте x^2, в другом x^{2}, там x ^2, то скопировав pdf от x^2 я потом в поиске pdf должен найти всех остальных. И поиск готического M не должен выдавать никаких других M, кроме этого. Но, боюсь, это пока pipe dream

Цитата:
Не могли бы вкратце рассказать про порядок подключения пакетов? Или ссылку хорошую. Как ошибок не делать таких.

Ну это надо смотреть документацию пакетов. Или спрашивать. Или самому экспериментировать. Универсальных правил нет.

 
 
 
 Re: Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 15:08 
У меня okular нормально копирует русские символы из PDF, созданного при помощи pdflatex. Акробат9 (Linux) тоже копирует.

Из невозможности копирования из PDF можно извлечь пользу. Например, получается простейшая защита от копирования текста студентами из методичек.

 
 
 
 Re: Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 15:30 
Аватара пользователя
Legioner93 в сообщении #922843 писал(а):
Не могли бы вкратце рассказать про порядок подключения пакетов?

Методом „научного тыка“. :)
Да и таких пакетов вроде было не очень много, главное что вы знаете об этой особенности.

-- 25.10.2014, 14:37 --

vvk в сообщении #922854 писал(а):
У меня okular нормально копирует русские символы из PDF, созданного при помощи pdflatex. Акробат9 (Linux) тоже копирует.

Из невозможности копирования из PDF можно извлечь пользу. Например, получается простейшая защита от копирования текста студентами из методичек.

Где-то на форуме обсуждался способ извлечения этого текста, так что не вариант.
Для защиты лучше всего пойдёт конвертирование pdf в формат djvu, например так:
djvudigital --dpi=300 my_file.pdf my_new_file.djvu

 
 
 
 Re: Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 17:48 
Аватара пользователя
У ABBYY Finereader и аналогичных штук не 100,00% на подобного рода текстах будет?

 
 
 
 Re: Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 17:59 
Аватара пользователя
У OCR будут проблемы с математическими выражениями. OCR математических выражений усиленно обсуждается (линки в разделе "Towards a Digital Mathematics Library" с этой страницы http://www.fi.muni.cz/usr/sojka/), но это пока pipe dream

 
 
 [ Сообщений: 14 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group