2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему
 
 Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 11:46 
Заслуженный участник
Аватара пользователя


28/07/09
1238
Раньше на Linux использовал примерно такую скудную "шапку", стыренную откуда-то в интернете (оставил только языковое-шрифтовое):
Используется синтаксис LaTeX
\usepackage[cp1251]{inputenc}
\usepackage[T2A]{fontenc}
\usepackage[english,russian]{babel}
\usepackage{amssymb}

+Что-то выставлял ещё в настройках программы TeXMaker (тоже виндовую кодировку, наверное)

Были проблемы, полный список уже не помню. Если открыть tex-файл в системном блокноте, то вместо русского языка - кракозябры. И вообще чувствовалось: система недовольна.
Умные люди вразумили, что такое cp1251 и почему оно не комильфо. Уже года 2 использую нижеследущее. Не помню :oops: , какая строка тут за что отвечает, поэтому кидаю сразу всё, что может иметь отношение к делу:
Используется синтаксис LaTeX
\usepackage[utf8]{inputenc}
\usepackage[T2A]{fontenc}
\usepackage[english,russian]{babel}
\usepackage[unicode]{hyperref}
\usepackage{amssymb}
\usepackage{mathtext}
\usepackage{amsmath}


Сегодня обнаружил, что скопировать русский текст из просмотрщика PDF-ок не представляется возможным, тоже абракадабра.
Посоветуйте что-нибудь! :-)

 Профиль  
                  
 
 Re: Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 12:38 
Аватара пользователя


05/12/12
136
Chernigov
Из под какого просмотрщика pdf копируете текст? Какой дистрибутив линукс?
попробуйте с:
\usepackage{cmap}

 Профиль  
                  
 
 Re: Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 12:40 
Заслуженный участник


20/12/10
9061
Legioner93 в сообщении #922812 писал(а):
Сегодня обнаружил, что скопировать русский текст из просмотрщика PDF-ок не представляется возможным, тоже абракадабра.
Возможно, потому, что pdf из tex можно делать по-разному. Я использую miktex, а там есть такие варианты: tex->pdf, tex->dvi->pdf, tex->dvi->ps->pdf. Так вот, в 1-м варианте абракадабра, а в двух других всё окей. Почему так происходит, понятия не имею. Да, преамбула у моих tex-файлов столь же примитивная.

 Профиль  
                  
 
 Re: Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 13:57 
Заслуженный участник
Аватара пользователя


31/01/14
11305
Hogtown
Что ставить в опцию inputenc?

Это зависит от того, в какой кодировке текстовый редактор пишет (но приличный текстовый редактор должен позволять менять кодировку). Разумеется, utf8 лучше всего, т.к. он поддерживает много разных языков (см [url=http://dxdy.ru/post824193.html#p824193] где я "ботал по казахски" :D). Разумеется, для некоторых языков придется заменить или добавить опции в fontenc

Рекомендуется сразу после класса загрузить пакет cmap (character map), который однако не работает с dvips , но работает с pdftex и dvipdfmx (т.е. с tex->pdf, tex->dvi->pdf, но не с tex->dvi->ps->pdf). Есть еще весьма сырой mmap который должен улучшить копирование мат символов на выходе)

 Профиль  
                  
 
 Re: Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 13:59 
Заслуженный участник
Аватара пользователя


28/07/09
1238
Просмотрщик Evince.
jamesjames в сообщении #922814 писал(а):
\usepackage{cmap}

Огромное спасибо! Теперь копируется!
nnosipov
Ваши варианты у меня тоже есть (и ещё куча всяких), но ни один не заработал :-) Вероятно, надо что-то дополнительное настраивать. Попробуйте, кстати, команду jamesjames

-- Сб окт 25, 2014 15:04:32 --

Red_Herring в сообщении #922828 писал(а):
Есть еще весьма сырой mmap который должен улучшить копирование мат символов на выходе

А как он должен улучшить? Пока у меня с той шапкой, что в 1-ом посте (без cmap) копируются символы типа φ, λ, ∈

-- Сб окт 25, 2014 15:07:59 --

Интересно, возможно ли копировать в таком смешанном стиле, как λ^2. Это конечно не $\lambda ^2$, но приятнее, чем \lambda^2

 Профиль  
                  
 
 Re: Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 14:15 
Заслуженный участник


20/12/10
9061
Legioner93 в сообщении #922829 писал(а):
Попробуйте, кстати, команду jamesjames
Попробовал, действительно всё окей. Вот теперь думаю, переделывать ли все свои tex-и или ограничиться только pdf-ми :-)

 Профиль  
                  
 
 Re: Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 14:24 
Заслуженный участник
Аватара пользователя


28/07/09
1238
М-да, у меня половина текста копируется, а половина - нет. А важно, в какое место вставлять этот cmap?

 Профиль  
                  
 
 Re: Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 14:26 
Аватара пользователя


05/12/12
136
Chernigov
Legioner93 в сообщении #922829 писал(а):
Просмотрщик Evince.

Странно то, что у меня на Gentoo в TexLive 2013 с utf8 всё отлично, причём без cmap. :-)
Legioner93 в сообщении #922829 писал(а):
Огромное спасибо! Теперь копируется!

Всегда пожалуйста.
Legioner93 в сообщении #922838 писал(а):
М-да, у меня половина текста копируется, а половина - нет. А важно, в какое место вставлять этот cmap?

В преамбулу же. Думаю лучше всего сразу после \documentclass.

 Профиль  
                  
 
 Re: Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 14:36 
Заслуженный участник
Аватара пользователя


28/07/09
1238
А я в самый конец преамбулы пихнул... Теперь точно всё копируется. 8-)
Не могли бы вкратце рассказать про порядок подключения пакетов? Или ссылку хорошую. Как ошибок не делать таких.

 Профиль  
                  
 
 Re: Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 14:45 
Заслуженный участник
Аватара пользователя


31/01/14
11305
Hogtown
Legioner93 в сообщении #922829 писал(а):
А как он должен улучшить? Пока у меня с той шапкой, что в 1-ом посте (без cmap) копируются символы типа φ, λ, ∈

Тут еще от пдф-браузерта зависит. Например cmap был в какой-то момент существенен для adobe acrobat/reader. Я не следил за этим по-крайней мере год, а эти знания устаревают.

На самом деле тут важно следующее: если у меня код в одном месте x^2, в другом x^{2}, там x ^2, то скопировав pdf от x^2 я потом в поиске pdf должен найти всех остальных. И поиск готического M не должен выдавать никаких других M, кроме этого. Но, боюсь, это пока pipe dream

Цитата:
Не могли бы вкратце рассказать про порядок подключения пакетов? Или ссылку хорошую. Как ошибок не делать таких.

Ну это надо смотреть документацию пакетов. Или спрашивать. Или самому экспериментировать. Универсальных правил нет.

 Профиль  
                  
 
 Re: Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 15:08 


22/08/14
25
У меня okular нормально копирует русские символы из PDF, созданного при помощи pdflatex. Акробат9 (Linux) тоже копирует.

Из невозможности копирования из PDF можно извлечь пользу. Например, получается простейшая защита от копирования текста студентами из методичек.

 Профиль  
                  
 
 Re: Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 15:30 
Аватара пользователя


05/12/12
136
Chernigov
Legioner93 в сообщении #922843 писал(а):
Не могли бы вкратце рассказать про порядок подключения пакетов?

Методом „научного тыка“. :)
Да и таких пакетов вроде было не очень много, главное что вы знаете об этой особенности.

-- 25.10.2014, 14:37 --

vvk в сообщении #922854 писал(а):
У меня okular нормально копирует русские символы из PDF, созданного при помощи pdflatex. Акробат9 (Linux) тоже копирует.

Из невозможности копирования из PDF можно извлечь пользу. Например, получается простейшая защита от копирования текста студентами из методичек.

Где-то на форуме обсуждался способ извлечения этого текста, так что не вариант.
Для защиты лучше всего пойдёт конвертирование pdf в формат djvu, например так:
djvudigital --dpi=300 my_file.pdf my_new_file.djvu

 Профиль  
                  
 
 Re: Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 17:48 
Заслуженный участник
Аватара пользователя


28/07/09
1238
У ABBYY Finereader и аналогичных штук не 100,00% на подобного рода текстах будет?

 Профиль  
                  
 
 Re: Как всё-таки правильно подключать русский язык в TeX? Linux!
Сообщение25.10.2014, 17:59 
Заслуженный участник
Аватара пользователя


31/01/14
11305
Hogtown
У OCR будут проблемы с математическими выражениями. OCR математических выражений усиленно обсуждается (линки в разделе "Towards a Digital Mathematics Library" с этой страницы http://www.fi.muni.cz/usr/sojka/), но это пока pipe dream

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 14 ] 

Модераторы: Karan, Toucan, PAV, maxal, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group