Задача на кодирование информации ЕГ2010.Опечатка?

eugrita · 04.04.2011, 17:27

возможно не совсем в ту рубрику, но эта задачку можно отнести как к математике, так и к информатике
не могу правильно решить нижеследующую задачу. Помогите
(ЕГ 2010) Автоматическое устройство произвело перекодировку информационного сообщения из 16-битн кодировки Unicode в 8-битн КОИ-8, а потом удалило половину сообщения. После этого информационный объем стал 2^4 байт. Найти объем исходного сообщения в бит
Решение.
N- кол-во символов исходного. Объем исходного, V1=16*n
Объем перекодированного V2=8*n После удаления половины, т.е n-> n/2 V2’=0.5V2=4n
По условию V2’=4n=16 байт=16*8=128 бит . Откуда n=128/4=32.
Тогда V1=16*n=16*32=512 бит. Все то хорошо, только в ЕГ в качестве вариантов ответов 512 нет
А есть 1)64 2)128 3)256 4)1024 и правильным указан 4)1024.
Что не так?
Допустим что неправильно поняли перекодировку – пусть каждый символ Unicod заменяется не 1 а двумя КОИ.
Тогда V2=8*(2n)=16n и V2’=0.5V2=8n
Приравниваем 8n=16 байт=16*8=128 бит n=128/8=16 V1=16n=16*16=256 –
Такой вариант отв хоть есть в перечне возможных!!!

venco · 04.04.2011, 17:33

Не вижу ошибок в Вашем решении. У меня тоже получается 512 бит.

eugrita · 04.04.2011, 18:19

тогда надо признать что массово-оттиражированные сборники ЕГЭ 2010
(за издание и продажу которых кстати выручены немалые деньги) надо отправить на помойку вместе с авторами-составителями.

eugrita · 04.04.2011, 20:53

eugrita в сообщении #431196 писал(а):

.

Многоэтажные дроби дробят мозги- впереди ни зги.
От отупления боль в голове, на горизонте ЕГ.

см такжеhttp://www.stihi.ru/2008/07/18/1647

AD · 05.04.2011, 21:13

Безобразие, да, тоже подтверждаю.

i	Только в следующий раз чур в $\TeX$ е, а то буду ругаться. В учебный раздел.

Xenia1996 · 06.04.2011, 14:24

venco в сообщении #431176 писал(а):

Не вижу ошибок в Вашем решении. У меня тоже получается 512 бит.

А почему при перекодировке должен меняться объём сообщения?
Предположим, я кодирую сообщение, содержащие только буквы русского алфавита, в 8-битной системе, каждая буква заменяется на 8 бит. Теперь я решила сделать перекодировку в двубитную систему. Неужели каждую русскую букву можно заменить на два бита?
Исходя из вышесказанного, думаю, что правильный ответ не 512, а 256.

-- Ср апр 06, 2011 14:45:05 --

Я думаю, скорее всего имелось в виду вот что. Сообщение, закодированное в Юникод, содержало очень разнообразные символы, например, русские, английские, ивритские, древнегреческие и армянские буквы, китайские, корейские, японские и древнеегипетские иероглифы, мамематические символы и прочую по...нь.
В этом случае, как ни крути, в 8 бит не перекодировать, меняя объём.

venco · 06.04.2011, 15:37

Не путайте объём сообщения и количество информации в нём. Определить количество информации - нетривиальная задача, зависящая от многих факторов не упомянутых в задаче. К счастью, это и не требуется, речь идёт лишь об объёме сообщения.

eugrita · 06.04.2011, 19:16

Xenia - (с уважением отношусь к Израилю, особенно после того как скачал у вашего единоземца выставленную им программу по расчету балок на упругом основании и после отъезда туда моих знакомых).
Так вот, конечно 1)букву на 2 бита нельзя.
2)под перекодировкой обычно понимается замена 1 символа (буквы) одной кодировки на 1 букву другой кодировки , например DKOI-Unicode Ansi-Unicode и пр.
Хотя понятие кодировка шире 1 символ можно кодировать и несколькими другими символами. Например букву, парой других букв и т.п. Но для школьников на ЕГ все-таки 1-й самый простой вариант Символ-символ

AD · 06.04.2011, 22:34

То есть еще раз и понятно:

Xenia1996 в сообщении #431789 писал(а):

Неужели каждую русскую букву можно заменить на два бита?

1. На два байта же, fix Вам.
2. Да, в юникоде каждая русская буква весит два байта, а в однобайтных кодировках, внезапно, один байт. Поэтому объем того же самого текста в юникоде будет действительно в два раза больше. Плата за универсальность.

Joker_vD · 06.04.2011, 22:49

(Оффтоп)

AD в сообщении #431949 писал(а):

в юникоде каждая русская буква весит два байта

AD
В UTF-32 каждая русская буква весит четыре байта. А еще есть языки, буквы которых весят 2 байта в UTF-16, 3 байта в UTF-8 и 4 байта в UTF-32. Да и вообще "16-битная кодировка Юникод" — очень неудачный термин, за которым может скрываться как небрежность речи (вместо корректного "кодировка UTF-16"), так и незнание предмета (Юникод — это не кодировка, а набор кодировок, плюс набор символов, плюс алгоритмы).

eugrita · 07.04.2011, 06:32

Cогласно определению "кодирование это перевод символов 1 алфавита в символы 2 алфавита". Как частный случай , 2 алфавит может быть например, построен из пар букв старого алфавита

Xenia1996 · 07.04.2011, 11:51

eugrita в сообщении #431890 писал(а):

Xenia - (с уважением отношусь к Израилю, особенно после того как скачал у вашего единоземца выставленную им программу по расчету балок на упругом основании и после отъезда туда моих знакомых).

(Оффтоп)

Спасибо

-- Чт апр 07, 2011 11:53:12 --

AD в сообщении #431949 писал(а):

То есть еще раз и понятно:

Xenia1996 в сообщении #431789 писал(а):

Неужели каждую русскую букву можно заменить на два бита?

1. На два байта же, fix Вам.

В примере, приведённом мной, я имела в виду именно два бита, дабы продемонстрировать абсурдность такой перекодировки. Отличить бит от байта я пока ещё могу.

AD · 07.04.2011, 20:26

Ну тогда ой, не заценил метафоры сразу, извиняйте. :oops:

Joker_vD, тоже спасибо Вам за поправку.

eugrita · 07.04.2011, 20:29

Ну ладно ,оговорился, т.е. описа'лся

Joker_vD · 07.04.2011, 20:38

Но в ЕГЭ ошибка по-любому. Дело в том, что перекодировка из одной кодировки в другую — это сопоставление каждому символу из первой кодировки символа из второй кодировки. Как правило, используют перекодировку, оставляющую на месте символы, имеющиеся в обоих кодировках, и заменяющая символы из первой кодировки, которых во второй, знаками вопроса. Или квадратиками.

Итак, пусть у нас есть 1024 битная строка. Это — 128 байт, и если они содержат в себе строку, закодированную UTF-16 и не содержащую суррогатных пар, то эта строка имеет 64 символа. 64 символа в кодировке КОИ-8 всегда занимают 64 байта. Удалим половину, останется $32 = 2^5$ байт. А не $2^4$ .

Научный форум dxdy

Задача на кодирование информации ЕГ2010.Опечатка?