2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




На страницу 1, 2  След.
 
 Задача на кодирование информации ЕГ2010.Опечатка?
Сообщение04.04.2011, 17:27 
возможно не совсем в ту рубрику, но эта задачку можно отнести как к математике, так и к информатике
не могу правильно решить нижеследующую задачу. Помогите
(ЕГ 2010) Автоматическое устройство произвело перекодировку информационного сообщения из 16-битн кодировки Unicode в 8-битн КОИ-8, а потом удалило половину сообщения. После этого информационный объем стал 2^4 байт. Найти объем исходного сообщения в бит
Решение.
N- кол-во символов исходного. Объем исходного, V1=16*n
Объем перекодированного V2=8*n После удаления половины, т.е n-> n/2 V2’=0.5V2=4n
По условию V2’=4n=16 байт=16*8=128 бит . Откуда n=128/4=32.
Тогда V1=16*n=16*32=512 бит. Все то хорошо, только в ЕГ в качестве вариантов ответов 512 нет
А есть 1)64 2)128 3)256 4)1024 и правильным указан 4)1024.
Что не так?
Допустим что неправильно поняли перекодировку – пусть каждый символ Unicod заменяется не 1 а двумя КОИ.
Тогда V2=8*(2n)=16n и V2’=0.5V2=8n
Приравниваем 8n=16 байт=16*8=128 бит n=128/8=16 V1=16n=16*16=256 –
Такой вариант отв хоть есть в перечне возможных!!!

 
 
 
 Re: Задача на кодирование информации ЕГ2010.Опечатка?
Сообщение04.04.2011, 17:33 
Не вижу ошибок в Вашем решении. У меня тоже получается 512 бит.

 
 
 
 Re: Задача на кодирование информации ЕГ2010.Опечатка?
Сообщение04.04.2011, 18:19 
тогда надо признать что массово-оттиражированные сборники ЕГЭ 2010
(за издание и продажу которых кстати выручены немалые деньги) надо отправить на помойку вместе с авторами-составителями.

 
 
 
 
Сообщение04.04.2011, 20:53 
eugrita в сообщении #431196 писал(а):
.

Многоэтажные дроби дробят мозги- впереди ни зги.
От отупления боль в голове, на горизонте ЕГ.

см такжеhttp://www.stihi.ru/2008/07/18/1647

 
 
 
 
Сообщение05.04.2011, 21:13 
Безобразие, да, тоже подтверждаю.

 i  Только в следующий раз чур в $\TeX$е, а то буду ругаться.
В учебный раздел.

 
 
 
 Re: Задача на кодирование информации ЕГ2010.Опечатка?
Сообщение06.04.2011, 14:24 
venco в сообщении #431176 писал(а):
Не вижу ошибок в Вашем решении. У меня тоже получается 512 бит.

А почему при перекодировке должен меняться объём сообщения?
Предположим, я кодирую сообщение, содержащие только буквы русского алфавита, в 8-битной системе, каждая буква заменяется на 8 бит. Теперь я решила сделать перекодировку в двубитную систему. Неужели каждую русскую букву можно заменить на два бита?
Исходя из вышесказанного, думаю, что правильный ответ не 512, а 256.

-- Ср апр 06, 2011 14:45:05 --


Я думаю, скорее всего имелось в виду вот что. Сообщение, закодированное в Юникод, содержало очень разнообразные символы, например, русские, английские, ивритские, древнегреческие и армянские буквы, китайские, корейские, японские и древнеегипетские иероглифы, мамематические символы и прочую по...нь.
В этом случае, как ни крути, в 8 бит не перекодировать, меняя объём.

 
 
 
 Re: Задача на кодирование информации ЕГ2010.Опечатка?
Сообщение06.04.2011, 15:37 
Не путайте объём сообщения и количество информации в нём. Определить количество информации - нетривиальная задача, зависящая от многих факторов не упомянутых в задаче. К счастью, это и не требуется, речь идёт лишь об объёме сообщения.

 
 
 
 
Сообщение06.04.2011, 19:16 
Xenia - (с уважением отношусь к Израилю, особенно после того как скачал у вашего единоземца выставленную им программу по расчету балок на упругом основании и после отъезда туда моих знакомых).
Так вот, конечно 1)букву на 2 бита нельзя.
2)под перекодировкой обычно понимается замена 1 символа (буквы) одной кодировки на 1 букву другой кодировки , например DKOI-Unicode Ansi-Unicode и пр.
Хотя понятие кодировка шире 1 символ можно кодировать и несколькими другими символами. Например букву, парой других букв и т.п. Но для школьников на ЕГ все-таки 1-й самый простой вариант Символ-символ

 
 
 
 
Сообщение06.04.2011, 22:34 
То есть еще раз и понятно:
Xenia1996 в сообщении #431789 писал(а):
Неужели каждую русскую букву можно заменить на два бита?
1. На два байта же, fix Вам.
2. Да, в юникоде каждая русская буква весит два байта, а в однобайтных кодировках, внезапно, один байт. Поэтому объем того же самого текста в юникоде будет действительно в два раза больше. Плата за универсальность.

 
 
 
 
Сообщение06.04.2011, 22:49 

(Оффтоп)

AD в сообщении #431949 писал(а):
в юникоде каждая русская буква весит два байта

AD
В UTF-32 каждая русская буква весит четыре байта. А еще есть языки, буквы которых весят 2 байта в UTF-16, 3 байта в UTF-8 и 4 байта в UTF-32. Да и вообще "16-битная кодировка Юникод" — очень неудачный термин, за которым может скрываться как небрежность речи (вместо корректного "кодировка UTF-16"), так и незнание предмета (Юникод — это не кодировка, а набор кодировок, плюс набор символов, плюс алгоритмы).

 
 
 
 
Сообщение07.04.2011, 06:32 
Cогласно определению "кодирование это перевод символов 1 алфавита в символы 2 алфавита". Как частный случай , 2 алфавит может быть например, построен из пар букв старого алфавита

 
 
 
 Re:
Сообщение07.04.2011, 11:51 
eugrita в сообщении #431890 писал(а):
Xenia - (с уважением отношусь к Израилю, особенно после того как скачал у вашего единоземца выставленную им программу по расчету балок на упругом основании и после отъезда туда моих знакомых).

(Оффтоп)

Спасибо :oops:


-- Чт апр 07, 2011 11:53:12 --

AD в сообщении #431949 писал(а):
То есть еще раз и понятно:
Xenia1996 в сообщении #431789 писал(а):
Неужели каждую русскую букву можно заменить на два бита?
1. На два байта же, fix Вам.

В примере, приведённом мной, я имела в виду именно два бита, дабы продемонстрировать абсурдность такой перекодировки. Отличить бит от байта я пока ещё могу.

 
 
 
 
Сообщение07.04.2011, 20:26 
Ну тогда ой, не заценил метафоры сразу, извиняйте. :oops: Joker_vD, тоже спасибо Вам за поправку.

 
 
 
 
Сообщение07.04.2011, 20:29 
Ну ладно ,оговорился, т.е. описа'лся

 
 
 
 
Сообщение07.04.2011, 20:38 
Но в ЕГЭ ошибка по-любому. Дело в том, что перекодировка из одной кодировки в другую — это сопоставление каждому символу из первой кодировки символа из второй кодировки. Как правило, используют перекодировку, оставляющую на месте символы, имеющиеся в обоих кодировках, и заменяющая символы из первой кодировки, которых во второй, знаками вопроса. Или квадратиками.

Итак, пусть у нас есть 1024 битная строка. Это — 128 байт, и если они содержат в себе строку, закодированную UTF-16 и не содержащую суррогатных пар, то эта строка имеет 64 символа. 64 символа в кодировке КОИ-8 всегда занимают 64 байта. Удалим половину, останется $32 = 2^5$ байт. А не $2^4$.

 
 
 [ Сообщений: 17 ]  На страницу 1, 2  След.


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group