2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему
 
 Психофизическая модель восприятия человека, метрика качества
Сообщение18.11.2008, 15:29 


18/09/08
425
Как известно, ни сжатие, ни просто передача изображения без психовизуальной модели не возможна.
Например, в кодировании видеосигнала была сделанна большая работа по психовизуальном представлении цвета, и были разработанны форматы RGB,YUV,CMYK... То же самое для телевидения PAL,SECAM,NTSC. В частности именно поэтому YUV лучше чем RGB, PAL лучше SECAM для телевидения.
Но психовизуальная модель изображения вообще разработанна очень слабо и не выходит за рамки потребностей традиционного телевидения, психослуховая модель разработанна на порядок лучше и полнее, хотя бы потому что иследования стали проводиться на столетия раньше.

Вот статья "Психофизическая модель восприятия человека и метрика искажения информации"
лежит на
http://igorypimenov.narod.ru/Psichophisical_model.pdf
которая вводит новый подход в оценивании качества эквивалентно субъективному восприятию и методов кодирования, основанный на теории информации.

( http://igorypimenov.narod.ru/yuvi.rar
это девелоперский браузер что может мерить эту метрику и сравнивать.)

Для понимания экстремальной важности этой темы, цитата с
http://www.edu-zone.net/show/49091.html
Цитата:
Нелинейность и частотная зависимость чувствительности зрительной
системы позволили создать оптимальные системы сжатия видеоинформации. В
этих системах для достижения большей устойчивости к ошибкам, появляющимся
при кодировании и передаче, изображение обрабатывается примерно так же, как
и в зрительной системе человека. Впервые это предложение было сделано
Стокхэмом [23]. Сокращение избыточности информации математически строго обосновывается
положениями теории кодирования при заданном критерии точности [24]. Как
отмечали Маннос и Сакрисон [17], эффективные теоремы теории кодирования при
заданном критерии точности в задачах сжатия видеоинформации применить не
удалось. Основной причиной этого явилась сложность выбора критерия
допустимой величины ошибок, согласующегося со свойствами системы зрения
человека. Манное и Сакрисон смогли показать, что можно пользоваться
критерием, связанным с нелинейными и пространственно-частотными свойствами
зрения.


Выше приведенная работа позволяет построить требуемую адекватную теорию (поскольку содержит именно критерии высказанные Манное и Сакрисоном) и построить требуемую метрику (IDM) допустимой величины ошибок, согласующегося со свойствами системы зрения человека.

Можно обменяться мнениями, а также замечениями, после внимательного прочтения.

 Профиль  
                  
 
 
Сообщение19.11.2008, 21:52 


25/01/06
102
Тема, несомненно, очень важная. Не вполне только понятно, в чем вклад автора темы. Не могли бы Вы прокомментировать это подробнее?

Ну да, могу подтвердить из личного опыта, что есть схемы компресcии, которые визуально выглядят лучше, чем H264, но уступают по PSNR. Также из личного опыта могу подтвердить, что часто пересмотром метрик занимаются отчаявшись побить конкурентов в стандартных метриках :-) :oops:

 Профиль  
                  
 
 
Сообщение20.11.2008, 18:05 


18/09/08
425
Мой вклад именно в том что впервые была подведенна матбаза - теория информации. До этого момента это не удовалось.
Таrже был сформулированн
Основной постулат данной психофизической модели восприятия человека заключается в тезисе: "Человек воспринимает информацию".
Также, было выведенно определение
"
Определим величину искажения исходя из вышесказанного.
Величина искажения между двумя пространствами D(X,Y) есть относительная информация по средней вероятности искажения каждой информации.
"
Собственно формула искажения и объясненны все разрозненные факты. Данны четкие определения всех понятий об искажениях. Ну и вообще выстроена вся концепция выходящая из постулата.

Важность метрики и проблемы с ней всем известны.
VQEG - организация по стандартизации метрики качества провела конкурс в 2004 году на выбор метрики качества (PSNR,SSIM,VQM...). Никто не победил, все результаты оказались не удовлетворительными. В результате была выбранна VQM, и стала доводиться до ума. Как доводиться, были выбранны последовательности, весьма спорные - но "наши последовательности, что хоти то и творим", и стали добавляться механизмы и подгоняться настройки вытягиванием за уши чтоб выдаваемые значения совпадали с мнениями экспертов. Теперь это называется драфт престандард. Потомучто людям нужна единый стандартный метод сравнения качества, иначе это организация не оправдывает своего существования.
Ныне существующие метрики только с натяжкой можно считать удовлетворительными, и то потому-что ничего лучше нет. И потом они все очень долго считаются.
Эта статья предлагает, да еще одну, но основанную на цельной концепции проверенную меру качества.

И целью является не измения метрики "чтоб побить конкурента", а улучшение качества изображения при увеличении компрессии. Ведь если метрика не адекватна то количество бит растет и растет PSNR, там где это совсем не важно, а где важно появляются видимые артефакты которые метрика не замечает. То есть цель вырабатка критериев. Например, в аналоговом телевидении (без потери качества) такие модели были сделанны и сейчас используются всеми. Причем из нескольких альтернативных, победили самые адекватные.

Добавлено спустя 2 часа 22 минуты:

Обновите статью с сайта.
Чтобы снять вопросы об цели этой статьи, было написанно введение.

 Профиль  
                  
 
 
Сообщение20.11.2008, 22:45 


25/01/06
102
Спасибо. Все, что Вы говорите, вполне интересно. Мелкие комментарии оставлю при себе. А когда будет время, попробую запрограммировать и применить к "живым" данным.

 Профиль  
                  
 
 
Сообщение24.11.2008, 15:24 


18/09/08
425
В програмке YUVI вы можете посмотреть данное измерение (без времени), а еще посмотреть количество информации по точкам командой filter 1 на кнопке 4.

 Профиль  
                  
 
 
Сообщение24.11.2008, 21:40 


25/01/06
102
Спасибо, загружу и программу.

 Профиль  
                  
 
 
Сообщение26.11.2008, 16:32 


18/09/08
425
Модератор, переместите эту тему обратно в Computer Scince - это на стопроцентов раздел относящийся к ней.

Всем кому может быть интересно, почитайте,
Image Quality Assessment: From Error Visibility to Structural Similarity
с http://www.cns.nyu.edu/pub/eero/wang03-reprint.pdf
Там вначале неплохой обзор подходов и проблем, а также показанно как вводится а-приори метрика основанная не на полноценной модели, а на эвристических утверждениях (в данном контексте называется "новой философией").
(Кстати, там показанно как при полном отсутствии какой либо строгости, все утверждения и формулы не проверяемы и просто вводятся как есть как аксиомы из личного понимания иследователеми о разумности, (например, структурным сходством называется коэффициент корреляции и тд. ) выводятся формулы имеющие смысл.)

В данном же подходе основанной на строгой математической теории информации, все эти проблемы разрешенны и не существуют. И пользы гораздо больше для сжатия данных с потерями , обработки и иследований качества. И вообще для базового понимания.

 Профиль  
                  
 
 
Сообщение05.12.2008, 16:07 


18/09/08
425
Могу также посоветовать сайты где показанны иллюзии что объяснила данная модель
http://www.psy.msu.ru/illusion/contrast.html
многие вещи из http://www.sciam.ru/2004/6/ochevidnoe.shtml
и в интернете еще много...

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 8 ] 

Модераторы: Jnrty, Модераторы, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group