0. ММП на теореме Байеса не основан. Он, в определённом смысле, байесовскому оцениванию противоположен. Байес предполагает, что значения параметров случайны с известным распределением, и надо оценить значение в данном опыте, опираясь на это распределение и на результаты опыта. В ММП значения параметров предполагаются однозначно определёнными, хоть и неизвестными.
1. "Ошибочный результат" и "результат с ошибкой" не синонимы. "Ошибочный" - тот, которым нельзя пользоваться. "С ошибкой" - имеет отклонения от точного значения, что следует учитывать при использовании. В статистике результатов "без ошибки" не бывает (ну, разве что число элементов выборки нам точно известно).
2. Ошибки бывают разные, причём настолько разные, что их невозможно проранжировать, указав лучшую. Несмещённость - один из критериев, сужающих выбор метода оценивания, так что в нём можно уже выбрать наилучшую (скажем, имеющую минимальную дисперсию). Но при этом она может оказаться очень плоха по иному критерию (скажем, если нам важна робастность - то прекрасная оценка матожидания, несмещённая и с минимальной дисперсией, среднее арифметическое, может быть решительно скверной; а медиана удовлетворительна).
3. ММП ищет максимум функции правдоподобия. Максимум функции плотности распределения, выворачиванием которой наизнанку получена функция правдоподобия, есть мода. А мода и матожидание могут не совпадать, гарантировано совпадение лишь для симметричных одномодальных. Для дисперсии же, как сказано в классическом произведении, "правый хвост длиннее". То есть модальное значение и матожидание не совпадают. Соответственно, различаются и оценки, исходящие из разных критериев, и оптимальная по одному не удовлетворяет другому (и наоборот). Более того, можно рассмотреть и комбинированный критерий, дисперсия плюс квадрат смещения (квадрат гипотенузы, однако, правда, товарищ Пифагор?), и тогда получим третий вариант, где сумма квадратов отклонений от среднего делится не на n, как в ММП, и не на
, как при несмещённом оценивании дисперсии, а на
, и это не ошибка, а ещё один вариант из множества.
4. Если мы подвергаем переменную нелинейному преобразованию, преобразуется и её функция распределения, причём мода, матожидание и т.п. сдвигаются по-разному. И так как корень квадратный это нелинейное преобразование, то получить несмещённую оценку СКО, извлекая корень из несмещённой оценки дисперсии, не получается.