задача по обработке эксперимента

mara · 01.03.2008, 13:21

проведен следующий эксперимент: испытуемые печатают страницу высокосвязного (с большим количеством повторяющихся слов) текста, не проверяя свои ошибки. Эмпирические данные говорят о том, что имеется тенденция повторять ошибки в одних и тех же словах. Как рассчитать теоретическую вероятность повторной ошибки?

я делаю это по-тупому: каждый раз напечатанное слово (например "фольклор", которое повторяется 17 раз) рассматриваю как отдельную пробу. считаю вероятность ошибки в первой пробе. далее смотрю на количество совпадений / несовпадений при второй встрече того же слова и сравниваю хи-квадратом. получается долго и плохо

логичнее рассчитать теоретическую и эмпирическую вероятность повторной ошибки. но здесь меня заклинило. Буду очень благодарна, если кто-нибудь подскажет, как это можно сделать.

PAV · 01.03.2008, 13:44

Так как задача прикладная, то переношу из "Помогите решить" в корневой раздел

Добавлено спустя 3 минуты 34 секунды:

Можно попробовать использовать таблицы 2x2. Попробуйте так: весь текст разбить на две части. В первой части и во второй независимо разбить все слова на две примерно равные группы: часто ошибочные и редко ошибочные. Если гипотеза верна, то должна наблюдаться хорошая корреляция: слово, попавшее в группу "ошибочных" в одной части текста более вероятно попадет в группу "ошибочных" и в другой части текста.

Добавлено спустя 8 минут 48 секунд:

А можно также использовать коэффициент ранговой корреляции Спирмена (см. об этом в учебных материалах для психологов здесь, задания 7 и 8). В каждой из двух частей текста отранжировать слова по степени ошибочности написания и сравнить полученные последовательности рангов. Весь вопрос в том, насколько объективно это удастся сделать. Лучше всего, думаю, отбросить простые слова, которые во всем тексте написаны правильно, и работать только с теми, где встречаются ошибки.

mara · 01.03.2008, 18:56

спасибо за варианты. Но хотелось бы все же это через вероятности расчитать. Корреляция процедура не надежная

PAV · 01.03.2008, 22:31

Честно говоря, я не очень понимаю, что Вы хотите. То, что я написал, выглядит как разумный статистический метод. Какие тут можно рассчитать вероятности - я не вполне понимаю. Если Вы попробуете изложить Ваше понимание задачи чуть более формально, возможно, я смог бы Вам чем-то помочь.

Научный форум dxdy

задача по обработке эксперимента