2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 задача по обработке эксперимента
Сообщение01.03.2008, 13:21 
проведен следующий эксперимент: испытуемые печатают страницу высокосвязного (с большим количеством повторяющихся слов) текста, не проверяя свои ошибки. Эмпирические данные говорят о том, что имеется тенденция повторять ошибки в одних и тех же словах. Как рассчитать теоретическую вероятность повторной ошибки?

я делаю это по-тупому: каждый раз напечатанное слово (например "фольклор", которое повторяется 17 раз) рассматриваю как отдельную пробу. считаю вероятность ошибки в первой пробе. далее смотрю на количество совпадений / несовпадений при второй встрече того же слова и сравниваю хи-квадратом. получается долго и плохо

логичнее рассчитать теоретическую и эмпирическую вероятность повторной ошибки. но здесь меня заклинило. Буду очень благодарна, если кто-нибудь подскажет, как это можно сделать.

 
 
 
 
Сообщение01.03.2008, 13:44 
Аватара пользователя
Так как задача прикладная, то переношу из "Помогите решить" в корневой раздел

Добавлено спустя 3 минуты 34 секунды:

Можно попробовать использовать таблицы 2x2. Попробуйте так: весь текст разбить на две части. В первой части и во второй независимо разбить все слова на две примерно равные группы: часто ошибочные и редко ошибочные. Если гипотеза верна, то должна наблюдаться хорошая корреляция: слово, попавшее в группу "ошибочных" в одной части текста более вероятно попадет в группу "ошибочных" и в другой части текста.

Добавлено спустя 8 минут 48 секунд:

А можно также использовать коэффициент ранговой корреляции Спирмена (см. об этом в учебных материалах для психологов здесь, задания 7 и 8). В каждой из двух частей текста отранжировать слова по степени ошибочности написания и сравнить полученные последовательности рангов. Весь вопрос в том, насколько объективно это удастся сделать. Лучше всего, думаю, отбросить простые слова, которые во всем тексте написаны правильно, и работать только с теми, где встречаются ошибки.

 
 
 
 
Сообщение01.03.2008, 18:56 
спасибо за варианты. Но хотелось бы все же это через вероятности расчитать. Корреляция процедура не надежная :)

 
 
 
 
Сообщение01.03.2008, 22:31 
Аватара пользователя
Честно говоря, я не очень понимаю, что Вы хотите. То, что я написал, выглядит как разумный статистический метод. Какие тут можно рассчитать вероятности - я не вполне понимаю. Если Вы попробуете изложить Ваше понимание задачи чуть более формально, возможно, я смог бы Вам чем-то помочь.

 
 
 [ Сообщений: 4 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group