2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему
 
 задача по обработке эксперимента
Сообщение01.03.2008, 13:21 


01/03/08
2
проведен следующий эксперимент: испытуемые печатают страницу высокосвязного (с большим количеством повторяющихся слов) текста, не проверяя свои ошибки. Эмпирические данные говорят о том, что имеется тенденция повторять ошибки в одних и тех же словах. Как рассчитать теоретическую вероятность повторной ошибки?

я делаю это по-тупому: каждый раз напечатанное слово (например "фольклор", которое повторяется 17 раз) рассматриваю как отдельную пробу. считаю вероятность ошибки в первой пробе. далее смотрю на количество совпадений / несовпадений при второй встрече того же слова и сравниваю хи-квадратом. получается долго и плохо

логичнее рассчитать теоретическую и эмпирическую вероятность повторной ошибки. но здесь меня заклинило. Буду очень благодарна, если кто-нибудь подскажет, как это можно сделать.

 Профиль  
                  
 
 
Сообщение01.03.2008, 13:44 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Так как задача прикладная, то переношу из "Помогите решить" в корневой раздел

Добавлено спустя 3 минуты 34 секунды:

Можно попробовать использовать таблицы 2x2. Попробуйте так: весь текст разбить на две части. В первой части и во второй независимо разбить все слова на две примерно равные группы: часто ошибочные и редко ошибочные. Если гипотеза верна, то должна наблюдаться хорошая корреляция: слово, попавшее в группу "ошибочных" в одной части текста более вероятно попадет в группу "ошибочных" и в другой части текста.

Добавлено спустя 8 минут 48 секунд:

А можно также использовать коэффициент ранговой корреляции Спирмена (см. об этом в учебных материалах для психологов здесь, задания 7 и 8). В каждой из двух частей текста отранжировать слова по степени ошибочности написания и сравнить полученные последовательности рангов. Весь вопрос в том, насколько объективно это удастся сделать. Лучше всего, думаю, отбросить простые слова, которые во всем тексте написаны правильно, и работать только с теми, где встречаются ошибки.

 Профиль  
                  
 
 
Сообщение01.03.2008, 18:56 


01/03/08
2
спасибо за варианты. Но хотелось бы все же это через вероятности расчитать. Корреляция процедура не надежная :)

 Профиль  
                  
 
 
Сообщение01.03.2008, 22:31 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Честно говоря, я не очень понимаю, что Вы хотите. То, что я написал, выглядит как разумный статистический метод. Какие тут можно рассчитать вероятности - я не вполне понимаю. Если Вы попробуете изложить Ваше понимание задачи чуть более формально, возможно, я смог бы Вам чем-то помочь.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 4 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group