Ну, я бы взял дневные данные с finance.yahoo.com (adjusted close), вычислил бы доходность, как
или
(это приблизительно равные величины, первая чаще употребительна в теории, вторую иногда предпочитают практики).
По любой известной фирме. Если нужно много выбросов - биотех или IT. Впрочем, отдельные выбросы можно найти и в солидных индексах. Скажем, S&P упал 19.10.1987 на 22.9%, падения на 5-10% в день были в 1950, 1955, 1962, 1987, 1988, 1989, 1997, 1998, 2000, 2001, 2008, 2009, 2011 годах, всего 27 случаев за менее чем 62 года, при том, что стандартное отклонение 0.98%, так что это "выход за границу пять сигма", который в предположении нормального распределения случается один раз на три с половиной миллиона испытаний.
-- 19 ноя 2012, 09:13 --Критерии для отбрасывания - критерий Шовене, критерий Пирса, критерий Граббса (все основаны на выборочных среднем и дисперсии, наиболее разработан последний
http://en.wikipedia.org/wiki/Grubbs%27_ ... r_outliers ), общий их недостаток в том, что подозрительное значение входит в расчёт среднего и (где особо искажает) дисперсии, так что может себя маскировать (завышая дисперсию и смещая в свою сторону среднее), особенно это проявляется при наличии двух и более выбросов (отчасти лечится "скользящим экзаменом", удалением перед расчётом показателей подозрительного наблюдения из выборки); Q-тест Диксона, в котором рассчитывается разница между подозрительным и ближайшим к нему значением, делится на "размах" (разницу максимального и минимального значений), затем обращаются к предложенной им таблице
http://en.wikipedia.org/wiki/Dixon%27s_Q_testкритерий Титьена-Мура (для случая, когда подозрительны k наблюдений), описание есть в (Айвазян, Енюков, Мешалкин, "Прикладная статистика", том 1) или в (Смоляк Титаренко, "Устойчивые методы оценивания").