2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему
 
 помогите понять отрывок из статьи
Сообщение24.12.2010, 17:08 
Аватара пользователя


15/11/08
502
London, ON
Здравствуйте. В конце статьи которую я читаю я не совсем понял последнюю часть. Сама статья описывает метод анализа категориальных данных (frequency tables), основываясь на стохастическом порядке, но последняя часть говорит о преимуществах такого анализа.
Не могли бы вы мне объяснить, что такое $Z_{ij}$.

We have shown in this paper that simple and intuitive ordinal considerations regarding stochastic ordering give rise to CA models of rank2. Within the rank2 model family ordinal models of uniform association of various degrees can be considered. Correspondence analysis models with rank higher than 2 which still use ordinal consideration (other than stochastic ordering) are thoroughly discussed and exemplified by Gilula & Haberman (1988). We would like to conclude this paper by briefly showing how rank 2 CA models can also be used for the analysis of variance of categorical data.
Light & Margolin (1971) and Gilula (1985) discuss issues of such analysis of variance in terms of measuring variability of categorical variables and the establishment of appropriate test statistics. Recall that if in the usual framework of the one-way analysis of variance, $Z_{ij}$ denotes the $i$-th observation in the $j$-th sample, then the relevant sum of
squares are

$SSB =\sum\limits_j n_j(\bar Z_j-\bar Z)^2$
$SSW =\sum\limits_j \sum\limits_i(Z_{ij}-\bar Z_j)^2$
$SST =\sum\limits_j \sum\limits_i(Z_{ij}-\bar Z)^2$

where $\bar Z$ is the overall mean, $\bar Z_j$ is the mean in the $j$-th sample and $n_j$ is the size of the
sample drawn from the jth population. In our context we have J-multinomial populations,
all defined on the same I-category random variable $X$. Here $\sum\limits_j n_{.j} = n$ is the size of
the sample drawn from the jth population, and nii is the frequency in the $ij$-th cell. Now
assume that the rank 2 CA model holds.

 Профиль  
                  
 
 Re: помогите понять отрывок из статьи
Сообщение24.12.2010, 23:02 
Аватара пользователя


15/11/08
502
London, ON
Ну так... кто-нибудь может мне помочь?

 Профиль  
                  
 
 Re: помогите понять отрывок из статьи
Сообщение24.12.2010, 23:20 
Админ форума
Аватара пользователя


19/03/10
8952
 !  Neytrall, Предупреждение за нарушение Правил форума (замечание за подобное же нарушение у Вас уже есть):
Правила форума в http://dxdy.ru/post27358.html#p27358 писал(а):
Также напоминаем о недопустимости искусственного поднятия темы за счет неинформативных сообщений. Это является нарушением правил. Возможно, Вам просто не повезло, и в настоящее время на форуме нет специалиста, способного ответить на вопрос, или он занят другими делами. А возможно, что Вы не сумели заинтересовать участников форума своим вопросом или задали его в слишком общем виде. В любом случае не забывайте, что никто никому ничего здесь не должен.

 Профиль  
                  
 
 Re: помогите понять отрывок из статьи
Сообщение24.12.2010, 23:27 
Заслуженный участник
Аватара пользователя


03/02/10
1928
Neytrall в сообщении #390976 писал(а):
$Z_{ij}$ denotes the $i$-th observation in the $j$-th sample

итое наблюдение в житом испытании (измерении)... нафига полстатьи цитировать?

 Профиль  
                  
 
 Re: помогите понять отрывок из статьи
Сообщение25.12.2010, 00:09 
Аватара пользователя


15/11/08
502
London, ON
paha
Если бы было так всё просто. Это не может быть наблюдением. Дело в том что $\bar Z=0$. Я сначала думал, что это может быть residual=$e_{ij}$ так как $\sum\limits_{ij}e_{ij}=0$...но это скорее всего не так.

Перевести то я и сам перевёл. Я хочу понять, что это.

-- Сб дек 25, 2010 00:01:55 --

Toucan
В прошлый раз, я задал вопрос именно по этой статье, примерно, месяц назад...за это время топик посетило +50 человек...

 Профиль  
                  
 
 Re: помогите понять отрывок из статьи
Сообщение25.12.2010, 01:24 
Заслуженный участник
Аватара пользователя


03/02/10
1928
Neytrall в сообщении #391186 писал(а):
Перевести то я и сам перевёл. Я хочу понять, что это.

серия испытаний $j=1,\ldots$ (в данном контексте $j$-е испытание это наблюдение за $j$-ой популяцией) в каждом из которых делаются измерения $i=1,\ldots$ (наверное, $i$ -- номер особи) случайной величины $Z$

получается $Z_{ij}$

и что Вас смущает, что среднее равно нулю? Вы же не знаете какую случайную величину измеряют... может, отклонение от нормы:))

 Профиль  
                  
 
 Re: помогите понять отрывок из статьи
Сообщение25.12.2010, 02:14 
Аватара пользователя


15/11/08
502
London, ON
paha в сообщении #391203 писал(а):
серия испытаний $j=1,\ldots$ (в данном контексте $j$-е испытание это наблюдение за $j$-ой популяцией) в каждом из которых делаются измерения $i=1,\ldots$ (наверное, $i$ -- номер особи) случайной величины $Z$


Я тоже так думал.
К примеру: $i$ -это определённая школа, $j$ - предметы, а $Z_{ij}$- средний балл. Но всё таки я не уверен, что это так.

Меня смутило то, что это утверждение было основано на на следующем равенстве:
$P(Y=e|X=i)=P(Y=e|X=k)+(\epsilon_i-\epsilon_k)(\delta_e-\delta_{e-1})$
где $\epsilon$ это оценка для каждой строчки в таблице, а $\delta$ вроде бы оценка для каждого столбца.
Я не понимаю как из этого следует, что $\bar Z=0$
Как они вообще связаны.


Каждую таблицу можно записать в виде $P_{ij}=P_{i.}P_{.j}(1+\rho\epsilon_i\delta_j)$
Кумулятивная функция распределения:$\gamma_i(e)=\sum\limits_{j=1}^e\frac{P_{ij}}{P_{i.}}$
Стохастическая разница между двумя строками: $\gamma_i(e)-\gamma_k(e)=(\epsilon_k-\epsilon_i)\sum\limits_{j=1}^e\rho P_{.j}\delta_j$

В общем я запутался... :shock:

 Профиль  
                  
 
 Re: помогите понять отрывок из статьи
Сообщение25.12.2010, 02:21 
Заслуженный участник
Аватара пользователя


03/02/10
1928
Neytrall в сообщении #391218 писал(а):
это утверждение

какое?

Neytrall в сообщении #391218 писал(а):
Меня смутило то, что это утверждение было основано на на следующем равенстве:
$P(Y=e|X=i)=P(Y=e|X=k)+(\epsilon_i-\epsilon_k)(\delta_e-\delta_{e-1})$
где $\epsilon$ это оценка для каждой строчки в таблице, а $\delta$ вроде бы оценка для каждого столбца.
Я не понимаю как из этого следует, что $\bar Z=0$

и я не понимаю: говорите про $X$ и $Y$, а вывод -- про $Z$

 Профиль  
                  
 
 Re: помогите понять отрывок из статьи
Сообщение25.12.2010, 02:35 
Аватара пользователя


15/11/08
502
London, ON
paha
Это не я...это статья так неуклюже написана.
$X$-категориальная переменная строчек $Y$-категориальная переменная столбцов.

В статье написано, что из $P(Y=e|X=i)=P(Y=e|X=k)+(\epsilon_i-\epsilon_k)(\delta_e-\delta_{e-1})$
следует что $\bar Z=0$.

 Профиль  
                  
 
 Re: помогите понять отрывок из статьи
Сообщение31.12.2010, 18:35 
Аватара пользователя


15/11/08
502
London, ON
Кстати, оценки столбцов и линий соблюдают:

$\sum\limits_{i}p_{i.}\epsilon_i^a=\sum\limits_{j}p_{j.}\delta_j^a=a-1 , \forall a=1,2$
То есть первый момент равен нулю, а второй единице...
Может быть $Z_{ij}$ как то связан с оценками?

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 10 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group