Добрый вечер!
Такое задание:
Доказать, что `A=(sum_(i = 1)^(n)((x_i - bar(x))*y_i))/(sum_(i = 1)^n(x_i - bar(x))^2)` имеет асимптотически нормальное распределение.
Причем
`E(y_i) = 0` (1)
`var(y_i) = sigma^2` (2)
`E(y_i,y_j) = 0` при `i != j` (3)
Распределение `y_i` не зависит от `x_1^(j), ldots, x_n^(j)` для всех `j = 1, ldots, k` (4)
Также про `x` известно, что их значения извлечены случайным образом из некоторой генеральной совокупности и что они линейно независимы.
Думаю свести данное выражение к центральной предельной теореме. Но возникает вопросы:
Следует ли из условий (1) и (2), что случайные величины `y_i` одинаково распределены?
Следует ли из того, что `x_i` извлечены из одной генеральной совокупности, что они одинаково распределены?
Нужно ли преобразовывать выражение?
Заранее спасибо за помощь)
Такое задание:
Доказать, что `A=(sum_(i = 1)^(n)((x_i - bar(x))*y_i))/(sum_(i = 1)^n(x_i - bar(x))^2)` имеет асимптотически нормальное распределение.
Причем
`E(y_i) = 0` (1)
`var(y_i) = sigma^2` (2)
`E(y_i,y_j) = 0` при `i != j` (3)
Распределение `y_i` не зависит от `x_1^(j), ldots, x_n^(j)` для всех `j = 1, ldots, k` (4)
Также про `x` известно, что их значения извлечены случайным образом из некоторой генеральной совокупности и что они линейно независимы.
Думаю свести данное выражение к центральной предельной теореме. Но возникает вопросы:
Следует ли из условий (1) и (2), что случайные величины `y_i` одинаково распределены?
Следует ли из того, что `x_i` извлечены из одной генеральной совокупности, что они одинаково распределены?
Нужно ли преобразовывать выражение?
Заранее спасибо за помощь)
Следует ли из условий (1) и (2), что случайные величины y_i одинаково распределены? - а что?... Вы не можете себе представить СВ с одинаковыми `MX` и `DX` из разных классов распределений?...
Вы не можете себе представить СВ с одинаковыми `MX` и `DX` из разных классов распределений? - да Вы правы, могу
видимо Вы не поставили скобки у числителя и знаменателя при записи выражения `A`...
и непонятно, что такое `I` в записях типа `j=1,Idots,k`... может имелось ввиду `ldots`?...
Также про `x` известно, что их значения извлечены случайным образом из некоторой генеральной совокупности и что они линейно независимы.
Я так понял, что иксы - это числа... тогда причём тут линейная независимость?...
.. от `x_1^(j),Idots,x_n^(j)` для всех `j=1,Idots,k` (4)
Здесь `j` - это степень?...
Во-первых, данное Вам выражение `A` по структуре напоминает коэффициент регрессии ... можно поискать результаты для его распределения...
Во-вторых, Думаю свести данное выражение к центральной предельной теореме. - если мне не изменяет память, то в ЦПТ одинаковая распределённость не обязательна... нужна независимость...
И существование абсолютного центрального момента третьего порядка... плюс некоторое предельное условие на эти моменты, указывающее на отсутствие "выбросов" в серии СВ...
Вот про третьи моменты у Вас ничего не сказано в условии...
Здесь `j` - это степень? - нет, это просто индекс
напоминает коэффициент регрессии - да, это и есть он
можно поискать результаты для его распределения - а что Вы под этим имели в виду, не очень поняла...
в ЦПТ одинаковая распределённость не обязательна - но если она не обязательна, то обязательно существование абсолютного центрального момента третьего порядка? Я правильно поняла? Просто из формулировки ЦПТ, которую я читала, следует именно, что одинаковая распределенность обязательна
`x` это значения в разных наблюдениях, то есть вроде вектор получается - я так понял, что это некоторые выборочные данные, коль скоро говорится о генеральной совокупности...
В общих рассуждениях выборку рассматривают как набор (обычно) независимых СВ ... и раз из одной совокупности, то одинаково распределённых...
Но что значит "линейная независимость" в данном случае я так и не понял...
но если она не обязательна, то обязательно существование абсолютного центрального момента третьего порядка?
Существование третьего центрального момента обязательно в любом случае... (я сужу по учебнику Кремера, то там про это условие сказано ... )...
Просто в случае одинаковой распределённости СВ проверяют, что он меньше бесконечности... и этого достаточно для выполнения условия из общей теоремы (теоремы Ляпунова)...
Хотя в некоторых учебниках про третий момент не пишут... а вспоминают про него только в неравенстве Берри-Эсеена для оценки скорости сходимости в ЦПТ ...
а что Вы под этим имели в виду, не очень поняла...
Наверняка есть результаты по оценки значимости коэффициента регрессии... значит, должно быть исследование его распределения...
Наверняка есть результаты по оценки значимости коэффициента регрессии - нет, такого нет
Просто в случае одинаковой распределённости СВ... - то есть она всё-таки обязательна?
`z_i=alpha_1+alpha_2*x_i^(2)+...alpha_k*k_i^(k)+y_i` - это регрессия, в которой между `x_i` нет строгого линейного соотношения. Это разве не линейная независимость?
Мы, видимо, немного про разные теоремы говорим. Вы про теорему Ляпунова, я про ЦПТ.
Про абсолютные центральные моменты тоже ничего не известно
то есть она всё-таки обязательна? - нет...
Вы про теорему Ляпунова, я про ЦПТ. - ЦПТ - это набор теорем, в которых утверждается сходимость суммы СВ к нормально распределённой... Теорема Ляпунова - это одна из форм ЦПТ, причём в достаточно общего вида тыц...
Видимо в случае одинаково распределённых СВ про третий момент говорить не обязательно, хотя в оценке скорости сходимости он присутствует...
это регрессия, в которой между `x_i` нет строгого линейного соотношения. Это разве не линейная независимость?
А при чём тут, в уравнении нелинейной регрессии, линейная зависимость?... Это достаточно известный факт, что векторы, состоящие из степеней вектора `x = (x_1, ... , x_k)` линейно независимы... опирается на вычислении определителя Вандермонда... Вот только размерность вектора должна быть больше, чем максимальная степень... единственно, что все `x_i` должны быть не равны друг другу...
В общем про сущность иксов я так и не понял... Судя по формуле, просто выбрали некоторую выборку... а как тут увязано условие (4) про линейную независимость я не понимаю...
Но в уравнении регресси - давайте по порядку... значит у Вас есть уравнение регрессии, а `y` - это остатки?...
`y` - это остатки? - нет, это случайная ошибка
нет, это случайная ошибка - это тоже самое... просто кто как привык называть...
Теперь становится немного понятнее... (видимо Вам надо копаться в учебниках по эконометрике ...
Сделанные предположения являются гипотезами при построении МНК оценок для коэффициентов уравнения регрессии... только там про остатки тоже делается предположение, что остатки имеют нормальное распределение... правда у Вас про это в условиях нет...
И не совсем понятен, смысл выражения `A`... у Вас рассматривается дополнение уравнение регрессии на остатки?...
А вот имеют ли остатки одинаковое распределиние в разных наблюдениях, напрямую не сказано, но скорее всего так и есть. Только я не очень понимаю почему...
Сделанные предположения являются гипотезами при построении МНК оценок для коэффициентов уравнения регрессии -да, но рассматривается особая модель (со стохастическими регрессорами) и там в предпосылках отсутствует предположение о нормальности остатков
Я так понял, что иксы - это числа - и вот всё-таки у меня путанница, числа иксы или нет, вроде же это СВ
Теперь осознав начальную постановку опять вернусь к обозначениям...
В записи `x_i^j` у Вас верхний индекс - это номер переменной, а нижний - это номер измерения...
НО, если у Вас только нижний индекс в формуле - `x_i` - то это что?...
`x_i` - здесь i - это номер наблюдения
`x_i` - здесь i - это номер наблюдения - и как это обозначение соотносится с `x_i^j`?...
`z_i=alpha_1+alpha_2*x_i^(2)+...alpha_k*k_i^(k)+y_i`
В регрессии k переменных. Коэффициент j отвечает за номер переменной.
Также есть n выборочных значений (или наблюдений) для каждой переменой `x_j`, то есть i отвечает за номер наблюдения.
Получается, что `x_i^j` это значение j-ой перемнной в i-ом наблюдении. Что не так?
то есть i отвечает за номер наблюдения. - у какой переменной?... если сразу у всех, то это вектор... и как тогда понимать записи `sum_(i = 1)^(n) ((x_i - bar(x))*y_i)` и `(sum_(i = 1)^n(x_i - bar(x))^2)` в числителе и знаменателе условия?...
и как тогда понимать записи - суммирование по значениям иксов и остатков для разных наблюдений. А что не так?
суммирование по значениям иксов и остатков для разных наблюдений. А что не так? - то есть, `x` - это вектор... `x_i` - это наблюдение за вектором, то есть тоже вектор...
Ну, если предположить, что вектор в квадрате (в знаменателе) понимается как квадрат длины, то получается, что `A` - это тоже вектор... и Вы говорите про многомерное нормальное распределение ...
если предположить, что вектор в квадрате (в знаменателе) понимается как квадрат длины - там же его координаты по отдельности в квадрате, а не весь вектор...Или я что-то не так говорю?
Вот Вы пишите... Получается, что `x_i^j` это значение j-ой переменной в i-ом наблюдении. ... то есть у Вас, грубо говоря, записана матрица...
Уберём отсюда верхний индекс и получим `x_i` который фигурирует у Вас в условии... то есть это столбец (или строка) матрицы ...
Только в выражении `A` речь о конкретном иксе с точки зрения индекса j
В ЦПТ разве не сходимость по распределению используется? - да, по распределению... (так называемая - слабая сходимость) ...
Ушёл думать...