Регрессионный анализ - статистический метод исследования зависимости случайной величины от переменных. По характеру связи между переменными регрессии в целом подразделяют на две группы


1)                             Что такое стохастическая связь? - Программа дисциплины "эконометрика"

Подобный материал:
  • Учебная программа название дисциплины Эконометрика для специальности (ей)/ специализации, 231.63kb.
  • Примерная программа наименование дисциплины Эконометрика Рекомендуется для направления, 196.23kb.
  • Программа дисциплины Эконометрика Для направления 080102. 65 Мировая экономика подготовки, 121.81kb.
  • Рабочей программы учебной дисциплины эконометрика уровень основной образовательной, 43.19kb.
  • Программа дисциплины ен. Р "Эконометрика" для студентов, 118.01kb.
  • Программа дисциплины дс. 10."Эконометрика" для студентов, 116.69kb.
  • Рабочая программа наименование дисциплины Эконометрика, 234.87kb.
  • Рабочая программа наименование дисциплины Эконометрика, 258.24kb.
  • Программа дисциплины дн. Ф "Эконометрика" для студентов 4 курса направления 080100, 150.65kb.
  • Программа и контрольные задания по учебной дисциплине «эконометрика» для студентов, 555.04kb.

1)                             Что такое стохастическая связь?

а) нелинейная зависимость между переменными

б) связь между одним случайным и одним детерминированным фактором

в) связь между переменными, осложненная влиянием случайных факторов

г) ни один из вариантов а)-в)

 

2)                             Ковариация – это…

а) показатель, позволяющий установить факт наличия линейной стохастической связи между переменными

б) явление линейной стохастической связи между переменными

в) показатель, характеризующий тесноту линейной стохастической связи между переменными

г) среди вариантов а)-в) нет верного

 

3)                             Корреляция – это…

а) показатель, позволяющий установить факт наличия линейной стохастической связи между переменными

б) явление линейной стохастической связи между переменными

в) показатель, характеризующий тесноту линейной стохастической связи между переменными

г) среди вариантов а)-в) нет верного

 

4)                             Коэффициент корреляции – это…

а) показатель, позволяющий установить факт наличия линейной стохастической связи между переменными

б) явление линейной стохастической связи между переменными

в) показатель, характеризующий тесноту линейной стохастической связи между переменными

г) среди вариантов а)-в) нет верного

 

5)                             Среди перечисленных ниже пар синонимами являются…

а) стохастическая связь и функциональная связь

б) стохастическая связь и корреляционная связь

в) корреляция  и ковариация

г) корреляция и коэффициент корреляции

 

6)                             Функция регрессии является…

а) математическим выражением функциональной зависимости между переменными

б) математическим выражением корреляционной связи между переменными

в) математическим выражением исключительно линейной связи между переменными

г) среди вариантов а)-в) нет верного

 

7)                             По числу объясняющих факторов регрессии подразделяют на…

а) простые и сложные

б) простые и множественные

в) двойные, тройные и т.д.

г) среди вариантов а)-в) нет верного

 

8)                              По характеру связи между переменными регрессии в целом подразделяют на две группы:

а) положительные и отрицательные

б) равноускоренные и равнозамедленные

в) равномерно возрастающие и равномерно убывающие

г) среди вариантов а)-в) нет верного

 

9)                             Отрицательный характер взаимосвязи между переменными Х и У означает, что…

а) с ростом Х происходит рост У

б) с ростом Х происходит убывание У

в) рост Х  не оказывает влияния на изменение У

г) среди вариантов а)-в) нет верного

 

10)                         По типу соединения явлений регрессии подразделяют на…

а) последовательные и параллельные

б) открытые и закрытые

в) прямые, косвенные и ложные

г) среди вариантов а)-в) нет верного

 

11)                         Какие требования предъявляются к случайному члену классической линейной модели множественной регрессии?

а) он должен быть распределен по экспоненциальному закону

б) он должен быть распределен по закону Пуассона

в) он должен быть распределен по биномиальному закону

г) среди вариантов а)-в) нет верного

 

12)                          Гомоскедастичность…

а) означает постоянство дисперсии случайного члена регрессионного уравнения

б) означает отсутствие автокорреляции случайного члена регрессионного уравнения

в) предполагает отсутствие корреляционной связи между случайным членом и объясняющими переменными регрессионной модели

г) среди вариантов а)-в) нет верного

 

13)                          Одним из условий классической линейной регрессионной модели является…

а)  нормальное распределение переменной У

б) отсутствие среди объясняющих факторов дискретных переменных

в) отсутствие автокорреляции случайного члена регрессионного уравнения

г) среди вариантов а)-в) нет верного

 

14)                         Каким свойством обладают оценки коэффициентов классической модели, полученные с помощью метода наименьших квадратов?

а) эффективности

б) состоятельности

в) несмещенности

г) все ответы а)-в) верны

 

15)                         Как формулируется нулевая гипотеза при проверке коэффициента уравнения регрессии на статистическую значимость?

а) оценка коэффициента равна нулю

б)  оценка коэффициента положительна

в) оценка коэффициента отрицательна

г) среди вариантов а)-в) нет верного

 

16)                         Какая формулировка нулевой гипотезы не используется при проверке уравнения регрессии на статистическую значимость?

а) коэффициент детерминации в полученном уравнении равен нулю

б)  все коэффициенты при объясняющих переменных равны нулю

в) свободный член полученного уравнения равен нулю

г) среди вариантов а)-в) нет верного

 

17)                          Какой факт не свидетельствует о наличии мультиколлинеарности?

а) коэффициенты парной корреляции результирующего признака с каждым из объясняющих по модулю близки к единице

б) некоторые коэффициенты парной корреляции среди объясняющих факторов по модулю близки к единице

в) коэффициенты множественной детерминации некоторых объясняющих факторов с остальными близки к единице

г) среди вариантов а)-в) нет верного

 

18)                         О чем может свидетельствовать неверный, с точки зрения экономической теории, знак коэффициента линейного регрессионного уравнения?

а) о гетероскедастичности

б)  об автокорреляции остатков

в) о мультиколлинеарности

г) среди вариантов а)-в) нет верного

 

19)                         В каком случае целесообразно использовать метод главных компонент?

а) если метод наименьших квадратов дает статистически незначимое уравнение

б) если объясняющие факторы коррелируют между собой

в) если свободный член полученного уравнения равен нулю

г) среди вариантов а)-в) нет верного

 

20)                          Что является недостатком метода главных компонент?

а) полученную модель нельзя использовать для прогнозирования

б)  невозможна или затруднена экономическая интерпретация полученных результатов

в) снижается размерность исходной задачи

г) среди вариантов а)-в) нет верного

 

21)                         В каких задачах следует ожидать наличия гетероскедастичности?

а)  когда анализируются определенные статьи расходов хозяйствующих субъектов в зависимости от величины их доходов и последние имеют значительный разброс

б)  когда в выборке присутствуют наблюдения, сильно отличающиеся от большинства остальных

в) когда анализируются временные ряды и наблюденные значения существенно изменяются со временем или  данные пространственных выборок определенным образом упорядочены

г) все варианты а)-в) верны

 

22)                         Какой способ не применяется для проверки эконометрической модели на гомоскедастичность?

а) тест Голдфелда-Квандта

б)  тест Дарбина-Уотсона

в) тест Глейзера

г) среди вариантов а)-в) нет верного

 

23)                         Каковы негативные последствия применения классического МНК в случае гетероскедастичности?

а) оценки коэффициентов модели не являются состоятельными

б) оценки коэффициентов модели не являются статистически значимыми

в) оценки коэффициентов модели не являются эффективными

г) оценки коэффициентов модели являются смещенными

 

24)                         Какой метод оценивания следует использовать в условиях гетероскедастичности?

а) метод моментов

б) метод максимального правдоподобия

в) взвешенный метод наименьших квадратов

г) среди вариантов а)-в) нет верного

 

25)                         Взвешенный метод наименьших квадратов предполагает…

а) упорядочение исходных наблюдений по возрастанию/убыванию

б) упорядочение исходных наблюдений по времени

в) придание «веса»  каждому наблюдению в определенном соответствии с величиной его дисперсии

г) среди вариантов а)-в) нет верного

 

26)                         В каких задачах следует ожидать автокорреляции остатков?

а)  когда рассматривается изменение экономического климата в государстве

б)  когда анализируются объемы продаж «сезонного» товара

в) когда исходными данными являются временные ряды

г) все варианты а)-в) верны

 

27)                         Что из перечисленного ниже не является особенностью теста Дарбина-Уотсона?

а) наличие областей неопределенности

б) область значений, ограниченная отрезком от 0 до 4

в) границы критических областей, симметричные относительно 2

г) среди вариантов а)-в) нет верного

 

28)                         Каким способом нельзя оценить тесноту автокорреляции остатков?

а) через приближенное соотношение коэффициента автокорреляции с расчетным значением статистики Дарбина-Уотсона

б) с помошью непосредственного расчета коэффициента корреляции

в) как коэффициент регрессии остатков на их предыдущие значения

г) среди вариантов а)-в) нет верного

 

29)                         Каким образом можно проверить гипотезу о переменной структуре модели?

а) с помощью теста Голдфелда-Квандта

б) с помощью теста Вальда

в) с помощью теста Чоу

г) среди вариантов а)-в) нет верного

 

30)                         Как поступают в случае, если качественная переменная, влияющая на структуру модели, ненаблюдаема?

а) объявляют задачу разбиения выборки на однородные группы  в принципе неразрешимой

б) применяют специальные методы многомерного анализа, в частности, кластерный анализ

в) используют взвешенный метод наименьших квадратов

г) среди вариантов а)-в) нет верного

 

31)                         Для отражения влияния на структуру модели качественных переменных, если они наблюдаемы, применяют…

а) фальшивые переменные

б) фиктивные переменные

в) поддельные переменные

г) среди вариантов а)-в) нет верного

 

32)                         Какая из приведенных ниже моделей не поддается непосредственной линеаризации?

а) y=α+βxγ

б) y=α+β/x

в) y=αx β

г) среди вариантов а)-в) нет верного

 

33)                         Что из перечисленного ниже не применяют для оценки нелинеаризуемых моделей?

а) итеративные процедуры

б) метод наименьших квадратов

в) метод максимального правдоподобия

г) среди вариантов а)-в) нет верного

 

34)                         При использовании метода максимального правдоподобия…

а) отыскиваются параметры модели, наиболее вероятные для данного набора наблюдений

б) отыскивается набор наблюдений, оптимизирующий параметры модели

в) параметры модели определяются методом Гаусса

г) среди вариантов а)-в) нет верного

 

35)                         Стационарность – это…

а) характеристика временного ряда, связанная с его стабильностью (устойчивостью)

б) правило отбора предикторов в регрессионную модель

в) синоним автокорреляции

г) среди вариантов а)-в) нет верного

 

36)                         Какие существуют виды стационарности?

а) строгая и слабая

б) высокая и низкая

в) постоянная и переменная

г) все варианты а)-в)  верны

 

37)                         Что такое «белый шум»?

а) свойство коэффициентов регрессионной модели

б) модель временного ряда с независимыми одинаково распределенными наблюдениями

в) модель авторегрессии первого порядка

г) среди вариантов а)-в) нет верного

 

38)                         Какие модели временных рядов чаще всего используются на практике?

а) модель авторегрессии первого порядка

б) «белый шум»

в) «случайное блуждание»

г) все варианты а)-в)  верны

 

39)                         Какие экономические процессы целесообразно моделировать с помощью системы одновременных линейных уравнений?

а)  формирование доходов в закрытой экономике без государственного участия (взаимосвязи между валовым выпуском, объемом потребления и инвестиций)

б) спрос и предложение в зависимости от цены товара и дохода

в) взаимосвязь между объемами потребления и  инвестиций, заработной платой и  доходами в частном секторе, равновесным совокупным спросом и  объемом капитала

г) все варианты а)-в)  верны

 

40)                         Почему для оценки параметров системы линейных одновременных уравнений нельзя применять одношаговый МНК?

а) из-за смещения получаемых оценок

б) из-за несостоятельности получаемых оценок

в) из-за некорректности проводимых статистических тестов

г) все варианты а)-в)  верны

 

41)                         Какие методы не применяются для оценки параметров системы линейных одновременных уравнений?

а) косвенный метод наименьших квадратов

б) двухшаговый метод наименьших квадратов

в) трехшаговый метод наименьших квадратов

г) среди вариантов а)-в) нет верного

 

(Ответы на вопросы теста для текущего контроля знаний приведены в конце программы)

 

III

Примерный перечень вопросов к  экзамену.

1)      Что такое случайный член регрессионного уравнения? Приведите пример его экономической интерпретации.

2)      Как экономически трактуются параметры классической линейной модели множественной регрессии?

3)      Перечислите предпосылки классического уравнения регрессии.

4)      Что такое “несмещенная оценка коэффициента уравнения регрессии”?

5)      Что такое “эффективная  оценка коэффициента уравнения регрессии”?

6)      Что такое “состоятельная оценка коэффициента уравнения регрессии”?

7)      По каким критериям производится отбор предикторов для регрессионной модели?

8)      Какие способы отбора предикторов вы знаете?

9)      В чем суть метода наименьших квадратов и каковы свойства МНК-оценок?

10)  В чем состоит суть метода максимального правдоподобия и каковы свойства ММП-оценок?

11)  Что такое “статистически значимый коэффициент уравнения регрессии”?

12)  Как проверить статистическую значимость регрессионного уравнения?

13)  Что такое коэффициент детерминации и каков его смысл?

14)  Как проверить статистическую значимость коэффициента детерминации?

15)  Как применять коэффициент детерминации для сравнительной оценки уравнений с одинаковой зависимой переменной и разным количеством предикторов?

16)  Как выбрать лучшее из нескольких уравнений с одной и той же зависимой переменной?

17)  Как оценить предельный вклад, вносимый в объясняющую способность регрессионного уравнения группой дополнительных объясняющих факторов?

18)  Приведите примеры гипотез, часто формулируемых в отношении коэффициентов регрессионного уравнения, и объясните, с помощью каких тестов их можно проверить.

19)  Каковы признаки «хорошей» (правильно специфицированной) модели?

20)  Как влияет на качество оценки коэффициентов уравнения ошибка спецификации, вследствие которой в модель не был включен существенный предиктор?

21)  Чем опасно включение в модель «лишних» (несущественных) объясняющих переменных?

22)  Что такое гомоскедастичность и гетероскедастичность?

23)  Приведите пример взаимоотношений в экономике, описываемых моделью с гетероскедастичными остатками.

24)  Как осуществляется проверка эконометрической модели на гомоскедастичность?

25)  Почему нельзя  применять классический МНК в случае гетероскедастичности?

26)  Какие преобразования исходных данных нужно провести в случае обнаружения гетероскедастичности?

27)  Как вы понимаете термин «автокорреляция остатков»?

28)  Приведите пример взаимоотношений в экономике, описываемых моделью с автокоррелированными остатками.

29)  Каковы последствия применения классического МНК к модели с автокоррелированными остатками?

30)  Каким образом осуществляется проверка эконометрической модели на автокорреляцию остатков?

31)  Какие преобразования исходных данных нужно провести в случае обнаружения автокорреляции остатков?

32)  Что такое мультиколлинеарность?

33)  Как можно предсказать наличие мультиколлинеарности в будущей модели?

34)  По каким проявлениям можно судить о наличии мультиколлинеарности в оцененной модели?

35)  Каковы негативные последствия мультиколлинеарности?

36)  В каком случае целесообразно использовать метод главных компонент?

37)  Что представляют собой главные компоненты?

38)  Что показывает первая главная компонента?

39)  Что представляют собой коэффициенты при факторах в выражениях главных компонент?

40)  Каковы недостатки метода главных компонент?

41)  Какие модели с лаговыми независимыми переменными Вы знаете?

42)  Какие методы применяются для оценки коэффициентов эконометрических моделей, содержащих лаговые зависимые переменные?

43)  Какие характеристики временных рядов вы знаете?

44)  Что такое стационарный процесс?

45)  Как проверить процесс на стационарность?

46)  Перечислите известные вам модели временных рядов и приведите примеры процессов в экономике, описываемых с помощью моделей временных рядов.

47)  Модель авторегрессии первого порядка.

48)  Модель скользящего среднего.

49)  Модель авторегрессии–скользящего среднего.

50)  Уравнение Юла-Уокера.

51)  Что является объектом изучения финансовой эконометрики?

52)  Каковы особенности временных рядов финансовых показателей?

53)  Что означают гипотезы случайного блуждания и каковы методы их тестирования?

54)  Каковы методы оценки параметров Броуновского движения, применяемые в финансовой эконометрике?

55)  Каковы методы тестирования изменяющейся вариации в моделях финансовых процессов?

56)  Какие методы применяются для тестирования нелинейных финансовых поцессов?

57)  Как оценивают модели финансовых процессов с изменяющейся вариацией?

58)  Какие модели временных рядов финансовых показателей с нелинейными структурами Вам известны?

59)  Что собой представляет система взаимозависимых эконометрических уравнений?

60)  Приведите пример экономической системы, описываемой системой одновременных линейных уравнений.

61)  Почему для оценки параметров системы линейных одновременных уравнений нельзя применять одношаговый МНК?

62)  Что показывают коэффициенты структурной и прогнозной формы системы линейных одновременных уравнений?

63)  Какие ограничения накладывают на структурные переменные в системе взаимозависимых эконометрических уравнений?

64)  Какие бывают ограничения на дисперсии и ковариации в рамках системы взаимозависимых эконометрических уравнений?

65)  Что представляет собой рекурсивная модель?

66)  Каким образом можно проверить гипотезу о переменной структуре модели?

67)  Как отражают влияние качественных переменных на структуру эконометрической модели?

68)  Приведите пример качественной переменной, способной повлиять на структуру какой-либо эконометрической модели. Какие фиктивные переменные могут отразить это влияние?

69)  Какие проблемы возникают при построении моделей с дискретными зависимыми переменными?

70)  Приведите примеры взаимосвязей в экономике, для описания которых используют модели с качественными зависимыми признаками, и объясните, с помощью каких переменных удается формализовать эти взаимосвязи.

71)  Какие модели чаще всего используют в случае, когда зависимая переменная является дихотомической?

72)  В чем особенности применения и построения Tobit-модели?

73)  Приведите примеры нелинейных моделей, используемых в эконометрике.

74)  Какие из известных вам типов нелинейных моделей поддаются непосредственной линеаризации и в чем причина их нелинеаризуемости?

75)  Как линеаризуются модели гиперболического вида?

76)  Как линеаризуются модели экспоненциального вида?

77)  Как линеаризуются модели степенного вида?

78)  Как линеаризуются модели логарифмического вида?

79)  Какие методы используются для оценки параметров моделей, не поддающихся непосредственной линеаризации?

80)  В чем заключается процедура прогнозирования с использованием эконометрических моделей?

81)  Какие методы верификации прогноза Вы знаете?

82)  Как оценить точность прогноза?

83)  Как оценивают доверительный интервал прогноза в моделях с детерминированнными параметрами?

84)  Как оценивают доверительный интервал прогноза в моделях со стохастическими параметрами?

 

V Тесты для проверки остаточных знаний

(требуется выбрать правильный ответ среди 5 предложенных вариантов)

 

1. Показатель, характеризующий тесноту линейной стохастической связи между переменными - это…

а) ковариация

б) коэффициент корреляции

в) дисперсия

г) все варианты а)-в) верны

д) среди вариантов а)-г) нет верного

 

2. Функция регрессии в общем случае является…

а) математическим выражением функциональной зависимости между переменными

б) математическим выражением корреляционной связи между переменными

в) математическим выражением исключительно линейной связи между переменными

г) математическим выражением любого рода зависимости между переменными

д) среди вариантов а)-г) нет верного

 

3. Уравнение регрессии вида  Y(t)=α+βX(t)+ε(t) не означает, что…

а) переменные Y и X связаны между собой линейно

б) связь между Y и X является стохастической

в) на переменную  Y не оказывают влияния никакие факторы, кроме X

г) с ростом переменной  X на одну единицу Y увеличивается на β единиц

д) среди вариантов а)-г) нет верного

 

4. Гомоскедастичность…

а) означает постоянство дисперсии случайного члена регрессионного уравнения

б) предполагает отсутствие корреляционной связи между случайным членом и объясняющими переменными регрессионной модели

в) является одним из условий классической модели линейной регрессии

г) верны варианты а) и  в)

д) верны варианты б) и в)

 

5. Одним из условий классической линейной регрессионной модели является…

а) отсутствие какого-либо влияния на Y со стороны факторов, не включенных в модель явно

б) отсутствие среди объясняющих факторов дискретных переменных

в) отсутствие автокорреляции случайного члена

г) верны варианты а) и б)

д) среди вариантов а)-г) нет верного

 

6.      Каким свойством обладают оценки коэффициентов классической модели, полученные с помощью метода наименьших квадратов?

а) эффективности

б) состоятельности

в) несмещенности

г) все ответы а)-в) верны

д) среди вариантов а)-г) нет верного

 

7. Как формулируется нулевая гипотеза при проверке коэффициента уравнения регрессии на статистическую значимость?

а) оценка коэффициента равна нулю

б) оценка коэффициента положительна

в) оценка коэффициента отрицательна

г) дисперсия оценки коэффициента минимальна

д) среди вариантов а)-г) нет верного

 

8.      Какая формулировка нулевой гипотезы не используется при проверке уравнения регрессии на статистическую значимость?

а) коэффициент детерминации в полученном уравнении равен нулю

б) все коэффициенты при объясняющих переменных равны нулю

в) свободный член полученного уравнения равен нулю

г) все варианты а)-в) верны

г) среди вариантов а)-г) нет верного

 

9.       Какой факт не может свидетельствовать о наличии мультиколлинеарности?

а) коэффициенты парной корреляции результирующего признака с каждым из объясняющих факторов по модулю близки к единице

б) некоторые коэффициенты парной корреляции среди объясняющих факторов по модулю близки к единице

в) коэффициенты множественной детерминации некоторых объясняющих факторов с остальными близки к единице

г) неверный, с точки зрения экономической теории, знак коэффициента линейного регрессионного уравнения

д) среди вариантов а)-г) нет верного

 

10.  В каком случае целесообразно использовать метод главных компонент?

а) если метод наименьших квадратов дает статистически незначимое уравнение

б) если объясняющие факторы коррелируют между собой

в) если свободный член полученного уравнения равен нулю

г) есди колическтво наблюдений недостаточно велико по сравнению с числом объясняющих факторов

д) среди вариантов а)-г) нет верного

 

11.  Взвешенный метод наименьших квадратов…

а) применяется в случае гетероскедастичных остатков

б) предполагает упорядочение исходных наблюдений по возрастанию/убыванию

в) предполагает придание «веса»  каждому наблюдению в определенном соответствии с величиной его дисперсии

г) верны варианты а) и в)

д) среди вариантов а)-г) нет верного

 

12.  Каковы негативные последствия применения классического метода наименьших квадратов в случае гетероскедастичности?

а) оценки коэффициентов модели не являются состоятельными

б) оценки коэффициентов модели не являются статистически значимыми

в) оценки коэффициентов модели не являются эффективными

г) оценки коэффициентов модели являются смещенными

д) все варианты а)-г) верны

 

13.  В каких задачах следует ожидать наличия гетероскедастичности?

а)  когда анализируются определенные статьи расходов хозяйствующих субъектов в зависимости от величины их доходов и последние имеют значительный разброс

б)  когда в выборке присутствуют наблюдения, сильно отличающиеся от большинства остальных

в) когда анализируются временные ряды и наблюденные значения существенно изменяются со временем или  данные пространственных выборок определенным образом упорядочены

г) все варианты а)–в) верны

д) среди вариантов а)-г) нет верного

 

14.  Об автокорреляции остатков можно сказать, что…

а)  факт ее существования устанавливается с помощью критерия Дарбина-Уотсона

б) она часто встречается в задачах, где исходными данными являются временные ряды

в) ее следствием, в частности, является неэффективность оценок параметров регрессионного уравнения

г) в случае ее существования следует применять обобщенный метод наименьших квадратов

д) все варианты а)-г) верны

 

15.  Для отражения влияния на структуру модели качественных переменных, если они наблюдаемы, применяют…

а) фальшивые переменные

б) фиктивные переменные

в) поддельные переменные

г) искусственные переменные

д) среди вариантов а)-г) нет верного

 

16.  Какая из приведенных ниже моделей не поддается непосредственной линеаризации?

а) y=α+βxγ

б) y=α+β/x

в) y=αx β

г) y=α+βlnx

д) среди вариантов а)-в) нет верного

 

17.  Что из перечисленного ниже не применяют для оценки параметров нелинеаризуемых моделей?

а) итеративные процедуры

б) метод наименьших квадратов

в) метод максимального правдоподобия

г) верны варианты б) и в)

д) среди вариантов а)-г) нет верного

 

18.  При использовании метода максимального правдоподобия…

а) отыскиваются параметры модели, наиболее вероятные для данного набора наблюдений

б) отыскивается набор наблюдений, оптимизирующий параметры модели

в) оценивается вероятность, с которой набор параметров модели принимает оптимальные значения

г) верны варианты а) и в)

д) среди вариантов а)-г) нет верного

 

19.  Стационарность – это…

а) свойство оценок параметров регрессионного уравнения

б) правило отбора предикторов в регрессионную модель

в) характеристика временного ряда, связанная с его стабильностью (устойчивостью)

г) синоним автокорреляции

д) среди вариантов а)-г) нет верного

 

20.  Какие существуют виды стационарности?

а) строгая и слабая

б) высокая и низкая

в) постоянная и переменная

г) внешняя и внутренняя

д) все варианты а)-г)  верны

 

21.  Что такое «белый шум»?

а) отклонение наблюдаемых значений переменной от расчетных

б) модель временного ряда с независимыми одинаково распределенными наблюдениями

в) модель авторегрессии первого порядка

г) характеристика оценок параметров регрессионного уравнения

д) среди вариантов а)-в) нет верного

 

22.  Какие модели временных рядов чаще всего используются на практике?

а) модель авторегрессии первого порядка

б) «белый шум»

в) «случайное блуждание»

г) все варианты а)-в)  верны

д) среди вариантов а)-в) нет верного

 

23.  Среди переменных в системах одновременных линейных уравнений специально выделяют…

а) результирующие и объясняющие

б) случайные и детерминированные

в) эндогенные и экзогенные

г) фиктивные и обычные

г) все варианты а)-в)  верны

 

24.  Почему для оценки параметров системы линейных одновременных уравнений нельзя применять одношаговый МНК?

а) из-за смещения получаемых оценок

б) из-за несостоятельности получаемых оценок

в) из-за некорректности проводимых статистических тестов

г) все варианты а)-в)  верны

д) среди вариантов а)-г) нет верного

 

25.  Какие методы не применяются для оценки параметров системы линейных одновременных уравнений?

а) косвенный метод наименьших квадратов

б) двухшаговый метод наименьших квадратов

в) трехшаговый метод наименьших квадратов

г) не применяется ни один из методов а)-в)

д) среди вариантов а)-г) нет верного

 

 

YI Учебно-методическое обеспечение курса

 

1. Рекомендуемая литература (основная)

1.    Айвазян С. А., Мхитарян В. С. Прикладная статистика и основы эконометрики: Учебник для вузов. М.: ЮНИТИ, 1998.

2.    Доугерти К. Введение в эконометрику: Учебник для вузов. М.:Инфра - М, 1999.

3.    Магнус Я. Р. Эконометрика: Начальный курс: Учебное пособие для вузов. М.: Дело, 1998.

4.    Кремер Н.Ш., Путко Б.А. Эконометрика: Учебник для вузов. М.:ЮНИТИ-ДАНА, 2002.

5.    Бородич С.А. Эконометрика: Учебное пособие. Мн.: Новое знание, 2001.

6.    Эконометрика: Учебник/Под ред. И.И. Елисеевой. – М.: Финансы и статистика, 2002.

7.    Сборник задач по дисциплине «Эконометрика» /Сост. Н.П.Тихомиров, Е.Ю.Дорохина, Л.Ф.Преснякова. – М.: Изд-во Рос.экон.акад. (в печати).

 

2. Рекомендуемая литература (дополнительная)

1.      Грубер Й. Эконометрия 1: Введение во множественную регрессию и эконометрию. Б.м.: Б.и., 1993. Ч.1, 2, 3.

2.      Джонстон Дж. Эконометрические методы. М.: Статистика, 1980.

3.      Дрейпер Н., Смит Г. Прикладной регрессионный анализ: В 2 кн. М.: Финансы и статистика,1987-1988.

4.      Тихомиров Н. П., Попов В. А. Методы социально-экономического прогнозирования. М.: Изд-во ВЗПИ, 1993.

 

3. Полезные web-сайты

ссылка скрыта       ссылка скрыта        ссылка скрыта

 

4. Перечень обучающих, контролирующих компьютерных программ.

Электронная таблица Excel, пакеты Econometric Views, Statgraphics, программы Regre,Trend.

geum.ru

Регрессионный анализ - статистический метод исследования зависимости случайной величины от переменных :: BusinessMan.ru

В статистическом моделировании регрессионный анализ представляет собой исследования, применяемые с целью оценки взаимосвязи между переменными. Этот математический метод включает в себя множество других методов для моделирования и анализа нескольких переменных, когда основное внимание уделяется взаимосвязи между зависимой переменной и одной или несколькими независимыми. Говоря более конкретно, регрессионный анализ помогает понять, как меняется типичное значение зависимой переменной, если одна из независимых переменных изменяется, в то время как другие независимые переменные остаются фиксированными.

Во всех случаях целевая оценка является функцией независимых переменных и называется функцией регрессии. В регрессионном анализе также представляет интерес характеристика изменения зависимой переменной как функции регрессии, которая может быть описана с помощью распределения вероятностей.

Задачи регрессионного анализа

Данный статистический метод исследования широко используется для прогнозирования, где его использование имеет существенное преимущество, но иногда это может приводить к иллюзии или ложным отношениям, поэтому рекомендуется аккуратно его использовать в указанном вопросе, поскольку, например, корреляция не означает причинно-следственной связи.

Разработано большое число методов для проведения регрессионного анализа, такие как линейная и обычная регрессии по методу наименьших квадратов, которые являются параметрическими. Их суть в том, что функция регрессии определяется в терминах конечного числа неизвестных параметров, которые оцениваются из данных. Непараметрическая регрессия позволяет ее функции лежать в определенном наборе функций, которые могут быть бесконечномерными.

Как статистический метод исследования, регрессионный анализ на практике зависит от формы процесса генерации данных и от того, как он относится к регрессионному подходу. Так как истинная форма процесса данных, генерирующих, как правило, неизвестное число, регрессионный анализ данных часто зависит в некоторой степени от предположений об этом процессе. Эти предположения иногда проверяемы, если имеется достаточное количество доступных данных. Регрессионные модели часто бывают полезны даже тогда, когда предположения умеренно нарушены, хотя они не могут работать с максимальной эффективностью.

В более узком смысле регрессия может относиться конкретно к оценке непрерывных переменных отклика, в отличие от дискретных переменных отклика, используемых в классификации. Случай непрерывной выходной переменной также называют метрической регрессией, чтобы отличить его от связанных с этим проблем.

История

Самая ранняя форма регрессии - это всем известный метод наименьших квадратов. Он был опубликован Лежандром в 1805 году и Гауссом в 1809. Лежандр и Гаусс применили метод к задаче определения из астрономических наблюдений орбиты тел вокруг Солнца (в основном кометы, но позже и вновь открытые малые планеты). Гаусс опубликовал дальнейшее развитие теории наименьших квадратов в 1821 году, включая вариант теоремы Гаусса-Маркова.

Термин «регресс» придумал Фрэнсис Гальтон в XIX веке, чтобы описать биологическое явление. Суть была в том, что рост потомков от роста предков, как правило, регрессирует вниз к нормальному среднему. Для Гальтона регрессия имела только этот биологический смысл, но позже его работа была продолжена Удни Йолей и Карлом Пирсоном и выведена к более общему статистическому контексту. В работе Йоля и Пирсона совместное распределение переменных отклика и пояснительных считается гауссовым. Это предположение было отвергнуто Фишером в работах 1922 и 1925 годов. Фишер предположил, что условное распределение переменной отклика является гауссовым, но совместное распределение не должны быть таковым. В связи с этим предположение Фишера ближе к формулировке Гаусса 1821 года. До 1970 года иногда уходило до 24 часов, чтобы получить результат регрессионного анализа.

Методы регрессионного анализа продолжают оставаться областью активных исследований. В последние десятилетия новые методы были разработаны для надежной регрессии; регрессии с участием коррелирующих откликов; методы регрессии, вмещающие различные типы недостающих данных; непараметрической регрессии; байесовские методов регрессии; регрессии, в которых переменные прогнозирующих измеряются с ошибкой; регрессии с большей частью предикторов, чем наблюдений, а также причинно-следственных умозаключений с регрессией.

Регрессионные модели

Модели регрессионного анализа включают следующие переменные:

  • Неизвестные параметры, обозначенные как бета, которые могут представлять собой скаляр или вектор.
  • Независимые переменные, X.
  • Зависимые переменные, Y.

В различных областях науки, где осуществляется применение регрессионного анализа, используются различные термины вместо зависимых и независимых переменных, но во всех случаях регрессионная модель относит Y к функции X и β.

Приближение обычно оформляется в виде E (Y | X) = F (X, β). Для проведения регрессионного анализа должен быть определен вид функции f. Реже она основана на знаниях о взаимосвязи между Y и X, которые не полагаются на данные. Если такое знание недоступно, то выбрана гибкая или удобная форма F.

Зависимая переменная Y

Предположим теперь, что вектор неизвестных параметров β имеет длину k. Для выполнения регрессионного анализа пользователь должен предоставить информацию о зависимой переменной Y:

  • Если наблюдаются точки N данных вида (Y, X), где N < k, большинство классических подходов к регрессионному анализу не могут быть выполнены, так как система уравнений, определяющих модель регрессии в качестве недоопределенной, не имеет достаточного количества данных, чтобы восстановить β.
  • Если наблюдаются ровно N = K, а функция F является линейной, то уравнение Y = F (X, β) можно решить точно, а не приблизительно. Это сводится к решению набора N-уравнений с N-неизвестными (элементы β), который имеет единственное решение до тех пор, пока X линейно независим. Если F является нелинейным, решение может не существовать, или может существовать много решений.
  • Наиболее распространенной является ситуация, где наблюдается N > точки к данным. В этом случае имеется достаточно информации в данных, чтобы оценить уникальное значение для β, которое наилучшим образом соответствует данным, и модель регрессии, когда применение к данным можно рассматривать как переопределенную систему в β.

В последнем случае регрессионный анализ предоставляет инструменты для:

  • Поиска решения для неизвестных параметров β, которые будут, например, минимизировать расстояние между измеренным и предсказанным значением Y.
  • При определенных статистических предположениях, регрессионный анализ использует избыток информации для предоставления статистической информации о неизвестных параметрах β и предсказанные значения зависимой переменной Y.

Необходимое количество независимых измерений

Рассмотрим модель регрессии, которая имеет три неизвестных параметра: β0, β1 и β2. Предположим, что экспериментатор выполняет 10 измерений в одном и том же значении независимой переменной вектора X. В этом случае регрессионный анализ не дает уникальный набор значений. Лучшее, что можно сделать, оценить среднее значение и стандартное отклонение зависимой переменной Y. Аналогичным образом измеряя два различных значениях X, можно получить достаточно данных для регрессии с двумя неизвестными, но не для трех и более неизвестных.

Если измерения экспериментатора проводились при трех различных значениях независимой переменной вектора X, то регрессионный анализ обеспечит уникальный набор оценок для трех неизвестных параметров в β.

В случае общей линейной регрессии приведенное выше утверждение эквивалентно требованию, что матрица XТX обратима.

Статистические допущения

Когда число измерений N больше, чем число неизвестных параметров k и погрешности измерений εi, то, как правило, распространяется затем избыток информации, содержащейся в измерениях, и используется для статистических прогнозов относительно неизвестных параметров. Этот избыток информации называется степенью свободы регрессии.

Основополагающие допущения

Классические предположения для регрессионного анализа включают в себя:

  • Выборка является представителем прогнозирования логического вывода.
  • Ошибка является случайной величиной со средним значением нуля, который является условным на объясняющих переменных.
  • Независимые переменные измеряются без ошибок.
  • В качестве независимых переменных (предикторов) они линейно независимы, то есть не представляется возможным выразить любой предсказатель в виде линейной комбинации остальных.
  • Ошибки являются некоррелированными, то есть ковариационная матрица ошибок диагоналей и каждый ненулевой элемент являются дисперсией ошибки.
  • Дисперсия ошибки постоянна по наблюдениям (гомоскедастичности). Если нет, то можно использовать метод взвешенных наименьших квадратов или другие методы.

Эти достаточные условия для оценки наименьших квадратов обладают требуемыми свойствами, в частности эти предположения означают, что оценки параметров будут объективными, последовательными и эффективными, в особенности при их учете в классе линейных оценок. Важно отметить, что фактические данные редко удовлетворяют условиям. То есть метод используется, даже если предположения не верны. Вариация из предположений иногда может быть использована в качестве меры, показывающей, насколько эта модель является полезной. Многие из этих допущений могут быть смягчены в более продвинутых методах. Отчеты статистического анализа, как правило, включают в себя анализ тестов по данным выборки и методологии для полезности модели.

Кроме того, переменные в некоторых случаях ссылаются на значения, измеренные в точечных местах. Там могут быть пространственные тенденции и пространственные автокорреляции в переменных, нарушающие статистические предположения. Географическая взвешенная регрессия - единственный метод, который имеет дело с такими данными.

Линейный регрессионный анализ

В линейной регрессии особенностью является то, что зависимая переменная, которой является Yi, представляет собой линейную комбинацию параметров. Например, в простой линейной регрессии для моделирования n-точек используется одна независимая переменная, xi, и два параметра, β0 и β1.

При множественной линейной регрессии существует несколько независимых переменных или их функций.

При случайной выборке из популяции ее параметры позволяют получить образец модели линейной регрессии.

В данном аспекте популярнейшим является метод наименьших квадратов. С помощью него получают оценки параметров, которые минимизируют сумму квадратов остатков. Такого рода минимизация (что характерно именно линейной регрессии) этой функции приводит к набору нормальных уравнений и набору линейных уравнений с параметрами, которые решаются с получением оценок параметров.

При дальнейшем предположении, что ошибка популяции обычно распространяется, исследователь может использовать эти оценки стандартных ошибок для создания доверительных интервалов и проведения проверки гипотез о ее параметрах.

Нелинейный регрессионный анализ

Пример, когда функция не является линейной относительно параметров, указывает на то, что сумма квадратов должна быть сведена к минимуму с помощью итерационной процедуры. Это вносит много осложнений, которые определяют различия между линейными и нелинейными методами наименьших квадратов. Следовательно, и результаты регрессионного анализа при использовании нелинейного метода порой непредсказуемы.

Расчет мощности и объема выборки

Здесь, как правило, нет согласованных методов, касающихся числа наблюдений по сравнению с числом независимых переменных в модели. Первое правило было предложено Доброй и Хардином и выглядит как N = t^n, где N является размер выборки, n - число независимых переменных, а t есть числом наблюдений, необходимых для достижения желаемой точности, если модель имела только одну независимую переменную. Например, исследователь строит модель линейной регрессии с использованием набора данных, который содержит 1000 пациентов (N). Если исследователь решает, что необходимо пять наблюдений, чтобы точно определить прямую (м), то максимальное число независимых переменных, которые модель может поддерживать, равно 4.

Другие методы

Несмотря на то что параметры регрессионной модели, как правило, оцениваются с использованием метода наименьших квадратов, существуют и другие методы, которые используются гораздо реже. К примеру, это следующие методы:

  • Байесовские методы (например, байесовский метод линейной регрессии).
  • Процентная регрессия, использующаяся для ситуаций, когда снижение процентных ошибок считается более целесообразным.
  • Наименьшие абсолютные отклонения, что является более устойчивым в присутствии выбросов, приводящих к квантильной регрессии.
  • Непараметрическая регрессия, требующая большого количества наблюдений и вычислений.
  • Расстояние метрики обучения, которая изучается в поисках значимого расстояния метрики в заданном входном пространстве.

Программное обеспечение

Все основные статистические пакеты программного обеспечения выполняются с помощью наименьших квадратов регрессионного анализа. Простая линейная регрессия и множественный регрессионный анализ могут быть использованы в некоторых приложениях электронных таблиц, а также на некоторых калькуляторах. Хотя многие статистические пакеты программного обеспечения могут выполнять различные типы непараметрической и надежной регрессии, эти методы менее стандартизированы; различные программные пакеты реализуют различные методы. Специализированное регрессионное программное обеспечение было разработано для использования в таких областях как анализ обследования и нейровизуализации.

businessman.ru

2. Множественная регрессия и корреляция

Парная регрессия может дать хороший результат при моделировании, если влиянием других факторов, воздействующих на объект исследования, можно пренебречь. Если же этим влиянием пренебречь нельзя, то в этом случае следует попытаться выявить влияние других факторов, введя их в модель, т.е. построить уравнение множественной регрессии

,

где – зависимая переменная (результативный признак),– независимые, или объясняющие, переменные (признаки-факторы).

Множественная регрессия широко используется в решении проблем спроса, доходности акций, при изучении функции издержек производства, в макроэкономических расчетах и целом ряде других вопросов эконометрики. В настоящее время множественная регрессия – один из наиболее распространенных методов в эконометрике. Основная цель множественной регрессии – построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель.

2.1. Спецификация модели. Отбор факторов при построении уравнения множественной регрессии

Построение уравнения множественной регрессии начинается с решения вопроса о спецификации модели. Он включает в себя два круга вопросов: отбор факторов и выбор вида уравнения регрессии.

Включение в уравнение множественной регрессии того или иного набора факторов связано прежде всего с представлением исследователя о природе взаимосвязи моделируемого показателя с другими экономическими явлениями. Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям.

  1. Они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность.

  2. Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи.

Включение в модель факторов с высокой интеркорреляцией, может привести к нежелательным последствиям – система нормальных уравнений может оказаться плохо обусловленной и повлечь за собой неустойчивость и ненадежность оценок коэффициентов регрессии.

Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель и параметры уравнения регрессии оказываются неинтерпретируемыми.

Включаемые во множественную регрессию факторы должны объяснить вариацию независимой переменной. Если строится модель с набором факторов, то для нее рассчитывается показатель детерминации, который фиксирует долю объясненной вариации результативного признака за счет рассматриваемых в регрессиифакторов. Влияние других, не учтенных в модели факторов, оценивается какс соответствующей остаточной дисперсией.

При дополнительном включении в регрессию фактора коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться:

и .

Если же этого не происходит и данные показатели практически не отличаются друг от друга, то включаемый в анализ фактор не улучшает модель и практически является лишним фактором.

Насыщение модели лишними факторами не только не снижает величину остаточной дисперсии и не увеличивает показатель детерминации, но и приводит к статистической незначимости параметров регрессии по критерию Стьюдента.

Таким образом, хотя теоретически регрессионная модель позволяет учесть любое число факторов, практически в этом нет необходимости. Отбор факторов производится на основе качественного теоретико-экономического анализа. Однако теоретический анализ часто не позволяет однозначно ответить на вопрос о количественной взаимосвязи рассматриваемых признаков и целесообразности включения фактора в модель. Поэтому отбор факторов обычно осуществляется в две стадии: на первой подбираются факторы исходя из сущности проблемы; на второй – на основе матрицы показателей корреляции определяют статистики для параметров регрессии.

Коэффициенты интеркорреляции (т.е. корреляции между объясняющими переменными) позволяют исключать из модели дублирующие факторы. Считается, что две переменные явно коллинеарны, т.е. находятся между собой в линейной зависимости, если . Если факторы явно коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии. Предпочтение при этом отдается не фактору, более тесно связанному с результатом, а тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В этом требовании проявляется специфика множественной регрессии как метода исследования комплексного воздействия факторов в условиях их независимости друг от друга.

Пусть, например, при изучении зависимости матрица парных коэффициентов корреляции оказалась следующей:

Таблица 2.1

1

0,8

0,7

0,6

0,8

1

0,8

0,5

0,7

0,8

1

0,2

0,6

0,5

0,2

1

Очевидно, что факторы идублируют друг друга. В анализ целесообразно включить фактор, а не, хотя корреляцияс результатомслабее, чем корреляция факторас, но зато значительно слабее межфакторная корреляция. Поэтому в данном случае в уравнение множественной регрессии включаются факторы,.

По величине парных коэффициентов корреляции обнаруживается лишь явная коллинеарность факторов. Наибольшие трудности в использовании аппарата множественной регрессии возникают при наличии мультиколлинеарности факторов, когда более чем два фактора связаны между собой линейной зависимостью, т.е. имеет место совокупное воздействие факторов друг на друга. Наличие мультиколлинеарности факторов может означать, что некоторые факторы будут всегда действовать в унисон. В результате вариация в исходных данных перестает быть полностью независимой и нельзя оценить воздействие каждого фактора в отдельности.

Включение в модель мультиколлинеарных факторов нежелательно в силу следующих последствий:

  1. Затрудняется интерпретация параметров множественной регрессии как характеристик действия факторов в «чистом» виде, ибо факторы коррелированы; параметры линейной регрессии теряют экономический смысл.

  2. Оценки параметров ненадежны, обнаруживают большие стандартные ошибки и меняются с изменением объема наблюдений (не только по величине, но и по знаку), что делает модель непригодной для анализа и прогнозирования.

Для оценки мультиколлинеарности факторов может использоваться определитель матрицы парных коэффициентов корреляции между факторами.

Если бы факторы не коррелировали между собой, то матрица парных коэффициентов корреляции между факторами была бы единичной матрицей, поскольку все недиагональные элементы были бы равны нулю. Так, для уравнения, включающего три объясняющих переменных

матрица коэффициентов корреляции между факторами имела бы определитель, равный единице:

.

Если же, наоборот, между факторами существует полная линейная зависимость и все коэффициенты корреляции равны единице, то определитель такой матрицы равен нулю:

.

Чем ближе к нулю определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии. И, наоборот, чем ближе к единице определитель матрицы межфакторной корреляции, тем меньше мультиколлинеарность факторов.

Существует ряд подходов преодоления сильной межфакторной корреляции. Самый простой путь устранения мультиколлинеарности состоит в исключении из модели одного или нескольких факторов. Другой подход связан с преобразованием факторов, при котором уменьшается корреляция между ними.

Одним из путей учета внутренней корреляции факторов является переход к совмещенным уравнениям регрессии, т.е. к уравнениям, которые отражают не только влияние факторов, но и их взаимодействие. Так, если , то возможно построение следующего совмещенного уравнения:

.

Рассматриваемое уравнение включает взаимодействие первого порядка (взаимодействие двух факторов). Возможно включение в модель и взаимодействий более высокого порядка, если будет доказана их статистическая значимость по -критерию Фишера, но, как правило, взаимодействия третьего и более высоких порядков оказываются статистически незначимыми.

Отбор факторов, включаемых в регрессию, является одним из важнейших этапов практического использования методов регрессии. Подходы к отбору факторов на основе показателей корреляции могут быть разные. Они приводят построение уравнения множественной регрессии соответственно к разным методикам. В зависимости от того, какая методика построения уравнения регрессии принята, меняется алгоритм ее решения на ЭВМ.

Наиболее широкое применение получили следующие методы построения уравнения множественной регрессии:

  1. Метод исключения – отсев факторов из полного его набора.

  2. Метод включения – дополнительное введение фактора.

  3. Шаговый регрессионный анализ – исключение ранее введенного фактора.

При отборе факторов также рекомендуется пользоваться следующим правилом: число включаемых факторов обычно в 6–7 раз меньше объема совокупности, по которой строится регрессия. Если это соотношение нарушено, то число степеней свободы остаточной дисперсии очень мало. Это приводит к тому, что параметры уравнения регрессии оказываются статистически незначимыми, а -критерий меньше табличного значения.

studfiles.net

2. Постройте модели множественной регрессии с выбранными факторами. Проверьте значимость параметров уравнения.

1) Построение модели множественной регрессии

Для построения модели множественной регрессии воспользуемся инструментом Регрессия в Excel, что представлено на рисунке 2.

Рисунок 2. Использование инструмента Регрессия для построения модели множественной регрессии

Результаты представлены в таблицах 2-5.

Таблица 2. Регрессионная статистика

Множественный R

0,949469

R-квадрат

0,901492

Нормированный R-квадрат

0,886715

Стандартная ошибка

6,759955

Наблюдения

24

Таблица 3. Дисперсионный анализ

 

df

SS

MS

F

Значимость F

Регрессия

3

8363,846

2787,949

61,00945

3,04E-10

Остаток

20

913,9399

45,697

Итого

23

9277,786

 

 

 

Таблица 4. Вывод итогов

 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

2,534375

6,040428

0,419569

0,679273

-10,0657

15,13449

-10,0657

15,13449

X 1

0,492589

0,043625

11,29151

3,95E-10

0,401589

0,583588

0,401589

0,583588

X 2

0,028194

0,181866

0,155024

0,878356

-0,35117

0,407559

-0,35117

0,407559

X 4

-0,56326

0,232067

-2,42715

0,024788

-1,04734

-0,07918

-1,04734

-0,07918

Таблица 5. Вывод остатка

Наблюдение

Предсказанное Y

Остатки

1

26,59641

9,603595

2

59,76516

-22,8652

3

14,86324

-1,16324

4

16,01833

-3,51833

5

11,75245

-0,45245

6

33,91744

3,282558

7

17,78945

2,010554

8

31,03546

-2,83546

9

9,457536

2,742464

10

40,57423

5,52577

11

38,4249

-2,9249

12

12,89288

-1,09288

13

23,11193

-1,81193

14

69,5134

-0,6134

15

32,93302

1,166981

16

73,30989

5,590109

17

21,35223

-2,75223

18

16,10254

-2,40254

19

46,14546

8,554537

20

50,59305

7,706951

21

13,01994

-1,21994

22

13,10551

-3,60551

23

10,88141

-2,38141

24

13,14413

3,455873

С учётом данных таблицы 4, получим следующее уравнение регрессии:

у = 0,493X1 + 0,028X2 – 0,563X4 + 2,53

Поясним экономический смысл её параметров:

Коэффициент регрессии при переменной X1 показывает, что с ростом дохода на 1 ед., цена увеличивается в среднем на 0,493 ден. ед. при неизменном возрасте и стаже.

Коэффициент регрессии при переменной Х2 показывает, что с ростом возраста а один год, цена автомобиля в среднем увеличивается на 0,028 ден. ед. при неизменном уровне дохода и стажа работы.

Коэффициент регрессии при переменной Х3 показывает, что с ростом стажа работы на один год, цена автомобиля в среднем уменьшается на 0,563 ден. ед. при неизменном уровне дохода и возрасте.

Параметр а показывает среднее отклонение фактических данных от теоретических.

2) Проверка значимости параметра уравнения

Оценим качество полученного уравнения регрессии с использованием индекса корреляции R и коэффициента детерминации R2:

Индекс корреляции R = 0,949 – он показывает тесноту связи зависимой переменной Y с включёнными в модель объясняющими факторами. Следовательно связь между результатом У и факторами Х1, Х2 и Х4 достаточно сильная.

Коэффициент детерминации R2 = 0,901 - показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 90,1% вариации зависимой переменной учтено в модели и обусловлено влиянием включённых факторов.

Оценим статистическую значимость параметров регрессии по критерию Стьюдента. Для этого обратимся к шестому столбцу таблицы 4, где содержится t- статистика, используемая для проверки значимости коэффициентов уравнения регрессии.

В данной таблице представлены следующие значения

tа1 = 19,923

tа2 = 1,905

tа4 = 0,946

Сравним полученные значения t-критерия с табличным:

tтабл = 2,073 (α = 0,05; n – 2 = 22). Данное значение получили в EXCEL c помощью функции СТЬЮДРАСПОБР.

Можно сделать вывод, что значимыми являются параметры регрессии для факторов доход и стаж; остальные параметры регрессии незначимы.

Проверку значимости уравнения регрессии произведем на основе F-критерия Фишера. Табличное значение критерия Фишера получили в EXCEL с помощью функции FРАСПОБР. Fтаб = 3,1.

расчетное значение критерия Фишера возьмем из таблицы. Fрас= 61,01.

Таким образом, Fнабл > Fтабл (61,01 > 3,1). Следовательно, качество и статистическая значимость нашего уравнения доказаны.

studfiles.net

3. Понятие регрессии

Для количественного описания взаимосвязей между экономическими переменными в статистике используют методы регрессии и корреляции

Регрессия в статистике — статистическая зависимость среднего значения случайной величины от значений другой случайной величины или нескольких случайных величин; введена Фрэнсисом Гальтоном.

В отличие от функциональной зависимости y=f(x), которая каждому значению независимой переменной x ставит в соответствие одно определённое значение величины y, при регрессионной зависимости одному и тому же значению x могут соответствовать различные значения величины y. Если при каждом значении наблюдаетсязначенийвеличины y, то зависимость среднего арифметического

<у> = (y1 + ….+yini)/ni

от и является средней регрессией.

Регрессионный (линейный) анализ — статистический методисследования влияния одной или несколькихнезависимых переменныхx1, x2,x3,xi назависимую переменнуюy. Регрессионный анализ предполагает следущие цели:

  1. Определение степени детерминированности вариациикритериальной (зависимой) переменнойпредикторами(независимыми переменными)

  2. Предсказание значения зависимой переменной с помощью независимой(-ых)

  3. Определение вклада отдельных независимых переменных в вариацию зависимой

Регрессионный анализ нельзя использовать для определения наличия связи между переменными, поскольку наличие такой связи и есть предпосылка для применения анализа.

Существует линейная и нелинейная регрессия. Линейная регрессия предполагает, что функция f зависит от параметров w линейно. Линейная регрессионная модель разбивает зависимость целевой переменной Y от независимых переменных Xi на отдельные, не связанные между собой компоненты. Она позволяет оценить вклад каждой независимой переменной по отдельности, определив знак и силу этого влияния. Если используется критерий наименьших квадратов, то существует эффективный алгоритм вычисления значений регрессионных коэффициентов Ai, который основан на проведении достаточно простых матричных операций. Важно отметить, что результатом работы алгоритмов, решающих линейную регрессионную задачу, является не только оценка точности полученной регрессионной модели, но также стандартные отклонения входящих в нее регрессионных коэффициентов. Поэтому мы можем судить о значимости (не случайности) вхождения отдельных переменных в регрессионную модель. Мерой этой значимости может служить значение F‑статистики – квадрата отношения величины регрессионного коэффициента к величине его стандартного отклонения.

Нелинейные регрессии могут быть разделены на два существенно различных класса. Первым и более простым является класс нелинейных зависимостей, в которых имеется нелинейность относительно объясняющих переменных, но которые остаются линейными по входящим в них и подлежащим оценке параметрам. Сюда входят полиномы различных степеней и ранвосторонняя гипербола. Такая нелинейная регрессия легко сводится к обычной линейной регрессии для новых переменных. Поэтому оценка параметров в этом случае выполняется просто по методу наименьших квадратов, поскольку зависимости линейны по параметрам.

Регресии, нелинейные по параметрам разделяются на два подкласса:внешние нелинейные ( в этом случае модель можно привести к линейному виду с помощью преобразований) и внутренние нелинейные, которые преобразовать к линейному виду нельзя. Если модель внутренне нелинейна по параметрам, то для оценки параметров используются численные итеративные процедуры, успешность которых зависит от вида уравнений и от особенностей применяемого итеративного метода.

Особого внимания заслуживает исследование корреляции для нелинейной регресии. В общем случаепарабола второй степени, так же как и полиномы более высокого порядка, при линеаризации принимает вид уравнения множественной регрессии. Если нелинейное относительно объясняемой базы переменной уравнение регрессии при линеализации принимает форму линейного уравнения парной регрессии, то для оценки тесноты связи может быть использован линейный коэффициент корреляции.

Если преобразования уравнения регрессии в линейную форму связаны с зависимой переменной, то линейный коэф корреляции по преобразованным значениям признаков дает лишь приближенную оценку связи и численно не совпадает с индексом корреляции.

studfiles.net

эконометрика - Стр 2

Вопрос

Ответ

Верно

1. Что является предметом изучения эконометрики?

факторы, формирующие развитие экономических явлений и процессов

да

102. Величина ЕSS показывает

величину дисперсии зависимой переменной, не объясненной регрессией

да

103. Как рассчитывается коэффициент детерминации?

RSS / TSS

да

106. Какое количество стандартных остатков выводится при проведении регрессии?

равное количеству переменных модели

нет

113. Каковы последствия удаления статистических выбросов в регрессионном анализе?

увеличение тесноты связи в модели

да

117. Фиктивная переменная - это

другое название бинарной переменной

да

127. Что означает положительный коэффициент при бинарной переменной?

увеличение зависимой переменной при наличии признака, описываемого бинарной

да

128. Незначимость бинарной переменной означает

отсутствие влияния данного качественного признака на зависимую переменную

да

129. Статистическая значимость бинарной переменной означает

подтвержденное влияние данного качественного признака на зависимую переменную

да

13. Для определения тесноты линейной связи между двумя факторами необходимо

рассчитать коэффициент корреляции

да

130. В каких случаях производится исключение бинарных переменных из модели?

в случае высокого Р-значения для них

да

21. Метод наименьших квадратов позволяет

определить наличие нелинейной зависимости между переменными

нет

23. Решение по МНК в пакете Excel можно получить при помощи

опций Анализ данных - Регрессия

да

24. Что такое МНК?

метод наименьших квадратов

да

27. В каком случае регрессия является парной?

если в уравнение регрессии входит одна зависимая и одна независимая переменная

да

3. Эконометрика занимается изучением

качественного и количественного влияния разных факторов на экономические объекты

да

38. Для чего составляется уравнение регрессии?

для определения тесноты связи исследуемых переменных

нет

46. В уравнении регрессии параметры обычно обозначаются как

а и b

да

54. В уравнении регрессии параметры регрессии обычно обозначаются как

а и b

да

56. В уравнении y = a + bx величина коэффициента а отражает

влияние на у факторов, не учтенных в модели

да

68. В уравнении y = a + bx незначимость коэффициента регрессии b означает, что

влияние коэффициента b на переменную х отсутствует

нет

75. Какая величина «Р-значения» подтверждает влияние х на у?

Р-значение для него меньше 0,05

да

76. При одновременной незначимости нескольких объясняющих переменных модели нужно

удалить их последовательно, начиная с той, чье Р-значение меньше

нет

8. Математической моделью в эконометрических задачах является

уравнение регрессии или система уравнений регрессии

да

84. Тесная связь между перменными модели констатируется в том случае, если

коэффициент корреляции по модулю не меньше 0,7

да

Вопрос

Ответ

Верно

11. Что означает наличие обратной связи между переменными х и у?

что при уменьшении значений х значения у увеличиваются

да

110. Каким образом при решении регрессионной задачи в пакете Excel обнаруживаются статистические выбросы?

по величинам стандартных остатков наблюдений

да

114. Для проверки качества построенной регрессионной модели необходимо проанализировать:

коэффициент корреляции, Значимость F, Р-значения

да

115. Для признания регрессионной модели качественной должны выполняться условия:

связь тесная, статистические выбросы отсутствуют, зависимая переменная значима

нет

115. Для чего в регрессионную модель вводятся бинарные переменные?

для учета качественных признаков

да

120. Какие значения может принимать фиктивная переменная?

0 и 1

да

125. Может ли коэффициент при бинарной переменной быть отрицательным?

да

да

128. Незначимость бинарной переменной означает

отсутствие влияния данного качественного признака на зависимую переменную

да

130. В каких случаях производится исключение бинарных переменных из модели?

в случае высокого Р-значения для них

да

2. Для чего составляются эконометрические модели?

для выявления качественного и количественного влияния разных факторов на объект

да

36. Уравнение регрессии оценивает

форму зависимости исследуемых переменных

да

37. Для оценки формы связи между переменными служит

уравнение регрессии

да

41. Уравнение регрессии записывается на основании

величин остатков

нет

46. В уравнении регрессии параметры обычно обозначаются как

а и b

да

54. В уравнении регрессии параметры регрессии обычно обозначаются как

а и b

да

55. В результатах решения задачи коэффициент регрессии а отображается как:

переменная Х1

нет

62. Чему будет равен Y в множественной линейной регрессии, если Y-пересечение = 6, b1 = 2, b2 = 5, х1 = 8, x2 = 4?

42

да

71. Что означает не значимость коэффициента регрессии?

что соответствующая ему независимая переменная не влияет на зависимую

да

73. Что означает статистическая незначимость параметра (коэффициента) регрессии?

высокую вероятность равенства данного параметра нулю

да

74. Когда коэффициент регрессии считается значимым?

если его Р-значение меньше 5%

да

78. Теснота связи в уравнении регрессии определяется с помощью

коэффициента корреляции

да

81. Что проверяется с помощью коэффициента корреляции?

теснота связи между факторами в уравнении регрессии

да

92. В каком случае коэффициент детерминации может быть не достоверен?

в случае, если для анализа взято слишком мало наблюдений

да

97. Что показывает коэффициент детерминации?

объясненную регрессией долю дисперсии зависимой переменной у

да

99. О чем свидетельствует близкое к 1 значение коэффициента детерминации?

о наличии тесной связи между изучаемыми показателями

да

Количество правильных ответов:

22

Количество не правильных ответов:

3

Количество пропущенных вопросов:

0

Количество вопросов:

25

% правильных ответов:

88

studfiles.net

2.2 Оценка значимости параметров линейной регрессии и корреляции

После того как уравнение линейной регрессии найдено, проводится оценка значимости как уравнения в целом, так и отдельных его параметров.

Оценка значимости уравнения регрессии в целом дается с помощью F-критерия Фишера. При этом выдвигается нулевая гипотеза, что коэффициент регрессии равен нулю, т. е. Но: b = 0, и, следовательно, фактор х не оказывает влияния на результат у. Непосредственному расчету F-критерия предшествует анализ дисперсии.

2.2.1 Анализ вариации (дисперсии) зависимой переменной в регрессии.

Рассмотрим вариацию (разброс) значенийвокруг среднего значения. Разобьем эту вариацию на две части: объясненную регрессионным уравнением и не объясненную (т.е. связанную с ошибками).

Обозначим через предсказанное значение, тогда(см. рис. ) и вариацияпредставляется в виде трех слагаемых:

Третье слагаемое равно нулю, так как вектор остатков регрессии Е ортогонален константе Г и вектору Х, т.е. ГТЕ=только в том случае, когда константа включена в число объясняющих параметров регрессии.

Поэтому верно равенство

TSS ESS RSS

Обозначим левую часть через TSS (total sum of squares) – вся дисперсия, первое слагаемое в правой части, соответствующее не объясненной дисперсии, через ESS (error sum of squares), второе слагаемое в правой части – RSS (regression sum of squares) – объясненная часть всей дисперсии.

2.2.2 Статистика – коэффициент детерминации.

Определение. Коэффициентом детерминации, или долей объясненной дисперсии, называется

Статистику имеет смысл рассматривать, когда константа включена в уравнение регрессии.

В силу определения принимает значения между 0 и 1,.

Если , то это означает, что регрессия ничего не дает, т.е.не улучшает качество предсказанияпо сравнению с тривиальным предсказанием.

Другой крайний случай означает точную подгонку: все точки наблюдений лежат на регрессионной прямой ( все)

Чем ближе к 1 значение , тем лучше качество подгонки,более точно аппроксимируетy.

применяется при оценке качества регрессии.

2.2.3 Дисперсионный анализ

Центральное место в нем занимает разложение общей суммы квадратов отклонений переменной у от среднего значения (т. е. дисперсии или вариацииy) на две части — «объясненную» уравнением регрессии и «остаточную» («необъясненную»):

Общая сумма квадратов отклонений

Сумма квадратов отклонений, объясненная регрессией

Остаточная сумма квадратов отклонений

Общая сумма квадратов отклонений индивидуальных значений результативного признака у от среднего значения условно делится на две группы: влияние изучаемого фактора х и влияние прочих факторов.

Если фактор не оказывает влияния на результат, то линия регрессии на графике параллельна оси ох и у = . Тогда вся дисперсия результативного признака обусловлена воздействием прочих факторов и общая сумма квадратов отклонений совпадет с остаточной.

Если же прочие факторы не влияют на результат, то у связан с х функционально и остаточная сумма квадратов равна нулю. В этом случае сумма квадратов отклонений, объясненная регрессией, совпадает с общей суммой квадратов.

Поскольку не все точки поля корреляции лежат на линии регрессии, то всегда имеет место их разброс, как обусловленный влиянием фактора х, т. е. регрессией у по х, так и вызванный действием прочих причин (необъясненная вариация).

Пригодность линии регрессии для прогноза зависит от того, какая часть общей вариации признака у приходится на объясненную вариацию. Очевидно, что если сумма квадратов отклонений, обусловленная регрессией, будет больше остаточной суммы квадратов, то уравнение регрессии статистически значимо и фактор х оказывает существенное влияние на результат у. Это равносильно тому, что коэффициент детерминации r2 будет приближаться к единице.

Любая сумма квадратов отклонений связана с числом степеней свободы df (degrees of freedom), т.е. с числом свободы независимого варьирования признака. Число степеней свободы связано с числом единиц совокупности п и с числом определяемых по ней констант. Применительно к исследуемой проблеме число степеней свободы должно показать, сколько независимых отклонений из п возможных требуется для образования данной суммы квадратов.

Для общей суммы квадратов необходимонезависимых отклонений, ибо по совокупности изп единиц после расчета среднего уровня свободно варьируют лишь число отклонений.

Например, имеем ряд значений у: 1,2, 3, 4, 5. Среднее из них равно 3, и тогда п отклонений от среднего составят: - 2; - 1; 0; 1; 2.

Поскольку , то свободно варьируют лишь четыре отклонения, а пятое отклонение может быть определено, если четыре предыдущие известны.

Для объясненной или факторной, суммы квадратов используются теоретические (расчетные) значения результативного признака , найденные по линии регрессии: . В линейной регрессии сумма квадратов отклонений, обусловленных линейной регрессией, составит:

.

Поскольку при заданном объеме наблюдений по х и у факторная сумма квадратов при линейной регрессии зависит только от одной константы коэффициента регрессии b, то данная сумма квадратов имеет одну степень свободы.

Отсюда видно, что при заданном наборе переменных у и х расчетное значение является функцией лишь одного параметра — коэффициента регрессии. Соответственно и факторная сумма квадратов отклонений имеет число степеней свободы, равное 1.

Существует равенство между числом степеней свободы общей, факторной и остаточной суммами квадратов. Число степеней свободы остаточной суммы квадратов при линейной регрессии составляет . Итак, имеем два равенства:

2) .

Разделив каждую сумму квадратов на соответствующее ей число степеней свободы, получим средний квадрат отклонений или дисперсию на одну степень свободы D.

Определение дисперсии на одну степень свободы приводит дисперсии к сравнимому виду. Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину F-отношения, т. е. критерий F.

F-статистика используется для проверки нулевой гипотезы об отсутствии связи признаков H0:

Если нулевая гипотеза Н0 справедлива, то факторная и остаточная дисперсии не отличаются друг от друга. Если Н0 несправедлива, то факторная дисперсия превышает остаточную в несколько раз. Английским статистиком Снедекором разработаны таблицы критических значений F - отношений при разных уровнях значимости нулевой гипотезы и различном числе степеней свободы. Табличное значение F-критерия - это максимальная величина отношения дисперсий, которая может иметь место при случайном расхождении их для данного уровня вероятности наличия нулевой гипотезы. Вычисленное значение F-отношения признается достоверным (отличным от единицы), если оно больше табличного. В этом случае нулевая гипотеза об отсутствии связи признаков отклоняется и делается вывод о существенности этой связи:

, Но отклоняется и уравнение регрессии статистически значимо.

Если же величина F окажется меньше табличной, то вероятность нулевой гипотезы выше заданного уровня (например, 0,05) и она не может быть отклонена без риска сделать неправильный вывод о наличии связи. В этом случае уравнение регрессии считается статистически незначимым:

, Ho не отклоняется.

Величина F-критерия связана с коэффициентом детерминации r2:

Оценка значимости уравнения регрессии обычно дается в виде таблицы дисперсионного анализа (табл. 1).

Таблица 1

Дисперсионный анализ результатов регрессии

Источники вариации

Число сте­пеней сво­боды

Сумма квад­ратов откло­нений

Дисперсия на одну степень свободы

F-отношение

фактическое

табличное при α = 0,05

Общая

6

15000

-

-

-

Объясненная

1

14735

14735

278

6,61

Остаточная

5

265

53

1

-

studfiles.net