НОУ ІНТУЇТ | лекція | Економетрика тимчасових рядів
Анотація: Під тимчасовими рядами розуміють економічні величини, що залежать від часу. При цьому час передбачається дискретним, в іншому випадку говорять про випадкових процесах, а не про тимчасові рядах.
Моделі стаціонарних і нестаціонарних часових рядів, їх ідентифікація
нехай Розглянемо тимчасової ряд . Нехай спочатку тимчасової ряд приймає числові значення. Це можуть бути, наприклад, ціни на батон хліба в сусідньому магазині або курс обміну долара на рублі в найближчому обмінному пункті. Зазвичай в поведінці часового ряду виявляють дві основні тенденції - тренд і періодичні коливання.
При цьому під трендом розуміють залежність від часу лінійного, квадратичного чи іншого типу, яку виявляють той чи інший спосіб згладжування (наприклад, експоненціального згладжування) або розрахунковим шляхом, зокрема, за допомогою методу найменших квадратів. Іншими словами, тренд - це очищена від випадковостей основна тенденція часового ряду.
Часовий ряд зазвичай коливається навколо тренда, причому відхилення від тренда часто виявляють правильність. Часто це пов'язано з природною або призначеної періодичністю, наприклад, сезонної або тижневої, місячної або квартальної (наприклад, відповідно до графіків виплати латки і сплати податків). Іноді наявність періодичності і тим більше її причини неясні, і завдання економетрика - з'ясувати, чи дійсно є періодичність.
Елементарні методи оцінки характеристик часових рядів зазвичай досить докладно розглядаються в курсах "Загальної теорії статистики" (див., Наприклад, підручники [1] [2] ), Тому немає необхідності детально розбирати їх тут. (Втім, про деякі сучасні методи оцінювання довжини періоду і самої періодичної складової мова піде нижче.)
Характеристики часових рядів. Для більш детального вивчення часових рядів використовуються ймовірносно-статистичні моделі. При цьому часовий ряд розглядається як випадковий процес (з дискретним часом) основними характеристиками є математичне очікування , Тобто
дисперсія , Тобто
і автокореляційна функція часового ряду
тобто функція двох змінних, що дорівнює коефіцієнту кореляції між двома значеннями часового ряду і .
У теоретичних і прикладних дослідженнях розглядають широкий спектр моделей часових рядів. Виділимо спочатку стаціонарні моделі. У них спільні функції розподілу для будь-якого числа моментів часу , А тому і всі перераховані вище характеристики часового ряду не змінюються з часом. Зокрема, математичне очікування і дисперсія є постійними величинами, автокореляційна функція залежить тільки від різниці . Тимчасові ряди, які не є стаціонарними, називаються нестаціонарними.
Лінійні регресійні моделі з гомоскедастичність і гетероскедастичними, незалежними і автокоррелірованнимі залишками. Як видно зі сказаного вище, основне - це "очищення" тимчасового ряду від випадкових відхилень, тобто оцінювання математичного очікування. На відміну від найпростіших моделей регресійного аналізу, розглянутих в "Багатомірний статистичний аналіз" , Тут природним чином з'являються більш складні моделі. Наприклад, дисперсія може залежати від часу. Такі моделі називають гетероскедастичними, а ті, в яких немає залежності від часу - гомоскедастичність. (Точніше кажучи, ці терміни можуть ставитися не тільки до змінної "час", але і до інших змінним.)
Далі, в "Багатомірний статистичний аналіз" передбачалося, що похибки незалежні між собою. У термінах цієї глави це означало б, що автокореляційна функція повинна бути вироджених - дорівнювати 1 за однакової кількості аргументів і 0 при їх нерівності. Ясно, що для реальних часових рядів так буває далеко не завжди. Якщо природний хід змін спостережуваного процесу є досить швидким в порівнянні з інтервалом між послідовними спостереженнями, то можна очікувати "загасання" автокорреляции "і отримання практично незалежних залишків, в іншому випадку залишки будуть автокорреліровани.
Ідентифікація моделей. Під ідентифікацією моделей зазвичай розуміють виявлення їх структури і оцінювання параметрів. Оскільки структура - це теж параметр, хоча і нечислової (див. "Статистика нечислових даних" ), То мова йде про одну з типових задач економетрики - оцінюванні параметрів.
Найпростіше завдання оцінювання вирішується для лінійних (за параметрами) моделей з гомоскедастичність незалежними залишками. Відновлення залежностей у тимчасових рядах може бути проведено на основі методів найменших квадратів і найменших модулів, розглянутих в "Багатомірний статистичний аналіз" моделей лінійної (за параметрами) регресії. На випадок часових рядів переносяться результати, пов'язані з оцінюванням необхідного набору регресорів, зокрема, легко отримати граничне геометричний розподіл оцінки ступеня тригонометричного полінома.
Однак на більш загальну ситуацію такого простого перенесення зробити не можна. Так, наприклад, в разі тимчасового ряду з гетероскедастичними і автокоррелірованнимі залишками знову можна скористатися загальним підходом методу найменших квадратів, однак система рівнянь методу найменших квадратів і, природно, її рішення будуть іншими. Формули в термінах матричної алгебри, про які згадувалося в "Багатомірний статистичний аналіз" , Будуть відрізнятися. Тому розглянутий метод називається "узагальнений метод найменших квадратів (ОМНК)" (див., Наприклад, [3, с.212] ).
Зауваження. Як вже зазначалося в "Багатомірний статистичний аналіз" , Найпростіша модель методу найменших квадратів допускає досить далекі узагальнення, особливо в області систем одночасних економетричних рівнянь для часових рядів. Для розуміння відповідної теорії і алгоритмів необхідно професійне володіння матричної алгеброю. Тому ми відсилаємо тих, кому це цікаво, до літератури по системам економетричних рівнянь [4-9] і безпосередньо по часових рядах [10-25], в якій особливо багато цікавляться спектральної теорією, тобто виділенням сигналу з шуму і розкладанням його на гармоніки. Підкреслимо в черговий раз, що за кожним розділом цієї книги стоїть велика область наукових і прикладних досліджень, цілком гідна того, щоб присвятити їй багато зусиль. Однак через обмеженість обсягу книги ми змушені виклад зробити конспективним.
Системи економетричних рівнянь
Приклад моделі авторегресії. В якості початкового прикладу розглянемо економетричну модель тимчасового ряду, що описує зростання індексу споживчих цін (індексу інфляції). нехай - зростання цін на місяць (Докладніше про цю проблематику см. "Економетричний аналіз інфляції" ). Тоді на думку деяких економістів природно припустити, що
де - зростання цін в попередній місяць (а - деякий коефіцієнт загасання, що передбачає, що при відсутності зовнішній впливів зростання цін припиниться), - константа (вона відповідає лінійному зміні величини з часом), - доданок, відповідне впливу емісії грошей (тобто збільшення обсягу грошей в економіці країни, здійсненому Центральним Банком) в розмірі і пропорційне емісії з коефіцієнтом , Причому цей вплив проявляється не відразу, а через 4 місяці; нарешті, - це неминуча похибка.
Модель (1), незважаючи на свою простоту, демонструє багато характерних рис набагато складніших економетричних моделей. По-перше, звернемо увагу на те, що деякі змінні визначаються (розраховуються) всередині моделі, як . Їх називають ендогенними (внутрішніми). Інші задаються ззовні (це екзогенні змінні). Іноді, як в теорії управління, серед екзогенних змінних, виділяють керовані змінні - ті, за допомогою яких менеджер може привести систему в потрібне йому стан.
По-друге, в співвідношенні (1) з'являються змінні нових типів - з лагами, тобто аргументи на змінних відносяться не до поточного моменту часу, а до деяких минулим моментам.
По-третє, складання економетричної моделі типу (1) - це аж ніяк не рутинна операція. Наприклад, запізнення саме на 4 місяці в пов'язаному з емісією грошей слагаемом - це результат досить витонченої попередньої статистичної обробки. Далі, вимагає вивчення питання залежності або незалежності величин і . Від вирішення цього питання залежить, як вище вже зазначалося, конкретна реалізація процедури методу найменших квадратів.
З іншого боку, в моделі (1) всього 3 невідомих параметра, і постановку методу найменших квадратів виписати неважко:
Проблема ідентифікації документів. Уявімо тепер модель тапа (6.1) з великим числом ендогенних і екзогенних змінних, з лагами і складною внутрішньою структурою. Взагалі кажучи, нізвідки не випливає, що існує хоча б одне рішення у такої системи. Тому виникає не одна, а дві проблеми. Чи є хоч одне рішення (проблема ідентифікованих)? Якщо так, то як знайти найкраще рішення з можливих? (Це - проблема статистичної оцінки параметрів.)
І перша, і друга задача досить складні. Для вирішення обох завдань розроблено безліч методів, зазвичай досить складних, лише частина з яких має наукове обгрунтування. Зокрема, досить часто користуються статистичними оцінками, які не є заможними (строго кажучи, їх навіть не можна назвати оцінками).
Коротко опишемо деякі поширені прийоми при роботі з системами лінійних економетричних рівнянь.
Система лінійних одночасних економетричних рівнянь. Чисто формально можна все змінні висловити через змінні, що залежать тільки від поточного моменту часу. Наприклад, в разі рівняння (6.1) досить покласти
Тоді рівняння приклад вид
Відзначимо тут же можливість використання регресійних моделей зі змінною структурою шляхом введення фіктивних змінних. Ці змінні при одних значеннях часу (скажімо, початкових) приймають помітні значення, а при інших - сходять нанівець (стають фактично рівними 0). В результаті формально (математично) одна і та ж модель описує зовсім різні залежності.
Непрямий, двохкроковий і трехшаговий методи найменших квадратів. Як уже зазначалося, розроблена маса методів евристичного аналізу систем економетричних рівнянь. Вони призначені для вирішення тих чи інших проблем, що виникають при спробах знайти чисельні рішення систем рівнянь.
Одна з проблем пов'язана з наявністю апріорних обмежень на оцінювані параметри. Наприклад, дохід домогосподарства може бути витрачений або на споживання, або на заощадження. Значить, сума часток цих двох видів витрат апріорі дорівнює 1. А в системі економетричних рівнянь ці частки можуть брати участь незалежно. Мимоволі спадає на думку оцінити їх методом найменших квадратів, не звертаючи уваги на апріорне обмеження, а потім підкоригувати. Такий підхід називають непрямим методом найменших квадратів.
Двокроковий метод найменших квадратів полягає в тому, що оцінюють параметри окремого рівняння системи, а не розглядають систему в цілому. У той же час трехшаговий метод найменших квадратів застосовується для оцінки параметрів системи одночасних рівнянь в цілому. Спочатку до кожного рівняння застосовується двохкроковий метод з метою оцінити коефіцієнти і похибки кожного рівняння, а потім побудувати оцінку для ковариационной матриці похибок, Після цього для оцінювання коефіцієнтів всієї системи застосовується узагальнений метод найменших квадратів.
Менеджеру і економісту не слід ставати фахівцем зі складання і вирішення систем економетричних рівнянь, навіть за допомогою тих чи інших програмних систем, але він повинен бути обізнаний про можливості цього напрямку економетрики, щоб в разі виробничої необхідності кваліфіковано сформулювати завдання для фахівців-економетриків.
Від оцінювання тренда (основний тенденції) перейдемо до другої основної задачі економетрики часових рядів - оцінювання періоду (циклу).
Чи є хоч одне рішення (проблема ідентифікованих)?Якщо так, то як знайти найкраще рішення з можливих?