ДЕРЖАВНИЙ КОМІТЕТ СТАТИСТИКИ УКРАЇНИ
Н А К А З
14.11.2006 N 520

Про затвердження Методики розрахунку системи статистичних ваг для поширення результатів вибіркового обстеження населення (домогосподарств) з питань економічної активності на генеральну сукупність

Відповідно до статті 14 Закону України "Про державну статистику" (2614-12) та з метою удосконалення системи показників стану економічно активного населення, їх аналізу та використання НАКАЗУЮ:
1. Затвердити та ввести в дію з 01 грудня 2006 року схвалену методичною комісією Держкомстату Методику розрахунку системи статистичних ваг для поширення результатів вибіркового обстеження населення (домогосподарств) з питань економічної активності на генеральну сукупність (далі - Методика), що додається.
2. Департаменту статистики праці (Григорович Н.В.):
2.1. Запровадити у практику роботи методику, затверджену пунктом 1 цього наказу.
2.2. Довести Методику, затверджену пунктом 1 цього наказу до відома Головних управлінь статистики в Автономній Республіці Крим, областях, у м. Києві та Управління статистики у м. Севастополі.
3. Визнати таким, що втратив чинність з 01 грудня 2006 року наказ Держкомстату України від 09.04.2001 N 185 "Про затвердження методики розповсюдження на генеральну сукупність результатів щоквартального вибіркового обстеження економічної активності населення".
4. Контроль за виконанням цього наказу покласти на заступника Голови Власенко Н.С.
Голова
О.Г.Осауленко

ЗАТВЕРДЖЕНО
Наказ Держкомстату України
14.11.2006  N 520

МЕТОДИКА

розрахунку системи статистичних ваг для поширення результатів вибіркового обстеження населення (домогосподарств) з питань економічної активності на генеральну сукупність

АНОТАЦІЯ

Методика визначає основні принципи та порядок розрахунку системи статистичних ваг домогосподарств та осіб у вибірковому обстеженні населення (домогосподарств) з питань економічної активності України. Система ваг призначена для науково-обґрунтованого поширення результатів обстеження на генеральну сукупність - все населення України у віці 15-70 років - та забезпечує підвищення якості вимірювання основних показників економічної активності населення шляхом урахування імовірностей включення одиниць до вибірки, рівнів відмов від обстеження по групах домогосподарств та осіб, даних демографічної статистики щодо чисельності та розміщення населення, його статево-вікової структури тощо.
Методика ґрунтується на сучасних методологічних засадах поширення на генеральну сукупність результатів вибіркових обстежень населення, що використовуються в міжнародній практиці, і є однією з основних складових методичного забезпечення проведення вибіркового обстеження населення (домогосподарств) з питань економічної активності у 2004-2008 роках. Процедури та алгоритми розроблені з урахуванням вимог використання сучасних комп'ютерних технологій для обробки статистичної інформації, зокрема на основі пакету SPSS.
Дослідження та практичні роботи виконані за підтримки проекту технічної допомоги в галузі статистики Міністерства у справах міжнародного розвитку Сполученого Королівства Великої Британії та Північної Ірландії.
Представлена методика впроваджується в дію замість Методики розповсюдження на генеральну сукупність результатів щоквартального вибіркового обстеження економічної активності населення, затвердженої наказом Державного комітету статистики України від 9 квітня 2001 року N 185.
Методику призначено для використання працівниками органів державної статистики насамперед на державному рівні. Тому, з метою покращення якості інформації про ринок праці на регіональному рівні, в подальшому методика може бути адаптована для впровадження відповідних розрахунків на територіальному рівні, а також є корисною для працівників територіальних управлінь статистики, зацікавлених користувачів статистичної інформації, фахівців наукових організацій і навчальних закладів, що проводять дослідження в галузі методології вибіркових обстежень.
Методику розроблено фахівцями Інституту демографії та соціальних досліджень НАН України В.Г.Саріогло, О.М.Гладуном, О.В.Лисою, А.І.Терещенко, фахівцями департаменту статистики праці Держкомстату України Н.В.Григорович, Н.В.Рубльовою, А.В.Солоп, Р.Я.Колесніченко, за участю фахівців департаменту обстежень домогосподарств І.І.Осипової, С.О.Редченко та завдяки консультативної допомоги п. Пола Сміта (Paul Smith) - Голови центру дизайну вибірки та оцінювання Національного офісу статистики Сполученого Королівства.

ЗМІСТ

Передмова
Перелік умовних позначень та символів. Основні терміни
1. Основні принципи поширення результатів вибіркових обстежень населення (домогосподарств) з питань економічної активності на генеральну сукупність
2. Порядок розрахунку складових системи ваг
2.1. Розрахунок базової ваги домогосподарств
2.2. Врахування теоретичної ймовірності відбору
2.3. Врахування відмов домогосподарств від обстеження
2.4. Врахування відмов осіб від обстеження
2.5. Усунення постстратифікаційних ефектів
3. Об'єднання даних, отриманих за основною вибіркою та за вибіркою обстеження сільськогосподарської діяльності домогосподарств
4. Порядок визначення якості системи ваг
5. Інформаційна база розрахунку системи статистичних ваг
5.1. Характеристики вибіркової сукупності домогосподарств
5.2. Результати обстеження
5.3. Додаткові дані
Заключні положення
Перелік посилань
Додаток

ПЕРЕДМОВА

Одним з визначальних факторів, що обумовлює зростаючу популярність вибіркових обстежень населення, як ефективного способу вимірювання найважливіших соціально-економічних і демографічних показників, є можливість обґрунтованого поширення результатів обстежень на генеральну сукупність. Ця можливість базується на принципі репрезентативності, який вимагає незміщеності (близькості) розрахункових оцінок показників (зокрема щодо зайнятості та безробіття), отриманих на основі вибіркових даних, по відношенню до параметрів генеральної сукупності. Принцип репрезентативності вибірки ототожнюється з принципом ймовірності вибірки, за яким кожний елемент генеральної сукупності повинен мати відому позитивну імовірність потрапити до вибірки при її формуванні.
Поширення результатів вибіркового обстеження населення (домогосподарств) з питань економічної активності (далі - ОЕАН) на генеральну сукупність здійснюється шляхом реалізації процедури їх статистичного зважування. При розрахунку системи ваг в ОЕАН проблема полягає в тому, що репрезентативність вибірки необхідно забезпечувати в умовах не лише складного дизайну вибірки, а й при неоднорідних за регіонами та групами населення рівнях відмов від обстеження, в умовах застосування складних методів оцінювання і узгодження результатів обстеження з наявною зовнішньою інформацією.
Основні переваги зважування характеризуються наступними положеннями:
- процедури зважування призначені для врахування реальних ймовірностей включення одиниць до вибірки, що особливо важливо при нерівних ймовірностях відбору;
- ваги дозволяють врахувати фактичні рівні участі одиниць спостереження в обстеженні;
- шляхом зважування зменшується вплив на результати обстеження не вибіркових похибок;
- через систему ваг реалізують процедури поліпшення якості оцінювання показників шляхом використання складних оціночних функцій (оцінки за відношенням, оцінки за регресією тощо) та узгодження результатів обстеження з зовнішньою інформацією (зокрема з застосуванням процедур калібрації);
- системи ваг дозволяють об'єднувати результати різних вибіркових обстежень на нижчих рівнях агрегації даних та на мікрорівні.
В той же час процес зважування ускладнює процедуру обробки даних, зокрема, вимагає більших витрат часу на обробку та аналіз даних. Одночасно зазначений процес зважування може призвести до зниження надійності оцінок показників і є додатковим потенційним джерелом помилок при обробці даних вибіркових обстежень.
Слід зазначити, що для сучасних вибіркових обстежень населення переваги зважування значно перевищують недоліки.
Розрахунок ваг здійснюється з метою визначення результуючої ваги кожної одиниці спостереження, що була обстежена.
Дана методика визначає основні методологічні положення та порядок розрахунку системи статистичних ваг обстежених одиниць (домогосподарств та осіб) при поширенні результатів ОЕАН на генеральну сукупність.
Методика складається з передмови, п'яти розділів заключних положень, переліку використаних джерел та додатку.
У першому розділі розглянуті основні методологічні положення щодо поширення результатів ОЕАН на генеральну сукупність.
У другому розділі представлено безпосередній порядок розрахунку відповідних складових системи ваг, особливості реалізації окремих етапів побудови їх системи та наведені конкретні приклади розрахунків.
Третій розділ присвячений процедурам коригування ваг при об'єднанні даних, отриманих по сільській місцевості за вибіркою ОЕАН та за вибіркою обстеження сільськогосподарської діяльності домогосподарств.
У четвертому розділі розглянуті основні характеристики якості системи статистичних ваг, принципи їх розрахунку та використання.
У п'ятому розділі розглянуті питання інформаційного забезпечення розрахунку системи ваг.
У заключних положеннях обговорюються особливості реалізації процедур розрахунку системи статистичних ваг та напрямки їх подальшого удосконалення.

ПЕРЕЛІК УМОВНИХ ПОЗНАЧЕНЬ ТА СИМВОЛІВ ВИЗНАЧЕННЯ ОСНОВНИХ ТЕРМІНІВ

Умовні позначення:
ПТОВ - первинна територіальна одиниця вибірки;
ВТОВ - вторинна територіальна одиниця вибірки;
ОЕАН - обстеження економічної активності населення;
ОСГД - обстеження сільськогосподарської діяльності населення.
Основні терміни [1, 2]:
Відбір імовірнісний - відбір, оснований на об'єктивних правилах випадкового відбору, під час якого кожна одиниця сукупності має відомий ненульовий шанс бути включеним до вибірки.
Відбір багатоступеневий - відбір, який відбувається у кілька послідовних ступенів (етапів): на першому ступені з основи вибірки відбираються певні відносно великі одиниці; на другому ступені всередині кожної відібраної на першому ступені одиниці формується своя основа вибірки, з якої відбираються свої одиниці, і так далі за кількістю ступенів відбору.
Вибіркова сукупність (вибірка) - сукупність одиниць спостереження, відібраних із генеральної сукупності за певними правилами, які забезпечують репрезентативність вибірки, для проведення статистичного спостереження.
Вибіркове обстеження населення (домогосподарств) - науково-обгрунтований вид несуцільного спостереження, при якому обстежуються не всі одиниці сукупності, а лише певним чином відібрана їх частина, а одиницею спостереження є особа чи домогосподарство.
Вторинна територіальна одиниця вибірки (ВТОВ) - територіальна одиниця, яка відібрана на другому ступені формування територіальної вибірки при застосуванні багатоступеневого територіального відбору.
Генеральна сукупність - множина одиниць, характеристики яких необхідно дослідити і щодо яких буде зроблено узагальнення за результатами вибіркового обстеження.
Дизайн (план) вибірки - організаційно-логічна модель структури вибіркової сукупності та принципи її формування. Якістю плану вибірки в значній мірі визначається репрезентативність вибіркової сукупності, отриманої за визначеними у плані правилами.
Імовірність - число, яке характеризує ступінь можливості настання певної події. Розраховується як відношення кількості випадків настання події до всіх можливих варіантів.
Калібрація - трансформація (коригування) системи ваг для одиниць спостереження, які прийняли участь у вибірковому обстеженні, шляхом мінімізації функції відстані між калібраційними вагами та вагами, що коригуються, за умови, що калібраційні ваги дають точні оцінки зовнішніх змінних, відомих для генеральної сукупності або її частин.
Обсяг вибірки - кількість одиниць у вибірковій сукупності. Необхідний для забезпечення репрезентативності та належної якості результатів вибіркового обстеження обсяг вибірки розраховують в залежності від способу відбору та типу вибірки. Величина обсягу вибірки залежить від варіації досліджуваних ознак та припустимої похибки вибірки.
Одиниця відбору - одиниця генеральної сукупності чи їх група, або одиниця основи вибірки, яка має ймовірність бути включеною до вибірки при реалізації процедури відбору.
Одиниця вибірки - одиниця відбору, яка увійшла до складу вибірки.
Основа вибірки - упорядкований певним чином перелік, список одиниць відбору. При використанні багатоступеневого відбору на кожному ступені формується своя основа вибірки.
Одиниця спостереження - первинна одиниця, від якої мають бути одержані необхідні статистичні дані. Вибір одиниці спостереження залежить від мети та конкретних умов проведення спостереження.
Первинна територіальна одиниця вибірки (ПТОВ) - територіальна одиниця, яка відібрана на першому ступені формування територіальної вибірки при застосуванні багатоступеневого територіального відбору.
Постстратифікація - трансформація (коригування) системи ваг одиниць спостереження шляхом забезпечення відповідності оцінок показників за результатами вибіркового обстеження зовнішній інформації по певних стратах генеральної сукупності.
Репрезентативність - властивість вибіркової сукупності повно та адекватно відображати основні характеристики генеральної сукупності.
Ротація - заміна частини діючої вибіркової сукупності (або для окремих вибіркових обстежень - її повна заміна) за розробленими схемами при проведенні чергових раундів вибіркового обстеження, яке проводиться на постійній основі.
Статистична вага - 1) кількість одиниць генеральної сукупності, які репрезентує (представляє) одна одиниця вибірки; 2) величина, обернена до ймовірності відбору одиниці вибірки.
Стратифікація - поділ генеральної сукупності (або її частини) на групи, однорідні за певною ознакою.
Територіальна вибірка - відібрані за певною процедурою територіальні одиниці, в яких проводиться вибіркове обстеження.
Територіальна одиниця - адміністративно-територіальна одиниця України (наприклад: міста, селища міського типу, райони, сільради, тощо) або локальна територія, створена в межах адміністративно-територіальної одиниці (наприклад: переписні відділи, інструкторські дільниці, створені для проведення Всеукраїнського перепису населення; виборчі дільниці; території, що обслуговуються поштовими відділеннями, тощо).

1. ОСНОВНІ ПРИНЦИПИ ПОШИРЕННЯ РЕЗУЛЬТАТІВ ВИБІРКОВИХ ОБСТЕЖЕНЬ НАСЕЛЕННЯ (ДОМОГОСПОДАРСТВ) З ПИТАНЬ ЕКОНОМІЧНОЇ АКТИВНОСТІ НА ГЕНЕРАЛЬНУ СУКУПНІСТЬ

Державні статистичні спостереження - вибіркові обстеження населення (домогосподарств) з питань економічної активності в Україні проводяться на основі опитування сукупності неінституційних домогосподарств, що формується за процедурою стратифікованого багатоступеневого випадкового відбору. З 2004 року обсяг щомісячної вибірки становить 18,5 тис. домогосподарств, з яких 7,4 тис. домогосподарств відбираються з вибіркової сукупності домогосподарств обстеження сільськогосподарської діяльності в сільській місцевості. При цьому вибіркова сукупність домогосподарств представлена шістьма приблизно рівними частинами - ротаційними групами, кожна з яких є репрезентативною вибіркою з генеральної сукупності. Щомісяця дві ротаційні групи (третина вибіркової сукупності) за спеціальною схемою заміщуються двома іншими групами - однією новою та ротаційною групою, що була обстежена у відповідному місяці минулого року [3].
У кожному домогосподарстві, яке взяло участь в обстеженні, збирається демографічна інформація по всіх членах домогосподарства і спеціальна інформація щодо економічної активності, зайнятості та безробіття членів домогосподарств віком 15-70 років.
Для науково-обґрунтованого поширення результатів ОЕАН на генеральну сукупність розраховується система статистичних ваг обстежених осіб. Статистичні ваги призначені для врахування загальних імовірностей включення домогосподарств до вибірки, врахування фактичних рівнів відмов домогосподарств та окремих осіб від участі в обстеженні, гармонізації результатів обстеження з даними демографічної статистики щодо чисельності та статево-вікової структури населення тощо [4-6].
У загальному випадку кінцева вага i-ої особи, обстеженої в ОЕАН, розраховується як добуток базової ваги домогосподарства та відповідних вагових коефіцієнтів (коефіцієнтів коригування ваг) за формулою:
                   w  = w   * k   * ... * k  ,                 (1) 
                    i    Bi    1i          Ei 
     де w  - кінцева     вага     особи;   w   -   базова     вага 
         i                                  Bi 
домогосподарства, членом якого є особа;      k  , .., k   - вагові 
                                              1i       Ei 
коефіцієнти, E - кількість етапів коригування статистичних ваг. 
Система вагових коефіцієнтів повинна відображати ефекти впливу всіх етапів коригування ваг на кінцеві ваги осіб.
Для ОЕАН у 2004-2008 роках розрахунок системи статистичних ваг складається з наступних основних етапів:
- розрахунок базових ваг домогосподарств;
- коригування базових ваг для врахування відмінностей між теоретичною та фактичною кількостями відібраних домогосподарств;
- коригування ваг для врахування ступеня участі домогосподарств в обстеженні;
- коригування ваг для врахування ступеня участі осіб в обстеженні;
- коригування ваг для узгодження результатів обстеження з наявною зовнішньою інформацією;
- контроль якості системи ваг.
Етап розрахунку системи базових ваг домогосподарств є визначальним. Як уже відмічалось, призначення базових ваг - це врахування реального дизайну вибірки - принципів побудови, механізмів відбору тощо.
Базова вага є результатом певної послідовності розрахунків. Дизайн вибірки для ОЕАН у 2004-2008 роках обумовлює використання для побудови базових ваг наступних складових [3]:
- імовірність відбору одиниць першого ступеню P (1); 
                                                    1i 
- імовірність відбору одиниць другого ступеню P (2); 
                                                    2i 
- імовірність відбору домогосподарств у межах одиниць вибірки 
другого ступеню по міських поселеннях P . 
                                       3i 
---------------
(1) Одиницями відбору першого ступеню є міські поселення - окремі міста (міськради) або селища міського типу (селищні ради) та сільські ради по сільській місцевості.
(2) По міських поселеннях це інструкторські дільниці (або сукупності інструкторських дільниць), сформовані для проведення Всеукраїнського перепису населення 2001 року, у сільській місцевості - домогосподарства.
Базовою вагою домогосподарства, до якого належить i-та особа, є обернена величина добутку зазначених імовірностей:
                   - 
                   |        1 
                   | ---------------, по міських поселеннях; 
                   | P   * P   * P 
             1     |  1i    2i    3i 
       w   = -  = <                                            (2) 
        Bi   p     |     1 
              i    | ---------, по сільській місцевості; 
                   | P   * P 
                   |  1i    2i 
                   - 
     В ОЕАН величина загальної імовірності відбору p  визначається 
                                                    i 
виходячи  з  того,  що  кожне домогосподарство при відборі повинне 
мати однакову  ймовірність  потрапити  до  вибірки.  Вибірка,  яка 
побудована  з  урахуванням зазначеної умови,  є самозваженою.  Для 
забезпечення самозваженості вибірки ОЕАН величина p   визначається 
                                                   i 
за наступною формулою: 
                  - 
                  | P   * P   * P  , по міських поселеннях; 
                  |  1i    2i    3i 
        p  = f = <                                             (3) 
         i        | P   * P  , по сільській місцевості; 
                  |  1i    2i 
                  - 
     де f  - частка відбору домогосподарств,  яка для самозваженої 
вибірки дорівнює  відношенню  її  обсягу  до  загальної  кількості 
                                                    n 
домогосподарств   у   генеральній   сукупності (f = - ). Величина, 
                                                    N 
обернена до  f,  дорівнює  кількості  домогосподарств  генеральної 
сукупності,  яку  репрезентує  одне відібране домогосподарство при 
плануванні вибірки. 
У відповідності з формулою (3) кількість домогосподарств, які відбираються на останньому етапі формування вибірки по територіальній одиниці h, до якої належить i-та особа, (n ) визначається за наступним теоретичним співвідношенням:
  h(i) 
             - 
             | p  * N       f * N 
             |  i    3i          2i 
             | --------  = ---------, по міських поселеннях; 
             | P   * P     P   * P 
             |  1i    2i    1i    2i 
    n     = <                                                  (4) 
     h(i)    | p  * N       f * N 
             |  i    2i          1i 
             | --------  = ---------, по сільській місцевості; 
             |    P            P 
             |     1i           1i 
             - 
     де N   - загальна кількість  домогосподарств у територіальній 
         2i 
одиниці другого ступеню,  до якої належить i-те  домогосподарство, 
по міських поселеннях; N   - загальна  кількість домогосподарств у 
                        1i 
територіальній одиниці  першого  ступеню,  до  якої  належить i-те 
домогосподарство, по сільській місцевості. 
Базові ваги розраховуються на весь термін експлуатації вибірки. Територіальна вибірка для ОЕАН розрахована на п'ять років: 2004-2008 роки.
Теоретична кількість одиниць, яку необхідно відібрати по кожній територіальній одиниці при побудові вибірки і яка забезпечує самозваженість вибірки, залишається саме теоретичною, оскільки на практиці доводиться враховувати такі фактори, як умови роботи статистиків з проведення вибіркових обстежень населення, домогосподарств (далі - статистиків з обстежень) (3), очікувані рівні участі домогосподарств та осіб в ОЕАН, а також виправляти певні похибки в основі вибірки або у процедурах відбору. Тому необхідно скоригувати базові ваги з урахуванням фактичної кількості відібраних домогосподарств. Це здійснюється шляхом введення спеціального коефіцієнту коригування ваг для врахування фактичної кількості відібраних домогосподарств.
---------------
(3) Наприклад, забезпечувати їх рівномірну завантаженість.
Якість результатів ОЕАН може суттєво погіршуватися внаслідок впливу такого явища як відмови домогосподарств та осіб від обстеження. Це явище призводить до викривлення параметрів вибіркової сукупності, що побудована як самозважена, у порівнянні з параметрами генеральної сукупності. Зокрема, при обстеженнях населення у вибірці спостерігається надлишок представників старших вікових груп обох статей і не вистачає представників молодших вікових груп, серед яких кількість відмов значно вища і, крім того, яких важче застати вдома. Якщо не враховувати ці викривлення, то, відповідно, всі характеристики домогосподарств будуть зміщені в бік домогосподарств, що включають осіб старшого та похилого віку або складаються лише з таких осіб. Особливо це стосується територій зі значними рівнями відмов.
Одним з найбільш розповсюджених і теоретично обґрунтованих методів врахування випадків неодержання відповідей при обробці даних вибіркових обстежень є коригування статистичних ваг, сутність якого полягає в завищенні ваг одиниць, які мають характеристики, аналогічні характеристикам одиниць, що не були обстежені.
Коригування ваг для компенсації відмов включає розділення вибірки на систему комірок (класів зважування) та розрахунок коефіцієнту для коригування ваг одиниць по кожній комірці як частки відповідей. Процедура коригування ваг включає наступні кроки:
- розділення вибіркової сукупності домогосподарств на групи (комірки зважування), що охоплюють всю цю сукупність і не перетинаються;
- обчислення ступеня участі одиниць в обстеженні для кожної комірки;
- визначення єдиного коефіцієнту коригування ваг для всіх одиниць комірки як величини, оберненої до рівня участі домогосподарств в обстеженні по комірці.
Комірки для коригування ваг формуються як за змінними дизайну вибірки (тобто, на основі зовнішньої інформації, що використовується при формуванні вибірки, прикладами якої є: адміністративно-територіальний поділ України, тип населених пунктів тощо), так і за змінними, визначеними за результатами обстеження (тип домогосподарства, кількість членів домогосподарства тощо).
Для узгодження результатів вибіркового обстеження з наявною додатковою інформацією щодо певних характеристик генеральної сукупності здійснюється спеціальне коригування системи статистичних ваг.
Доцільність узгодження результатів обстеження з зовнішньою інформацією обумовлюється такими обставинами:
1) оцінки показників за результатами вибіркового обстеження завжди характеризуються певною похибкою, джерелами якої є несуцільність обстеження (похибка вибірки) і наявність так званих невибіркових похибок;
2) вибіркове обстеження населення не може забезпечити оцінок певних характеристик генеральної сукупності, наприклад, оцінки загальної чисельності населення або загальної кількості домогосподарств. Хоча ці оцінки й отримуються за результатами обстеження, вони відображають головним чином параметри, що були закладені при формуванні вибірки;
3) основні характеристики генеральної сукупності змінюються у часі і відповідно окремі з них на момент завершення обробки даних обстеження дещо відрізняються від таких, якими вони були під час організації обстеження.
Найбільш обґрунтованим шляхом вирішення всіх цих проблем є коригування статистичних ваг домогосподарств. Статистико-математичні методи, що застосовуються в теперішній час для коригування системи статистичних ваг з метою узгодження результатів обстежень з додатковою інформацією, мають загальну назву методів калібрації [7]. Калібрація системи статистичних ваг полягає у її трансформації (коригуванні) шляхом вирішення математичної задачі мінімізації спеціальної функції відстані між калібраційними вагами та вагами, що коригуються, за умови, що калібраційні ваги забезпечують оцінки показників для генеральної сукупності або її частин, які відомі з зовнішніх даних. Окремим спрощеним варіантом калібрації є метод постстратифікації, який застосовується у випадку, коли наявні надійні зовнішні дані по певних стратах (комірках) генеральної сукупності, які охоплюють всю сукупність і не перетинаються. Зазначені страти, як правило, відрізняються від страт, що були побудовані при формуванні вибіркової сукупності. За таких умов коефіцієнти для коригування системи ваг визначаються по кожній страті окремо, як відношення значення показника за зовнішніми даними до оцінки показника за результатами обстеження або як коефіцієнти, що приводять структуру генеральної сукупності за результатами обстеження до її структури за зовнішніми даними.
За останні роки розроблено методологічні основи, методики, процедури, що дозволяють ефективно коригувати статистичні ваги для забезпечення узгодженості результатів обстеження з додатковою інформацією, накопичено значний досвід з питань аналізу зовнішніх джерел даних.
Для постстратифікації статистичних ваг в обстеженнях економічної активності використовуються, насамперед, дані демографічної статистики щодо чисельності, розміщення та статево-вікової структури населення у працездатному віці.
Важливою перевагою використання системи ваг є те, що це дозволяє об'єднувати результати різних вибіркових обстежень на мікрорівні. При обстеженні населення з питань економічної активності об'єднуються щомісячні дані, отримані за різними вибірками. А саме дані, отримані на основі вибірки, побудованої виключно для цілей ОЕАН, з даними, отриманими по сільських домогосподарствах, що крім ОЕАН підлягають обстеженню за програмою вибіркового обстеження їх сільськогосподарської діяльності (ОСГД). Це вимагає відповідного коригування системи ваг.
Для ідеальної самозваженої вибірки (при ідеальній реалізації всіх процедур відбору та всіх етапів обстеження) потреби в аналізі системи ваг немає, оскільки ваги всіх одиниць вибірки однакові. На практиці вибірка завжди відхиляється від стану самозваженості за рахунок таких факторів, як наявність у списках для відбору адрес неіснуючих домогосподарств, відхилення навантаження статистиків з обстежень від теоретично визначеної величини, відмов домогосподарств та одиниць від обстеження, що мають різний рівень в різних територіальних одиницях, тощо. У зв'язку з впливом ваг на якість оцінок показників постає нестандартна проблема жорсткого контролю за якістю самих ваг. У державних обстеженнях населення необхідно аналізувати якість системи ваг і використовувати всі можливості для її поліпшення.
У відповідності з наведеними принципами, побудовано порядок розрахунку системи ваг ОЕАН, який схематично представлений на рис. 1.
         за вибіркою ОЕАН                  за вибіркою ОСГД 
 --------------------------------- --------------------------------- 
 |    Розрахунок базових ваг     | |    Розрахунок базових ваг.    | 
 |                               | |  Контроль якості базових ваг  | 
 --------------------------------- --------------------------------- 
                |                                  | 
 ---------------------------------                 | 
 |Коригування ваг домогосподарств|                 | 
 |   для врахування фактичних    |                 | 
 |    імовірностей відбору.      |                 | 
 |     Контроль якості ваг       |                 | 
 ---------------------------------                 | 
                |                                  | 
 --------------------------------- --------------------------------- 
 |Коригування ваг домогосподарств| |Коригування ваг домогосподарств| 
 |     для врахування відмов     | |     для врахування відмов     | 
 |домогосподарств від обстеження.| |домогосподарств від обстеження.| 
 |     Контроль якості ваг       | |     Контроль якості ваг       | 
 --------------------------------- --------------------------------- 
                |                                  | 
 --------------------------------- --------------------------------- 
 |   Коригування ваг осіб для    | |   Коригування ваг осіб для    | 
 |  врахування відмов осіб від   | |  врахування відмов осіб від   | 
 |         обстеження.           | |         обстеження.           | 
 |     Контроль якості ваг       | |     Контроль якості ваг       | 
 --------------------------------- --------------------------------- 
                |                                  | 
 --------------------------------- --------------------------------- 
 |   Коригування ваг осіб для    | |   Коригування ваг осіб для    | 
 |  врахування статево-вікової   | |  врахування статево-вікової   | 
 |          структури.           | |          структури.           | 
 |     Контроль якості ваг       | |     Контроль якості ваг       | 
 --------------------------------- --------------------------------- 
                |                                  | 
                |          ЗЛИТТЯ ДАНИХ            | 
                |                                  | 
                ----------------- ------------------ 
                                | | 
               --------------------------------------- 
               |Коригування ваг при об'єднанні даних,| 
               |    отриманих за вибіркою ОЕАН       | 
               |       та за вибіркою ОСГД           | 
               --------------------------------------- 
                                 | 
               --------------------------------------- 
               | Коригування ваг осіб для врахування | 
               |      статево-вікової структури.     | 
               |        Контроль якості ваг          | 
               --------------------------------------- 
        Рис. 1. Етапи розрахунку статистичних ваг для ОЕАН 

2. ПОРЯДОК РОЗРАХУНКУ СКЛАДОВИХ СИСТЕМИ ВАГ ОЕАН

     2.1. Розрахунок базової ваги домогосподарств 
     2.1.1. Розрахунок  базової   ваги   домогосподарств   міських 
поселень 
     Визначення імовірності відбору одиниць першого ступеня P 
                                                             1i 
     А. Саморепрезентативні міські поселення 
     Великі міста 
     Саморепрезентативними є одиниці  відбору  першого  ступеня  з 
розміром   (чисельністю   населення)   вище  встановленого  порогу 
саморепрезентативності.   Для    таких   одиниць  відбору P   = 1. 
                                                           1i 
Порогове значення чисельності n  визначається за формулою: 
                               p 
                              N 
                         n  = - * m * m ;                      (5) 
                          p   n        f 
     де n  -  обсяг  квартальної  вибірки,  домогосподарств;  m  - 
квартальне  навантаження   статистика   з   обстежень   (кількість 
домогосподарств,  яка  має  бути  обстежена  одним  статистиком  з 
обстежень   протягом   одного   кварталу),  домогосподарств;  m  - 
                                                               f 
середній розмір домогосподарства,  осіб;  N  -  обсяг  генеральної 
сукупності, домогосподарств. 
     Для міських  поселень  з чисельністю населення 100 тис.  осіб 
параметри  ОЕАН  мають  наступні  значення:   загальна   кількість 
неінституційних домогосподарств  в  Україні  N  = 17609000;  обсяг 
вибірки ОЕАН n     = 31800; навантаження статистика з обстежень  в 
              ОЕАН 
ОЕАН m     = 72 домогосподарства; середній розмір домогосподарства 
      ОЕАН 
m  = 2,62 особи. Поріг саморепрезентативності: 
 f 
         n  = 553,75 * 72 * 2,62 приблизно = 104500 чол.       (6) 
          p 
Таким чином, міські поселення з чисельністю населення n >= 104,5 тис.чол. (саморепрезентативні міста) включалися у вибірку з імовірністю, рівною одиниці.
     Малі міста 
     Враховуючи, що  за  принципами  організації  ОЕАН  квартальне 
навантаження  статистиків з обстежень у малих містах нижче,  ніж у 
великих,  відповідно  54  і  72  домогосподарства,  то   необхідно 
виділити саморепрезентативні малі міста,  які також включаються до 
вибірки з    імовірністю     рівною     одиниці.     Для     малих 
m     = 54   домогосподарства;   середній  розмір домогосподарства 
 ОЕАН 
m  = 2,65 особи. 
 f 
Поріг саморепрезентативності n :
                                   p2 
         n   = 553,75 * 54 * 2,65 приблизно = 79242 чол.       (7) 
          p2 
     Таким чином,  у вибірці 2004-2008 років для ОЕАН представлені 
всі міські поселення з чисельністю населення більше 79 тисяч осіб. 
     Б. Несаморепрезентативні міські поселення 
     Несаморепрезентативні міські поселення відбирались по кожному 
регіону      (по      кожній     страті)     окремо.     Кількість 
несаморепрезентативних міст  (a),  яку   необхідно   відібрати   у 
регіоні,  визначалась  шляхом  ділення  чисельності населення всіх 
несаморепрезентативних міст регіону на навантаження  статистика  з 
обстежень  в цих містах (m     = 54 домогосподарства)  та середній 
                          ОЕАН 
розмір домогосподарств в них (m  = 2,65 особи). 
                               f 
Для міських поселень з населенням менше 79 тисяч осіб імовірність відбору у регіоні розраховується за формулою:
                                   M 
                                    альфа 
                    P   = (a * ------------),                  (8) 
                     1i          S   M 
                               альфа  альфа 
     де: a - кількість  відібраних   малих    міст     у  регіоні; 
M      -  чисельність  населення  міста,  для якого розраховується 
 альфа 
P  ;     S   M       -      загальна     чисельність     населення 
 1i    альфа  альфа 
несаморепрезентативних малих міст у регіоні; S - знак суми. 
     Визначення імовірності відбору одиниць другого ступеня P 
                                                             2i 
     Імовірність   відбору    одиниць   другого   ступеня  P   (по 
                                                            2i 
міських поселеннях   -   це  території  інструкторських  дільниць, 
створених для   проведення   Всеукраїнського   перепису  населення 
2001 року) розраховується за формулою: 
                                   M 
                                    бета 
                    P   = (b * -----------),                   (9) 
                     2i          S   M 
                                бета  бета 
     де: b -  кількість  ВТОВ,  відібраних  у  конкретному  місті; 
M     -  чисельність  постійного   населення  за даними перепису у 
 бета 
ВТОВ,   для   якої    розраховується   P  ;   S   M     - загальна 
                                        2i   бета  бета 
чисельність населення у відібраному місті; S - знак суми. 
     Якщо розміри територіальних одиниць другого  ступеня  суттєво 
відрізняються   у  межах  міста,  може  виникнути  ситуація,  коли 
ймовірність відбору P   буде   дорівнювати,    або    перевищувати 
                     2i 
одиницю. У такому випадку ймовірність відбору ВТОВ приймається  за 
одиницю,  її  чисельність  населення  віднімається  від  загальної 
чисельності населення міста,  а при розрахунку ймовірності відбору 
інших  ВТОВ,  b  зменшується  на  одиницю.  Тобто,  така велика за 
чисельністю населення ВТОВ враховується як саморепрезентативна. 
     Загальна імовірність включення до вибірки ВТОВ розраховується 
як    добуток   імовірностей  P   і  P    для  кожної   ВТОВ.  При 
                               1i     2i 
формуванні вибірки   необхідно  аналізувати  загальні  імовірності 
відбору ВТОВ для виявлення можливих похибок,  які  відображаються, 
зокрема,  у вигляді окремих нестандартних значень (аутлайєрів), що 
суттєво відрізняються від середнього значення імовірності і можуть 
призвести до погіршення якості системи ваг. 
У випадку виявлення аутлайєрів застосовуються спеціальні процедури їх коригування, зокрема, процедури імпутації.
     Визначення імовірності відбору домогосподарств P 
                                                     3i 
Теоретична імовірність відбору i-го домогосподарства в межах відібраної ВТОВ розраховується, виходячи з формули:
                                   f 
                        P   = -----------,                    (10) 
                         3i   (P   * P  ) 
                                1i    2i 
де f- частка відбору домогосподарств.
За таких умов базова вага, однакова для всіх домогосподарств, визначається за формулою:
                                 1          1 
                    w   = --------------- = -.                (11) 
                     Bi   P   * P   * P     f 
                           1i    2i    3i 
     2.1.2. Розрахунок  базової  ваги  домогосподарств   сільської 
місцевості 
     Визначення імовірності відбору одиниць першого ступеня P 
                                                             2i 
     Імовірність включення  до  вибірки  одиниць  першого  ступеня 
відбору у   сільській   місцевості (сільських  рад) P   по кожному 
                                                     1i 
району розраховується за формулою: 
                                    M 
                                     c 
                        P   = (c * ----),                     (12) 
                         1i        S M 
                                    c  c 
     де: c   -   кількість  відібраних  сільських  рад  у  районі; 
M  -  кількість домогосподарств  відібраної   сільської  ради, для 
 c 
якої розраховується P  ; S M  - загальна кількість домогосподарств 
                     1i  c  c 
у сільському районі; S - знак суми. 
     Визначення імовірності відбору домогосподарств P 
                                                     2i 
Теоретична імовірність відбору i-го домогосподарства відібраної сільської ради розраховується за формулою (див. формулу 3):
                                   f 
                            P   = ---.                        (13) 
                             2i   P 
                                   1i 
За таких умов базова вага, однакова для всіх домогосподарств, дорівнює:
                                 1       1 
                       w   = --------- = -.                   (14) 
                        Bi   P   * P     f 
                              1i    2i 
     2.1.3. Розрахунок частки відбору домогосподарств f 
     При формуванні вибіркової сукупності домогосподарств для ОЕАН 
                                                 n 
                                                  ОЕАН     31800 
у 2004  році  частка   відбору   дорівнювала f = ----- = --------. 
                                                   N     17609200 
Ця величина розрахована як відношення обсягу вибіркової сукупності 
ОЕАН  (визначеного  з  урахуванням  рівня  надійності  результатів 
обстеження,  який  необхідно  забезпечити,  вартості обстеження та 
очікуваного рівня участі домогосподарств та осіб в обстеженні), до 
оцінки   загальної  кількості  неінституційних  домогосподарств  в 
Україні (визначеної з використанням даних Всеукраїнського перепису 
населення,   даних   демографічної  статистики,  даних  соціальної 
статистики, даних попередніх обстежень ОЕАН та ОУЖД та ін.). Таким 
чином,   базова   вага     домогосподарств   в    ОЕАН    дорівнює 
      1 
w   = - приблизно = 554. 
 Bi   f 
     Доцільно зазначити,     що     величина     частки    відбору 
домогосподарств f  за  своїм  змістом  суттєво  відрізняється  від 
величини   загальної  імовірності  включення  домогосподарства  до 
вибірки p ,  хоча для  самозваженої  вибірки  ОЕАН  і приймається, 
         i 
що p  = f. При розрахунку    системи    статистичних    ваг   ОЕАН 
    i 
використовується,  насамперед,  величина p  та  її   складові.  Це 
                                          i 
пояснюється   тим,   що   в  процесі  побудови  вибірки  необхідно 
контролювати  величини   імовірностей   відбору   одиниць   різних 
ступенів,  оцінювати  відхилення  теоретичних імовірностей відбору 
домогосподарств від фактичних тощо. 
2.2. Врахування фактичної імовірності відбору
Фактичні імовірності відбору домогосподарств в межах територіальних одиниць можуть відрізнятися від теоретичних, оскільки на практиці необхідно враховувати різницю в умовах роботи статистиків з обстежень. Наприклад, в ОЕАН прийнято, що у великих містах квартальне навантаження статистика з обстежень складає 72 домогосподарства, він обстежує дві ВТОВ, в кожній з яких відбирається по 36 домогосподарств, а у малих містах - 54 домогосподарства, статистик обстежує дві ВТОВ, в яких відбирається по 27 домогосподарств (див. рис. 2 (va520202-06) ).
Тому необхідно скоригувати базові ваги домогосподарств з урахуванням фактичної імовірності відбору.
2.2.1. Розрахунок коефіцієнтів врахування фактичної імовірності відбору домогосподарств
Коефіцієнт урахування фактичної імовірності відбору i-го домогосподарства k розраховується за формулою:
                  1i 
                         - 
                         | P 
                         |  3i 
                         | --- по міських поселеннях 
                         | P 
                         |  fi 
                  k   = <                             ,       (15) 
                   1i    | P 
                         |  2i 
                         | --- по сільській місцевості 
                         | P 
                         |  fi 
                         - 
     де P   - фактична імовірвірність   відбору   домогосподарства 
         fi 
в межах     територіальної   одиниці.  Величина  P    визначається 
                                                  fi 
за формулою: 
                                  n 
                                   f 
                           P   = ----,                        (16) 
                            fi    N 
                                   f 
     де n  - фактична   кількість   домогосподарств,  що відібрані 
         f 
для обстеження у  територіальній  одиниці; N  - загальна кількість 
                                            f 
домогосподарств у територіальній одиниці. 
Рис. 2. Фактична кількість відібраних домогосподарств та теоретична кількість домогосподарств для відбору по міських ВТОВ Івано-Франківської області для ОЕАН у 2004-2008 рр. (va520202-06)
     2.2.2. Розрахунок ваг домогосподарств з урахуванням фактичних 
імовірностей відбору домогосподарств 
     Після визначення       коефіцієнтів   коригування    ваг  k 
                                                                1i 
розраховуються нові ваги домогосподарств w   за формулою: 
                                          1i 
                         w   = w   * k  .                     (17) 
                          1i    Bi    1i 
Статистичні ваги після врахування фактичних імовірностей відбору домогосподарств однакові в межах кожної окремої міської ВТОВ і кожної окремої сільської ПТОВ.
2.3. Врахування відмов домогосподарств від обстеження
Для врахування відмов домогосподарств від обстеження будується спеціальна система комірок. Система комірок - це система ознак для групування за ними одиниць генеральної та (або) вибіркової сукупностей. Головні завдання, що вирішуються при побудові системи комірок, це врахування при коригуванні статистичних ваг домогосподарств особливостей територіального охоплення вибірки і забезпечення певної кількості домогосподарств у кожній комірці.
При побудові системи комірок в ОЕАН використовуються наступні класифікаційні змінні:
- регіон - 27 дискретних значень (Автономна Республіка Крим, 24 області України, м. Київ, м. Севастополь);
- тип місцевості - 2 дискретних значення (міські поселення, сільська місцевість).
Крім того, враховується ступінь територіальної близькості груп домогосподарств, що включені до певної комірки.
Використання зазначеної вище інформації при побудові системи комірок реалізується шляхом об'єднання окремих територіальних одиниць за спеціальною схемою: відповідно ВТОВ у міських поселеннях і ПТОВ у сільській місцевості.
Встановлена мінімальна кількість домогосподарств, що були обстежені в кожній комірці, дорівнює 50. Якщо у деякій комірці кількість опитаних домогосподарств менша встановленої величини, ця комірка об'єднується з іншою (суміжною), що відноситься до тієї ж адміністративно-територіальної одиниці. Таким чином для кожного конкретного обстеження будується окрема система комірок для коригування статистичних ваг домогосподарств.
     Загальна кількість домогосподарств у  комірці n  визначається 
                                                    l 
за результатами    проведення    відбору    домогосподарств     по 
територіальних   одиницях.   При   цьому   з  загальної  кількості 
домогосподарств  у  комірці  виключаються  нежитлові   приміщення, 
зачинені приміщення та неіснуючі адреси. 
     2.3.1. Розрахунок      коефіцієнтів     врахування     відмов 
домогосподарств від обстеження 
     Коефіцієнт урахування      відмов     домогосподарств     від 
обстеження k   розраховується по кожній l-ій комірці за формулою: 
            2i 
                            n 
                            S  w   * лямбда 
                           i=1  1i         li 
                 k   = --------------------------,            (18) 
                  2i    n 
                        S  w   * лямбда   * ета 
                       i=1  1i         li      li 
                    - 
                    |1, якщо i входить в M ; 
                    |                     l 
     де лямбда   = < 
              li    |0, якщо i не входить в M ; 
                    |                        l 
                    - 
     M - множина домогосподарств l-ої комірки; 
      l 
              - 
              |1, якщо домогосподарство взяло участь в обстеженні; 
     ета   = < 
        li    |0, якщо домогосподарство відмовилось від обстеження; 
              - 
S - знак суми.
Величини коефіцієнтів урахування відмов домогосподарств від 
обстеження k однакові в межах кожної окремої комірки. 
            2i 
2.3.2. Розрахунок ваг домогосподарств з урахуванням відмов домогосподарств від обстеження
Ваги домогосподарств з урахуванням відмов домогосподарств від обстеження w розраховуються за формулою:
            2i 
                         w   = w   * k  .                     (19) 
                          2i    1i    2i 
2.4. Врахування відмов осіб від обстеження
Для врахування відмов від інтерв'ю окремих осіб в межах обстежених домогосподарств будується система комірок.
Код комірки визначається аналогічно коду комірки для врахування відмов домогосподарств від обстеження. Комірки нумеруються, починаючи з одиниці.
     Загальна кількість    осіб  у  комірці n    визначається   за 
                                             p 
результатами проведення інтерв'ю за поточний місяць. 
     2.4.1. Розрахунок коефіцієнтів  урахування  відмов  осіб  від 
обстеження 
     Коефіцієнт урахування  відмов  осіб    від    обстеження  k 
                                                                3i 
розраховується по кожній p-ій комірці за формулою: 
                            n 
                            S  w   * лямбда 
                           i=1  2i         pi 
                 k   = --------------------------,            (20) 
                  3i    n 
                        S  w   * лямбда   * ета 
                       i=1  2i         pi      pi 
                    - 
                    |1, якщо p входить в M ; 
                    |                     p 
     де лямбда   = < 
              pi    |0, якщо p не входить в M ; 
                    |                        p 
                    - 
M - множина домогосподарств p-ої комірки; 
      p 
              - 
              |1, якщо особа взяла участь у обстеженні; 
     ета   = < 
        pi    |0, якщо особа відмовилось від участі в обстеженні; 
              - 
S - знак суми. 
Величини коефіцієнтів урахування відмов осіб від обстеження однакові в межах кожної окремої комірки.
     2.4.2. Розрахунок ваг з урахуванням відмов осіб від інтерв'ю 
     Ваги осіб  з урахуванням    відмов    від     інтерв'ю    w 
                                                                3i 
розраховуються за формулою: 
                         w   = w   * k  .                     (21) 
                          3i    2i    3i 
2.5. Усунення постстратифікаційних ефектів
Для усунення постстратифікаційних ефектів будується система комірок за такими класифікаційними змінними:
- регіон - 27 дискретних значень (25 областей, м. Київ та м. Севастополь);
- тип місцевості - 2 дискретних значення (міські поселення, сільська місцевість);
- стать респондента - 2 дискретних значення (жіноча, чоловіча);
- вікова група, до якої входить респондент - 11 дискретних значень (15-19 років, 20-24 роки, 25-29 років, 30-34 роки, 35-39 років, 40-44 роки, 45-49 років, 50-54 роки, 55-59 років, 60-64 роки, 65-70 років).
     2.5.1. Визначення коду комірки c . 
                                     q 
Код комірки розраховується за формулою:
   с  = ознака регіону * 1000 + ознака типу місцевості * 100 + 
    q 
            + ознака статі * 10 + ознака вікової групи 
Комірки нумеруються, починаючи з одиниці після упорядкування їх за кодом.
     Загальна кількість    осіб  у   комірці n   визначається   за 
                                              q 
результатами проведення інтерв'ю за поточний місяць. 
     Загальна кількість  осіб  генеральної  сукупності  у  комірці 
N  визначається один  раз  на    рік   за   даними   демографічної 
 q 
статистики на 1 січня поточного року. 
2.5.2. Розрахунок коефіцієнтів коригування ваг для усунення постстратифікаційних ефектів
     Коефіцієнти для   усунення   постстратифікаційних ефектів k 
                                                                4i 
розраховуються по кожній q-ій комірці за формулою: 
                                  N 
                                   q 
                    k   = -------------------,                (22) 
                     4q    S  w   * лямбда 
                           r   3r         qr 
                    - 
                    |1, якщо q входить в M ; 
                    |                     q 
     де лямбда   = < 
              qr    |0, якщо q не входить в M ; 
                    |                        q 
                    - 
     де M - множина осіб q-ої комірки; 
         q 
     S - знак суми. 
     Величини коефіцієнтів    урахування  відмов  осіб   від   k 
                                                                4i 
обстеження однакові в межах кожної окремої комірки. 
Ілюстративні результати розрахунку коефіцієнтів для усунення постстратифікаційних ефектів наведено у додатку А.
2.5.3. Розрахунок ваг осіб з урахуванням коефіцієнтів для усунення постстратифікаційних ефектів
     Ваги осіб   після   усунення постстратифікаційних ефектів w 
                                                                4i 
розраховуються за формулою: 
                         w   = w   * k  .                     (23) 
                          4i    3i    4i 

3. ОБ'ЄДНАННЯ ДАНИХ, ОТРИМАНИХ ЗА ОСНОВНОЮ ВИБІРКОЮ ТА ЗА ВИБІРКОЮ ОБСТЕЖЕННЯ СІЛЬСЬКОГОСПОДАРСЬКОЇ ДІЯЛЬНОСТІ ДОМОГОСПОДАРСТВ

Однією з відмінностей побудови вибірки ОЕАН для обстежень 2004-2008 років у порівнянні з вибіркою, діючою у 1999-2003 роках є те, що у сільській місцевості вибірка охоплює всі сільські райони. До цього обстежувались лише 189 випадково відібраних районів.
Формування вибірки домогосподарств у сільській місцевості здійснюється за рахунок двох складових - вибірки безпосередньо для ОЕАН та вибірки для обстеження домогосподарств з питань їх сільськогосподарської діяльності.
Тому виникає необхідність в об'єднанні даних ОЕАН, отриманих на базі основної вибірки та вибірки обстеження сільськогосподарської діяльності домогосподарств (ОСГД). Процедура здійснюється із застосуванням методу приєднання даних на мікрорівні, тобто на рівні осіб. Цей підхід використовується в умовах, коли вибіркові дані по одиницях однакового рівня (членів домогосподарств віком 15-70 років) та за однаковими ознаками (за ідентичними анкетами) одержуються на основі різних методів побудови вибірки. При побудові вибірки обстеження сільськогосподарської діяльності домогосподарств відбір сільських рад здійснюється пропорційно площі земель.
Схема процедури приєднання даних наведена нарис. 3 (va520202-06) .
Рис. 3. Схема об'єднання щомісячних даних ОЕАН за основною вибіркою та за вибіркою ОСГД в єдиний масив (va520202-06)
     Результуючі ваги   осіб,  розраховані  окремо  по  кожному  з 
масивів,  коригуються в межах сільської місцевості кожного регіону 
з використанням коефіцієнтів ФІ   для зайнятого населення та  ФІ 
                               ЗН                               БР 
                                                       ^      ^ 
для безробітного  населення [7].  Оцінки  коефіцієнтів ФІ   і ФІ 
                                                         ЗН     БР 
і визначаються з умов  мінімізації  загальної  похибки  оцінювання 
показників  чисельності  зайнятого  та  безробітного  населення за 
об'єднаним масивом даних: 
                      2 ^(ОСГД) 
                    SE (Y      ) 
     ^                   ЗН 
     ФІ   = --------------------------- для зайнятого населення; 
       ЗН     2 ^(ОЕАН)      2 ^(ОСГД) 
            SE (Y      ) + SE (Y      ) 
                 ЗН             ЗН 
                                                              (24) 
                     2 ^(ОСГД) 
                   SE (Y      ) 
    ^                   БР 
    ФІ   = --------------------------- для безробітного населення; 
      БР     2 ^(ОЕАН)      2 ^(ОСГД) 
           SE (Y      ) + SE (Y      ) 
                БР             БР 
            ^(ОЕАН) 
     де  SE(Y      ) -   стандартна   похибка   оцінки чисельності 
             ЗН 
                        ^(ОЕАН)                         ^(ОСГД) 
зайнятого   населення   Y        за   вибіркою ОЕАН; SE(Y      ) - 
                         ЗН                              ЗН 
стандартна похибка   оцінки   чисельності   зайнятого    населення 
 ^(ОСГД)                             ^(ОЕАН) 
(Y      )   за   вибіркою  ОСГД;  SE(Y      ) - стандартна похибка 
  ЗН                                  БР 
                                                 ^(ОЕАН) 
оцінки чисельності   безробітного    населення  (Y      )       за 
                                                  БР 
                      ^(ОСГД) 
вибіркою   ОЕАН;   SE(Y      ) - стандартна     похибка     оцінки 
                       БР 
                                    ^(ОСГД) 
чисельності безробітного населення (Y      ) за вибіркою ОСГД. 
                                     БР 
                 ^       ^ 
     Коефіцієнти ФІ   і  ФІ   розраховуються щомісяця по   кожному 
                   ЗН      БР 
регіону окремо.  У  табл.  1  для  ілюстрації  наведені   значення 
             ^       ^ 
коефіцієнтів ФІ   і  ФІ    для місяців першого кварталу 2005 року. 
               ЗН      БР 
     Коефіцієнт коригування   системи     статистичних    ваг  k 
                                                                5i 
розраховується в межах кожного регіону у два етапи. 
     На першому етапі величина k   розраховується для  зайнятих та 
                                5i 
безробітних осіб сільської місцевості за формулою: 
             - 
             | ^ 
             | ФІ   для зайнятих осіб за вибіркою ОЕАН; 
             |   ЗН 
             | 
             | ^ 
             | ФІ   для безробітних осіб за вибіркою ОЕАН; 
             |   БР 
      k   = <                                                 (25) 
       5i    |     ^ 
             |(1 - ФІ  ) для зайнятих осіб за вибіркою ОСГД; 
             |       ЗН 
             | 
             |     ^ 
             |(1 - ФІ  ) для безробітних осіб за вибіркою ОСГД. 
             |       БР 
             - 
Розраховуються скориговані статистичні ваги зайнятих і безробітних осіб по сільській місцевості кожного регіону за формулою:
                         w   = w   * k  .                     (26) 
                          5i    4i    5i 
                                             ^      ^ 
          Таблиця 1. - Значення коефіцієнтів ФІ   і ФІ 
                                               ЗН     БР 
            при об'єднанні даних ОЕАН та ОСГД у січні, 
                   лютому та березні 2005 року 
------------------------------------------------------------------ 
|      Регіон      |          ^           |          ^           | 
|                  |          ФІ          |          ФІ          | 
|                  |            ЗН        |            БР        | 
|                  |----------------------+----------------------| 
|                  |січень|лютий |березень|січень|лютий |березень| 
|------------------+------+------+--------+------+------+--------| 
|АР Крим           | 0,38 | 0,37 |  0,40  | 0,32 | 0,16 |  0,09  | 
|------------------+------+------+--------+------+------+--------| 
|Вінницька область | 0,43 | 0,42 |  0,43  | 0,37 | 0,32 |  0,23  | 
|------------------+------+------+--------+------+------+--------| 
|Волинська область | 0,49 | 0,52 |  0,51  | 0,36 | 0,50 |  0,48  | 
|------------------+------+------+--------+------+------+--------| 
|Дніпропетровська  | 0,41 | 0,43 |  0,44  | 0,14 | 0,24 |  0,44  | 
|область           |      |      |        |      |      |        | 
|------------------+------+------+--------+------+------+--------| 
|Донецька область  | 0,39 | 0,37 |  0,39  | 0,25 | 0,35 |  0,38  | 
|------------------+------+------+--------+------+------+--------| 
|Житомирська       | 0,48 | 0,46 |  0,46  | 0,42 | 0,39 |  0,50  | 
|область           |      |      |        |      |      |        | 
|------------------+------+------+--------+------+------+--------| 
|Закарпатська      | 0,43 | 0,41 |  0,39  | 0,47 | 0,24 |  0,27  | 
|область           |      |      |        |      |      |        | 
|------------------+------+------+--------+------+------+--------| 
|Запорізька область| 0,44 | 0,41 |  0,44  | 0,68 | 0,30 |  0,30  | 
|------------------+------+------+--------+------+------+--------| 
|Івано-Франківська | 0,48 | 0,47 |  0,45  | 0,28 | 0,36 |  0,50  | 
|область           |      |      |        |      |      |        | 
|------------------+------+------+--------+------+------+--------| 
|Київська область  | 0,41 | 0,41 |  0,40  | 0,71 | 0,45 |  0,48  | 
|------------------+------+------+--------+------+------+--------| 
|Кіровоградська    | 0,43 | 0,43 |  0,42  | 0,24 | 0,53 |  0,54  | 
|область           |      |      |        |      |      |        | 
|------------------+------+------+--------+------+------+--------| 
|Луганська область | 0,39 | 0,39 |  0,45  | 0,45 | 0,14 |  0,16  | 
|------------------+------+------+--------+------+------+--------| 
|Львівська область | 0,46 | 0,46 |  0,45  | 0,45 | 0,46 |  0,44  | 
|------------------+------+------+--------+------+------+--------| 
|Миколаївська      | 0,48 | 0,45 |  0,45  | 0,66 | 0,68 |  0,76  | 
|область           |      |      |        |      |      |        | 
|------------------+------+------+--------+------+------+--------| 
|Одеська область   | 0,43 | 0,43 |  0,41  | 0,37 | 0,19 |  0,37  | 
|------------------+------+------+--------+------+------+--------| 
|Полтавська область| 0,43 | 0,46 |  0,45  | 0,25 | 0,28 |  0,29  | 
|------------------+------+------+--------+------+------+--------| 
|Рівненська область| 0,46 | 0,46 |  0,46  | 0,39 | 0,45 |  0,49  | 
|------------------+------+------+--------+------+------+--------| 
|Сумська область   | 0,40 | 0,40 |  0,38  | 0,26 | 0,31 |  0,31  | 
|------------------+------+------+--------+------+------+--------| 
|Тернопільська     | 0,45 | 0,47 |  0,47  | 0,34 | 0,59 |  0,59  | 
|область           |      |      |        |      |      |        | 
|------------------+------+------+--------+------+------+--------| 
|Харківська область| 0,46 | 0,46 |  0,44  | 0,49 | 0,61 |  0,29  | 
|------------------+------+------+--------+------+------+--------| 
|Херсонська область| 0,49 | 0,50 |  0,47  | 0,70 | 0,83 |  0,37  | 
|------------------+------+------+--------+------+------+--------| 
|Хмельницька       | 0,43 | 0,43 |  0,41  | 0,23 | 0,40 |  0,32  | 
|область           |      |      |        |      |      |        | 
|------------------+------+------+--------+------+------+--------| 
|Черкаська область | 0,41 | 0,40 |  0,41  | 0,21 | 0,23 |  0,28  | 
|------------------+------+------+--------+------+------+--------| 
|Чернівецька       | 0,49 | 0,46 |  0,49  | 0,17 | 0,36 |  0,37  | 
|область           |      |      |        |      |      |        | 
|------------------+------+------+--------+------+------+--------| 
|Чернігівська      | 0,43 | 0,43 |  0,43  | 0,36 | 0,40 |  0,25  | 
|область           |      |      |        |      |      |        | 
------------------------------------------------------------------ 
     На другому етапі величина k   розраховується  для  економічно 
                                5i 
неактивних осіб сільської місцевості кожного регіону за формулою: 
                 ^`(ОЕАН)    ^`(ОСГД)   ^`(ОЕАН)   ^`(ОСГД) 
       N      - (Y        + Y         + Y        + Y       ) 
        15-70     ЗН         ЗН          БР         БР 
 k   = -----------------------------------------------------, (27) 
  5i                      ^(ОЕАН)   ^(ОСГД) 
                          Y       + Y 
                           ЕН        ЕН 
     де N      -   загальна  чисельність  працездатного  населення 
         15-70 
по сільській  місцевості регіону розрахована за зовнішніми даними; 
 ^`(ОЕАН) 
(Y        - оцінка чисельності  зайнятого  населення  за  вибіркою 
  ЗН 
ОЕАН з    урахуванням    скоригованих    статистичних    ваг  w  ; 
                                                               5i 
 ^`(ОСГД) 
Y         - оцінка чисельності зайнятого  населення  за   вибіркою 
 ЗН 
ОСГД з     урахуванням    скоригованих    статистичних   ваг  w  ; 
                                                               5i 
^`(ОЕАН) 
Y        - оцінка чисельності безробітного населення за   вибіркою 
 БР 
ОЕАН з    урахуванням    скоригованих    статистичних    ваг  w  ; 
                                                               5i 
^`(ОСГД) 
Y        - оцінка чисельності безробітного населення за   вибіркою 
 БР 
ОСГД з    урахуванням    скоригованих    статистичних    ваг  w  ; 
                                                               5i 
^(ОЕАН) 
Y       - оцінка  чисельності  економічно  неактивного   населення 
 ЕН 
за вибіркою   ОЕАН    з    урахуванням    статистичних    ваг w  ; 
                                                               4i 
^(ОСГД) 
Y       - оцінка чисельності  економічно  неактивного    населення 
 ЕН 
за вибіркою ОСГД з урахуванням статистичних ваг w  . 
                                                 4i 
Коригування системи статистичних ваг економічно неактивного населення сільської місцевості за регіонами у об'єднаному масиві даних здійснюється за формулою аналогічною (26).
Слід наголосити, що описана у цьому підрозділі процедура застосовується лише для одиниць вибірки сільської місцевості.
При формуванні результуючого масиву після зазначеного коригування статистичних ваг необхідно здійснити процедуру постстратифікації для всього масиву (див. підрозділ 2.5).
Для міських одиниць вибірки остаточними будуть ваги (23), отримані після усунення постстратифікаційних ефектів.

4. ПОРЯДОК ВИЗНАЧЕННЯ ЯКОСТІ СИСТЕМИ ВАГ

Якість системи ваг ОЕАН визначається після кожного етапу їх коригування. При цьому розраховуються наступні характеристики.
     1) Середня вага  по  всіх  домогосподарствах  або  особах  (в 
залежності від етапу розрахунку системи ваг), як окремий множник - 
коефіцієнт інфляції F [7]. Величина F    для j-го етапу розрахунку 
                                     (j) 
ваг визначається за формулою: 
                                 n 
                                 S  w 
                                i=1  (j)i 
                        F    = ----------,                    (28) 
                         (j)       n 
де S - знак суми. 
     2) Максимальне   значення   w        та   мінімальне значення 
                                  (j)max 
w        ваги  домогосподарств  (осіб).  Розраховуються відношення 
 (j)min 
R    , R     та R     за формулами: 
 (j)1   (j)2     (j)3 
                   F              w                w 
                    (j)            (j)max           (j)max 
         R     = -------; R     = -------; R     = -------.   (29) 
          (j)1   w         (j)2     F       (j)3   w 
                  (j)min             (j)            (j)min 
     При аналізі  отриманих  результатів  мати  на  увазі,  що   є 
                        (I) 
неприпустимим значення w    <= 0. 
                        min 
3) Розмах варіації ваг за формулою:
                 ДЕЛЬТА R    = w       - w      .             (30) 
                         (j)    (j)max    (j)min 
4) Відносна вага (відношення ваги домогосподарства (особи) до коефіцієнта інфляції) для кожного домогосподарства або особи. Ця величина приймає значення, близькою до одиниці (в середньому по всіх домогосподарствах (особах) відносна вага дорівнює одиниці).
Використання відносних (приведених) ваг дозволяє більш наглядно порівнювати незважені дані та дані після кожного етапу зважування, порівнювати дисперсії ваг на кожному етапі їх коригування, виявляти тенденції у зміні максимальних та мінімальних значень тощо. Крім того, порівняння суміжних коефіцієнтів інфляції дозволяє виявити етапи коригування ваг, які в середньому мають найбільший вплив на ваги домогосподарств (осіб).
Після кожного етапу коригування ваг слід перевіряти відносні ваги на наявність дуже малих (приблизно = 0) та від'ємних значень, розраховувати відношення максимальної відносної ваги до мінімальної.
     4) Відносне  зростання дисперсії вибіркових оцінок,  джерелом 
яких  є  варіативність  ваг  по  одиницях  вибірки, k .   Величина 
                                                     L 
k  визначається за формулою [8]: 
 L 
                                n     2 
                              n S (w ) 
                               i=1  i 
                         k  = ----------,                     (31) 
                          L     n     2 
( S w )
                               i=1  i 
де S - знак суми. 
                                                           - 
     Якщо дисперсія    вибіркових   оцінок   (V) показника Y   без 
                                        - 
урахування ваг визначається величиною V(Y), то за рахунок  власної 
варіативності  ваг  дисперсія  зваженої  оцінки  буде  визначатися 
                 - 
величиною k  * V(Y),  що  еквівалентно  зменшенню  обсягу  вибірки 
           L 
у k  разів. 
   L 
5) Коефіцієнт варіації ваг CV(w ) за формулою:
                                    (j) 
                            1        n               2 
         CV(w   ) = Кк [--------- *  S (w     - F   ) ];      (32) 
             (j)              2     i=1  (j)i    (j) 
                         n * F 
                              (j) 
     де w  - вага i-го домогосподарства (особи), i = 1, 2, ..., n; 
         i 
S - знак суми, Кк - квадратний корінь. 
6) Відношення коефіцієнтів інфляції для поточного та попереднього етапів зважування на j-му етапі R :
                                              F(j) 
                                   F 
                                    (j) 
                         R     = -------.                     (33) 
                          F(j)    F 
                                   (j-1) 
7) Відношення коефіцієнтів варіації ваг поточного та попереднього етапів зважування R за формулою:
                                (j)4 
                                 CV 
                                   (w(j)) 
                       R     = -----------.                   (34) 
                        (j)4    CV 
                                  (w(j-1)) 
     8) Коефіцієнт   кореляції    Пірсона   r        для  суміжних 
                                             (j,j-1) 
векторів ваг за формулою: 
                   n            -                  - 
                   S (w       - w     ) * (w     - w   ) 
                  i=1  (j-1)i    (j-1)      (j)i    (j) 
  r        = -----------------------------------------------, (35) 
   (j,j-1)        n            -      2   n          -    2 
             Кк [ S (w       - w     ) *  S (w     - w   ) ] 
                 i=1  (j-1)i    (j-1)    i=1  (j)i    (j) 
де S - знак суми, Кк - квадратний корінь.
Коефіцієнт кореляції характеризує щільність лінійного статистичного зв'язку системи ваг, що відповідають суміжним етапам розрахунку ваг. Чим ближчим є модуль величини цього коефіцієнту до одиниці, тим менше розподіл поточних ваг відхиляється від розподілу попереднього етапу і, в цілому, від початкових ваг дизайну.
9) Розраховується оцінка загальної кількості домогосподарств у генеральній сукупності N за формулою:
                          (j) 
                                n 
                        N    =  S  w    ,                     (36) 
                         (j)   i=1  (j)i 
де S - знак суми.
     Оцінка загальної кількості домогосподарств N     порівнюється 
                                                 (j) 
з оцінкою загальної кількості домогосподарств з  зовнішніх  джерел 
N    (попередньою оцінкою загальної кількості домогосподарств,  що 
 ЗІ 
використовувалась  при  побудові  вибірки,  даними   демографічної 
статистики  та  обстеження  умов життя домогосподарств або з іншою 
(достовірною) інформацією щодо загальної кількості неінституційних 
домогосподарств в Україні).  Розраховується відносне відхилення за 
формулою: 
                           N   - N 
                            ЗІ    (j) 
                   D    = ------------ * 100%.                (37) 
                    (j)       N 
                               ЗІ 
Отримані результати аналізуються на підставі існуючих даних щодо рівня репрезентативності вибірки.
Якість розрахованої системи ваг визначається на основі отриманих значень характеристик шляхом їх порівняння із встановленими граничними значеннями, характеристиками якості за попередні періоди обстежень та на основі експертних оцінок. При цьому слід враховувати, що рівень якості системи ваг залежить від результатів обстежень і тому для кожного окремого обстеження висновок щодо якості системи ваг необхідно обґрунтовувати окремо.
     10) По масиву первинних  даних  для  осіб,  що  проживають  в 
домогосподарствах,  по  яких  проведене інтерв'ю або є обов'язкова 
інформація, з  використанням  ваг  w    ,  розраховуються   оцінки 
                                    (j)i 
загальної чисельності  населення  України та чисельності населення 
за розрізами регіонів  -  тип  місцевості,  стать,  вікові  групи. 
Результати порівнюються з даними демографічної статистики. 
Приклад окремих результатів оцінювання якості ваг наведено у табл. 2. Наведені дані ілюструють зміну окремих характеристик якості системи ваг ОЕАН протягом 1999-2003 років.
          Таблиця 2. Зміна окремих характеристик якості 
                системи ваг ОЕАН за 1999-2004 роки 
------------------------------------------------------------------ 
|  Характеристики  |                    Рік                      | 
|                  |---------------------------------------------| 
|                  | 1999  |  2000 | 2001 |  2002  | 2003 | 2004 | 
|------------------+-------+-------+------+--------+------+------| 
|Середня вага, F   |  743  |  738  |  658 |  647   |  653 |  630 | 
|------------------+-------+-------+------+--------+------+------| 
|Мінімальна вага,  |  185  |  192  |  196 |  187   |  195 |  66  | 
|w                 |       |       |      |        |      |      | 
| min              |       |       |      |        |      |      | 
|------------------+-------+-------+------+--------+------+------| 
|Максимальна вага, | 2433  |  3028 | 2752 |  2079  | 2665 | 4344 | 
|w                 |       |       |      |        |      |      | 
| max              |       |       |      |        |      |      | 
|------------------+-------+-------+------+--------+------+------| 
|Коефіцієнт        | 36,48 | 37,75 |38,56 |  38,66 |41,42 |45,73 | 
|варіації ваг,     |       |       |      |        |      |      | 
|CV , %            |       |       |      |        |      |      | 
|  w               |       |       |      |        |      |      | 
|------------------+-------+-------+------+--------+------+------| 
|       -          | 4,02  |  3,84 | 3,36 |  3,45  | 3,35 | 9,54 | 
|       w          |       |       |      |        |      |      | 
|R  = ----         |       |       |      |        |      |      | 
| 1   w            |       |       |      |        |      |      | 
|      min         |       |       |      |        |      |      | 
|------------------+-------+-------+------+--------+------+------| 
|     w            | 3,28  |  4,10 | 4,18 |  3,21  | 4,08 | 6,89 | 
|      max         |       |       |      |        |      |      | 
|R  = ----         |       |       |      |        |      |      | 
| 2     -          |       |       |      |        |      |      | 
|       w          |       |       |      |        |      |      | 
|------------------+-------+-------+------+--------+------+------| 
|     w            | 13,15 | 15,74 |14,04 |  11,11 |13,65 |65,71 | 
|      max         |       |       |      |        |      |      | 
|R  = ----         |       |       |      |        |      |      | 
| 3   w            |       |       |      |        |      |      | 
|      min         |       |       |      |        |      |      | 
|------------------+-------+-------+------+--------+------+------| 
|Розмах варіації   | 2248  |  2835 | 2556 |  1892  | 2470 | 4278 | 
|ваг, ДЕЛЬТА R     |       |       |      |        |      |      | 
------------------------------------------------------------------ 
Як видно з наведених даних, спостерігається тенденція до зменшення величини середньої ваги. Враховуючи, що обсяг квартальної вибірки, на базі якої проводилось обстеження протягом 1999-2004 років, практично не змінювався, це можна пояснити зміною дизайну вибірки, зменшенням кількості домогосподарств у генеральній сукупності та зусиллями фахівців Держкомстату щодо зниження рівня відмов домогосподарств від обстеження. В обстеженні також збільшується коефіцієнт варіації ваг, але несуттєво. Величини інших характеристик в ОЕАН свідчать про погіршення якості системи ваг, особливо у 2004 році. Це пояснюється ефектами "старіння" вибірки до 2003 року, а у 2004 - впровадженням нової системи організації державних вибіркових обстежень населення [3].

5. ІНФОРМАЦІЙНА БАЗА РОЗРАХУНКУ СИСТЕМИ СТАТИСТИЧНИХ ВАГ ОЕАН

Інформаційна база для реалізації процедур розрахунку системи ваг за результатами поточного щомісячного обстеження складається з трьох основних частин:
- характеристик вибіркової сукупності домогосподарств;
- результатів ОЕАН;
- інформації з зовнішніх джерел.
5.1. Характеристики вибіркової сукупності домогосподарств
Характеристики вибіркової сукупності включають дані щодо дизайну та основних параметрів вибірки, а саме:
- загальнодержавний номер територіальної одиниці (ВТОВ - по міських поселеннях, ПТОВ - по сільській місцевості);
     - імовірність відбору одиниць першого ступеню (міських 
поселень та сільських рад), P ; 
                             1i 
     - імовірність відбору одиниць другого ступеня (інструкторські 
дільниці - по міських поселеннях, домогосподарства - по сільській 
місцевості), P ; 
              2i 
     - імовірність відбору домогосподарств по міських поселеннях, 
P ; 
 3i 
     - загальна кількість домогосподарств у ВТОВ по міських 
поселеннях, N ; 
             2i 
     - загальна кількість домогосподарств у ПТОВ по сільській 
місцевості, N ; 
             1i 
     - фактична кількість відібраних для обстеження 
домогосподарств у територіальній одиниці вибірки (у ВТОВ - по 
міських поселеннях, у ПТОВ - по сільській місцевості), n . 
                                                        ТО 
Характеристики вибіркової сукупності залишаються незмінними протягом всього терміну дії територіальної вибірки ОЕАН (для поточного циклу обстежень - це 2004-2008 роки). Разом з тим у випадку вимушеної заміни територіальних одиниць вибірки, або зміни фактичних кількостей відібраних домогосподарств необхідно скоригувати відповідні параметри вибірки.
5.2. Результати обстеження
Результати ОЕАН включають наступні дані:
- масиви обстежених домогосподарств та осіб за результатами поточного ОЕАН:
- код домогосподарства;
- код особи;
- стать особи;
- вік особи;
- ознака належності до вибірки ОСГД;
- статистична вага особи в ОСГД;
- статус економічної активності особи;
- загальнодержавний номер територіальної одиниці (ВТОВ по міських поселеннях, ПТОВ по сільській місцевості);
- код регіону;
- тип місцевості.
- номер комірки для врахування відмов домогосподарств від обстеження, l;
     - код комірки, c ; 
                     l 
     - загальна початкова кількість домогосподарств у комірці, n ; 
                                                                l 
     - номер комірки для врахування відмов осіб від обстеження, p; 
     - код комірки, c ; 
                     p 
     - загальна початкова кількість осіб у комірці, n ; 
                                                     p 
     - номер комірки для усунення постстратифікаційних ефектів, q; 
     - код комірки, c ; 
                     q 
     - загальна початкова кількість осіб у комірці, n . 
                                                     q 
5.3. Додаткові дані
Інформація з зовнішніх джерел містить дані демографічної статистики щодо статево-вікової структури населення за п'ятирічними віковими групами на початок поточного року, що публікуються у статистичному збірнику "Склад населення України за статтю та віком", а також дані про кількість неінституційних домогосподарств.
Масив зовнішньої інформації створюється один раз на рік перед розрахунком системи статистичних ваг домогосподарств за результатами ОЕАН у січні поточного року.

ЗАКЛЮЧНІ ПОЛОЖЕННЯ

Методика поширення результатів ОЕАН на генеральну сукупність передбачає розрахунок системи ваг на мікрорівні, тобто для кожного обстеженого домогосподарства та особи, на щомісячній основі. Таким чином, можливість реалізації даної методики на практиці вимагає застосування автоматизованих розрахункових процедур при побудові системи ваг, розрахунках характеристик їх якості, оцінювання показників тощо. Технологія розрахунку системи ваг повинна бути часткою загальної технології обробки щомісячних даних ОЕАН.
Методика може бути удосконалена в напрямку більш детального відображення особливостей реалізації ОЕАН, зокрема, для врахування схеми ротації домогосподарств у вибірці, більш ефективного використання наявних додаткових даних шляхом розробки та реалізації процедур калібрації системи ваг, або у напрямку забезпечення можливості застосування методів оцінювання показників на основі моделей та ін.

ПЕРЕЛІК ПОСИЛАНЬ

1. Вибіркове спостереження: Термінологічний словник. - К.: НТК статистичних досліджень, 2004.
2. Методологічні основи формування вибіркових сукупностей для проведення органами державної статистики України базових державних вибіркових обстежень населення (домогосподарств) / Затверджені наказом Держкомстату України від 2 серпня 2005 р., N 223 (v0223202-05, va223202-05) . - К., 2005 р.
3. Економічна активність населення України у 2004 році: Стат. збірник. - К.: Державний комітет статистики України, 2005.
4. Kish L. Survey sampling. - New York: Wiley, 1995.
5. Kalton G. Introduction to Survey Sampling. - Beverly Hills: Sage, 1983.
6. Workshop on Labour Force Surveys for CIS Countries and the Baltic States run by the International Labour Office, Bureau of Statistics hosted by State Statistics Committee of Ukraine (Kyiv, 14-19 September 1998). Part Three: sample design, data evaluation, field operations (Vijay Verma).
7. Саріогло В.Г. Проблеми статистичного зважування вибіркових даних. - К.: ІВЦ Держкомстату України, 2005.
8. Kish L.: Selected papers. - New York: Wiley, 2003.
9. SPSS (R) Base 8.0 для Windows (R), Applications Guide, Copyright (C) 1998 СПСС Русь.

Додаток А

РЕЗУЛЬТАТИ

РОЗРАХУНКУ КОЕФІЦІЄНТІВ ДЛЯ УСУНЕННЯ ПОСТСТРАТИФІКАЦІЙНИХ ЕФЕКТІВ АВТОНОМНА РЕСПУБЛІКА КРИМ (ОЕАН, січень 2005)

Віко- ві групи Зовніш- ня інфор- мація Фактична чисель- ність Коефі- цієнт Віко- ві групи Зовніш- ня інфор- мація Фактична чисель- ність Коефі- цієнт
Міська місцевість Сільська місцевість
Жі- нки 15-19 48359 39913 1,2116 15-19 31451 17188 1,8299
20-24 49300 48486 1,0168 20-24 29752 27218 1,0931
23-29 45711 45711 1,0000 23-29 25643 10500 2,4422
30-34 44420 34854 1,2745 30-34 23622 19186 1,2312
35-39 44822 44822 1,0000 35-39 23912 23193 1,0310
40-44 54617 54617 1,0000 40-44 29979 16853 1,7788
45-49 56577 56422 1,0027 45-49 30740 27613 1,1133
50-54 55527 55527 1,0000 50-54 27833 23902 1,1645
55-59 43578 43578 1,0000 55-59 20015 19158 1,0447
60-64 34267 34267 1,0000 60-64 20953 18683 1,1215
65-70 51934 51934 1,0000 65-70 31039 31039 1,0000
Чо- ло- ві- ки 15-19 49213 47549 1,0350 15-19 33636 29695 1,1327
20-24 52348 49495 1,0576 20-24 30656 14000 2,1897
23-29 44440 35886 1,2384 23-29 27143 3500 7,7551
30-34 41020 41020 1,0000 30-34 23774 16486 1,4420
35-39 38368 36245 1,0586 35-39 23908 22246 1,0747
40-44 45416 45008 1,0091 40-44 29537 22704 1,3010
45-49 44238 44238 1,0000 45-49 29428 19817 1,4850
50-54 42150 42150 1,0000 50-54 25301 23813 1,0625
55-59 31407 31407 1,0000 55-59 15638 15638 1,0000
60-64 23310 23310 1,0000 60-64 14148 13388 1,0568
65-70 31595 31595 1,0000 65-70 20259 20259 1,0000