Мета-аналіз в медицині - Хірургія. Журнал ім. Н.І. Пирогова - 2018-03 - Видавництво «Медіа Сфера»
Доказова медицина - це сумлінне, точне і
осмислене використання кращих результатів
клінічних досліджень для вибору
лікування конкретного хворого.
D. L. Sackett
За останні десятиліття спостерігається трансформація методології прийняття клінічних рішень від суб'єктивних експертних оцінок в сторону максимальної стандартизації та уніфікації протоколів лікування та розробки єдиних рекомендацій щодо ведення хворих. Доказова база для обґрунтування тих чи інших протоколів є багаторівневою системою від окремих клінічних думок до багатоцентрових рандомізованих досліджень і їх узагальнень (систематичний огляд і мета-аналіз). Останні займають найвищі позиції в структурі рівнів доказовості.
Зі збільшенням кількості публікованих статей і результатів численних досліджень виникла необхідність у систематизації цих даних і формулюванні підсумкових висновків з того чи іншого клінічного питання. На зорі становлення доказової медицини для цих цілей формулювалися, переважно, розповідні, несистемні огляди, в яких автор підсумував результати декількох досліджень і робив висновок про ефективність / неефективність методу лікування на основі особистісної та, в значній мірі, суб'єктивної оцінки даних. Такий підхід має ряд істотних недоліків. По-перше, відсутність транспарентності в методології дослідження через значну Суб'єктивізація аналізу. Наприклад, автори можуть використовувати різні критерії включення даних в огляд, може відрізнятися якісний склад аналізованих статей та пороговий рівень доказовості, застосовуваний для формулювання висновків. По-друге, значення і якість огляду значно знижуються при появі нових даних з даного питання, так як інтеграція нових досліджень в структуру існуючого аналізу може відбуватися тільки з урахуванням ваги цього дослідження і його якісних характеристик. Ці завдання практично неможливо вирішити в рамках несистемного огляду, особливо при наявності значної кількості нових досліджень.
У зв'язку з цим з середини 80-х і, особливо, в 90-х роках XX століття спостерігається перехід в сторону створення системних оглядів. Останні мають досить чіткі і прозорі критерії включення даних в огляд. Ключовим елементом системного огляду є статистична обробка даних (мета-аналіз). На відміну від несистемного огляду, де значення і якісний рівень статей визначаються з суб'єктивних позицій дослідника, мета-аналіз включає чіткі математичні критерії визначення ваги досліджень і їх реальний вплив на кінцевий результат і висновки огляду.
Основні параметри системного огляду
Основний «одиницею» аналізу в структурі системного огляду є так званий «розмір ефекту» (effect size). У широкому сенсі він відображає взаємозалежність між двома змінними, наприклад, вплив операції на ризик ускладнень, середні значення параметра в двох групах і їх різницю і т. Д. Відповідно до типу аналізованих даних розмір ефекту, як правило, виражається у відношенні ризиків / відношенні шансів ( risk ratio / odds ratio) для бінарних даних (є подія / немає події), стандартизованої середньої (d) для безперервних даних або коефіцієнті кореляції (r) для кореляційних даних. До використовуваному розміром ефекту пред'являється ряд вимог. По-перше, різні дослідження повинні володіти потенційно порівнянними розмірами ефекту з точки зору його якісних характеристик. В ідеальних умовах розмір ефекту не повинен залежати від різних аспектів, які можуть варіювати від дослідження до дослідження (розмір вибірки, використання додаткових параметрів і т. Д.). По-друге, розмір ефекту повинен бути потенційно вираховується виходячи з опублікованих даних без необхідності повторного аналізу (крім випадків, коли доступний вихідний блок даних). По-третє, розмір ефекту повинен мати достатні технічними характеристиками, наприклад, має бути відомо його розподіл у вибірці для можливості розрахунку дисперсії, довірчого інтервалу і т. Д.
Для того щоб провести мета-аналіз декількох досліджень, необхідно привести всі дані до одного «знаменника», т. Е. Уніфікованому розміром ефекту. Якщо в якості розміру ефекту використовуються середні значення якогось параметра в двох незалежних групах, то стандартизована середня в одне конкретне дослідження двох груп хворих може бути розрахована як:
де X 1 і Х 2 - арифметичне середнє параметра в кожній групі, S within - об'єднане стандартне відхилення в обох групах. Останнє розраховується як:
де n 1 і n 2 - розміри вибірок в обох групах, S 1 і S 2 - стандартні відхилення в двох групах.
Для розрахунку дисперсії стандартизованої середньої використовується відношення:
Стандартна помилка стандартизованої середньої визначається як квадратний корінь з її дисперсії:
Було відзначено, що для невеликих вибірок властива деяка переоцінка значення d через певною мірою його «зміщення» (bias). В результаті в якості розміру ефекту використовується не саме значення d, а його корегований (bias-corrected) параметр g (Hedges 'g). Для цього застосовується коефіцієнт корекції J:
де df - ступінь свободи, яка визначається для двох незалежних груп як n 1 + n 2 - 2.
В цьому випадку коригувати середня визначається як:
g = Jâ ™ d.
Дисперсія і стандартна помилка величини g розраховуються наступним чином:
Vg = J2â ™ V d,
При аналізі бінарних даних і розрахунку відносини шансів / відносини ризиків використовуються їх логарифмічні вирази (наприклад, lnOddsRatio) для отримання натурального логарифма сумарного розміру ефекту для всіх досліджень, включених в аналіз. І потім отримують пряме значення ефекту за допомогою експоненціального перерахунку.
Необхідно відзначити, що, якщо в аналізованих дослідженнях дані представлені в вигляді різних якісних характеристик, тобто можливість перекладу (конвертації) одного типу даних в інший. Ця схема може бути представлена в наступному вигляді (рис. 1).
Мал. 1. Конвертація різних типів даних.
Розмір вибірки та дизайн дослідження (незалежні групи, кластерний аналіз і т. Д.) Є основними факторами, які впливають на прецизійність одержуваного розміру ефекту і діапазон довірчого інтервалу. Математично величина дисперсії обернено пропорційна розміру вибірки, т. Е. Збільшення кількості спостережень в 4 рази, наприклад, призводить до 4-кратному зменшенню дисперсії. Стандартне відхилення при цьому знижується в 2 рази, так як воно є квадратним коренем з дисперсії. Зниження дисперсії, в свою чергу, збільшує якісну частку конкретного дослідження в загальній структурі метааналізу, т. Е. Його вага згідно з формулою:
де Wi - вага дослідження в загальному аналізі, Vi - його дисперсія.
Крім того, порівняння узгоджених груп (paired / matched) завжди забезпечує більш високу точність одержуваних даних і меншу дисперсію в порівнянні з незалежними групами, кластерним аналізом і т. Д.
Статистичні моделі
Принциповим моментом будь-якого мета-аналізу є вибір статистичної моделі, в рамках якої здійснюється обробка даних. Існують дві статистичні моделі: модель фіксованих ефектів (fixed-effect model) і модель випадкових ефектів (random-effect model) [1].
Для того щоб зрозуміти якісні відмінності між двома моделями, необхідно виділити такі поняття, як справжня і очікувана середня. Очікувана середня - це значення розміру ефекту при даному обсязі вибірки. Справжня середня являє собою величину розміру ефекту при обсязі вибірки, які прагнуть до нескінченності. Різниця між очікуваною і істинної середньої становить стандартну помилку середньої, яка завжди є випадковою величиною. Відповідно при збільшенні розміру вибірки очікувана середня починає наближатися до істинної середньої, а стандартна помилка прагне до нуля.
Головним припущенням моделі фіксованих ефектів є гіпотеза, що у всіх аналізованих дослідженнях істинний розмір ефекту є постійною величиною, а всі відмінності очікуваних середніх обумовлені тільки стандартною помилкою і не пов'язані з реально діючими факторами, які цілеспрямовано змінюють справжню середню. В цьому випадку розраховується в мета-аналізі загальний розмір ефекту є цієї істинної середньою величиною.
На рис. 2 справжнє
Мал. 2. Модель фіксованих ефектів. середнє θ для трьох досліджень однаково і становить 0,5. Очікувані середні склали 0,4, 0,67 і 0,43 для досліджень А, Б і В відповідно. Стандартна помилка як різниця між очікуваною і істинної середньої дорівнює εа, εб і εв відповідно. Нормальні криві відображають розподіл стандартної помилки згідно дисперсії кожного окремого дослідження. Очікувана середня конкретного дослідження (Yi) в загальному вигляді являє собою суму істинної середньої (θ) і стандартної помилки (εi):
Yi = θ + εi.
Для того щоб застосувати модель фіксованих ефектів, необхідні досить ідеальні умови, що дозволяють припустити однаковий дійсний розмір ефекту, наприклад, однорідна вибірка у всіх включаються статтях, схожі протоколи досліджень і т. Д. Як приклад можна уявити собі фармацевтичну компанію, яка починає клінічні дослідження препарату. Для цього формулюються протокол і дизайн дослідження, береться однорідна вибірка добровольців (наприклад, 1000 осіб). Потім основна вибірка ділиться на кілька груп, наприклад, 10 по 100 чоловік, і кожен дослідник аналізує індивідуальну групу. Потім отримані 10 досліджень включаються в мета-аналіз. В даному випадку ми брали початково однорідну групу добровольців, дизайн і протоколи дослідження були стандартними у всіх 10 групах. Таким чином, ми можемо припустити, що дійсний розмір ефекту буде однаковим у всіх 10 групах, якщо розмір вибірки збільшити від 100 до нескінченності в кожному випадку, а отримані відмінності показників в кожній групі (n = 100) пов'язані тільки зі стандартною помилкою.
У повсякденній практиці написання системних оглядів наявність таких «рафінованих» умов, як правило, неможливо, так як аналізуються статті різних авторів, які містять неоднорідні вибірки хворих по відношенню один до одного, різні протоколи, дизайни досліджень і т. Д. Іншими словами, відмінності між дослідженнями можуть бути досить істотними, що не дозволяє нам припускати однаковий дійсний розмір ефекту. Навпаки, доцільно думати, що існують конкретні чинники, які змінюють справжню величину, крім стандартної помилки. Для обліку цих моментів в клінічній практиці застосовується модель випадкових ефектів.
Відповідно до моделі випадкових ефектів, всі аналізовані дослідження мають різні справжні розміри ефекту, при цьому вони відповідають нормальному розподілу щодо загальної середньої всіх досліджень. В цьому випадку очікувана середня, крім стандартної помилки, залежить також від дисперсії і характеру розподілу справжніх розмірів ефекту у всіх дослідженнях (рис. 3),
Мал. 3. Модель випадкових ефектів. а що розраховується загальний розмір ефекту, на відміну від моделі фіксованих ефектів, є середньою величиною між усіма істинними розмірами ефекту.
На рис. 3 дослідження, А і Б мають різні справжні розміри ефекту (0,63 і 0,37 відповідно). Очікувані розміри ефекту Ya і Yб відрізняються від істинних значень на величину εа і εб відповідно (стандартна помилка). Крім того, справжній розмір ефекту конкретного дослідження відрізняється від сумарного середнього значення μ = 0,5 на величину стандартного відхилення ζi. Таким чином, очікуваний розмір ефекту індивідуального дослідження визначається як:
Yi = μ + ζi + εi.
Варто відзначити, що генеральна дисперсія в моделі випадкових ефектів, на відміну від моделі фіксованих ефектів, є дворівневою. По-перше, вона залежить від дисперсії (розподілу) очікуваних ефектів щодо істинної середньої в індивідуальному дослідженні V Y i (within-study variance). По-друге, має місце певне відхилення всіх справжніх ефектів від генералізованої середньої, що також характеризується дисперсією T2 (between-study variance). Таким чином, дисперсія окремого дослідження є сумою цих двох параметрів:
Відповідно, вага дослідження буде визначатися з урахуванням відхилення дійсних розмірів ефекту від генеральної середньої:
Звідси можна зробити висновок, що генеральна дисперсія, стандартна помилка і довірчий інтервал завжди будуть більше / ширше в рамках моделі випадкових ефектів. Дійсно, якщо в рамках моделі фіксованих ефектів збільшити всі вибірки до нескінченності, то розраховується загальний розмір ефекту буде дуже точним, а довірчий інтервал дуже вузьким з огляду на те, що всі дослідження будуть показувати один і той же істинний розмір ефекту (рис. 4).
Мал. 4. Модель фіксованих ефектів - розміри ефекту і 95% ДІ.
У моделі випадкових ефектів збільшення вибірок в кожному дослідженні до нескінченності не приведе до істотного звуження довірчого інтервалу, так як на тлі наближається до нуля індивідуальної дисперсії (within-study variance) зберігається певна ступінь варіації всіх досліджень щодо генеральної середньої (between-study variance). В цьому випадку звуження ДІ можливо за рахунок додаткового зменшення істинної міжвидової дисперсії шляхом збільшення до безкінечності кількості аналізованих статей (рис. 5).
Мал. 5. Модель випадкових ефектів - розміри ефекту і 95% ДІ.
гетерогенність
Важливим моментом в питанні створення системного огляду і мета-аналізу є оцінка гетерогенності включаються досліджень. У широкому розумінні поняття гетерогенності включає кілька характеристик, в тому числі і ті, які згадувалися вище (Q-статистика, p-критерій, генеральна дисперсія Т2, стандартне відхилення Т, I2-критерій). Ми зупинимося лише на значенні I2, як найбільш широко застосовується показник оцінки гетерогенності досліджень [2].
Варіабельність одержуваних нами даних, зокрема, розміру ефекту, завжди включає два аспекти: справжню варіацію і випадкову помилку. Якщо уявити, що все дослідження відображають однаковий дійсний розмір ефекту, то справжня варіація дорівнює нулю, а одержувані різні очікувані середні знаходяться в діапазоні довірчого інтервалу, ширина якого обумовлюється лише випадковою помилкою. У разі, якщо істинний розмір ефекту варіює від дослідження до дослідження, то очікувана загальна варіація включає, по-перше, випадкову помилку кожного окремого дослідження, а по-друге - справжню гетерогенність розмірів ефекту. У цьому контексті модель фіксованих ефектів можна розглядати як окремий випадок моделі випадкових ефектів з нульовою міжвидової дисперсією. Показник гетерогенності відповідає на питання про те, яка частка очікуваної загальної варіації є істинною, що не залежить від випадкової помилки. Виділення істинної міжвидової варіації, в загальному вигляді, включає кілька етапів:
- розрахунок загальної варіабельності від дослідження до дослідження;
- оцінка варіабельності досліджень в разі, якщо нульова гіпотеза вірна, т. Е. Дійсний розмір ефекту однаковий у всіх дослідженнях;
- різниця між цими значеннями ( «надлишок» варіації) є відображенням істинної варіабельності даних (гетерогенності).
Формула для розрахунку показника I2 виглядає як:
тобто відношення надлишкової варіабельності до загальної варіабельності, виражене у відсотках. Гетерогенність можна оцінити візуально за ступенем взаємного перехрещення довірчих інтервалів всіх включених досліджень (рис. 6).
Мал. 6. Оцінка гетерогенності. а - низький ступінь гетерогенності (взаємне накладення ДІ); б - висока гетерогенність (низькі діапазони взаємного перехрещення ДІ).
Граничні значення низької, помірної і високої гетерогенності досліджень емпірично встановлені на рівнях 25, 50 і 75% відповідно. На рис. 5, а високий ступінь взаємної накладення довірчих інтервалів передбачає значну роль випадкової помилки в структурі загальної варіабельності даних, а справжня Гете-Роген становить лише 27%. Навпаки, на рис. 5, б видно, що в значній мірі варіабельність отриманих даних є результат дисперсії справжніх середніх, а роль випадкової помилки невелика, що підтверджується низьким ступенем взаємного перехрещення довірчих інтервалів. Відповідно гетерогенність досягла 87%.
Низька степень гетерогенності (I2≤25%) предполагает гомогенний ряд Даних І, як правило, доцільність использование моделі фіксованіх ефектів для АНАЛІЗУ. Висока гетерогенність (≥75%), навпаки, відображає значимість Справжня варіабельність Даних, что діктує необходимость! Застосування моделі Випадкове ефектів [3]. Однако Варто Зазначити, что, согласно з M. Borenstein и співавт. [4], вибір статистичної моделі не повинен грунтуватися суто на значенні коефіцієнта гетерогенності. Він є результатом розуміння характеру розподілу даних і якісних характеристик аналізованих досліджень. Більш того, використання за замовчуванням моделі фіксованих ефектів з подальшим переходом на модель випадкових ефектів після отримання значимого коефіцієнта гетерогенності є фундаментальною помилкою і не повинно застосовуватися в статистичній практиці.
Таким чином, сучасна методика створення системних оглядів і мета-аналізу має на увазі досить трудомісткий процес статистичної обробки великого обсягу інформації. Незважаючи на збережену в певній мірі частку оператор-залежних процесів (наприклад, визначення критеріїв включення в огляд і т. Д.), Мета-аналіз включає досить прозору, математично-детерміновану методологію уявлення узагальнених клінічних даних та їх статистичного аналізу.
Автори заявляють про відсутність конфлікту інтересів.
e-mail: [email protected]