در مورد تناقضات آماری – ایران

تحلیلِ شرایط فعلی و روند رشدِ بیماری کرونا از نیازهای اولیه سیاستگذاران است. برای چنین تحلیلی طبیعتا داده مناسب در مورد متغیرهای متعددی لازم است. یکی از مهمترین آن‌ها، تعداد کل افراد بیمار است. به دلایل متعددی عدد دقیقی برای این متغیر، که اصولا روزانه تغییر می‌کند، وجود ندارد. از این رو مدل‌سازان سعی می‌کنند با توسعه مدل های ریاضی/فیزیکی/رفتاری/اجتماعی مختلف، از شواهد موجود استفاده کنند و تعداد افراد بیمار را تخمین بزنند. اما چه چیز داریم؟ تقریبا هیچ!
1- اولین منبع، برای تخمین تعداد بیماران، طبیعتا، گزارش‌های رسمی است. گزارش رسمی در بهترین حالت مبتنی بر تست‌های انجام شده است. همه جامعه تست نمی‌شوند. در مورد خیلی‌ها، خصوصا، در ابتدای شیوع بیماری، تشخیص‌ها نادرست و عموما آنفولانزا یا سرماخوردگی است. افزون بر این، همه تست‌های تشخیص پزشکی هم خطا دارند؛ هم sensitivity و هم specificity آن ها زیر یک است؛ یعنی تعدادی از بیماران به اشتباه، سالم، و تعدادی از سالمها، به اشتباه بیمار تشخیص داده می‌شوند (معمولا مورد دوم بیشتر است). «یک» نبودن این دو متغیر از خصوصیات‌های تمامی سیستم‌های تشخیص (detection) است و همیشه ، در محدوده دقت ثابت، با اضافه کردن یکی، آن یکی کم می‌شود. این پیچیدگی‌ها را اضافه کنید به تاخیرهای قابل ملاحظه بین درخواست برای تست، انجامِ تست، جواب تست و ثبت رسمی آن. و نهایتا علایق ذی نفعان همیشه بر داده‌ها و نحوه گزارش آن‌ها می‌تواند اثرگذار باشد.
2- دومین منبع، تعداد مرگ و میر است. از این داده این طور استنباط می‌شود که با فرضِ دانستن و ثابت بودنِ احتمال فوتِ افراد بیمار، با یک محاسبه معکوس، از تعداد متوفی، تعداد بیماران را می‌توان حساب کرد. این حساب هم به شدت اشتباه است. اولا داده‌های مرگ و میر دقیق نیست (هر چند دقیق‌تر از داده‌های بیماران است). تاخیر در تشخیص علت فوت وجود دارد، مگر این که فرد قبل از مرگ تست شده باشد. اما یک نکته دیگر، این که، اصلا درصد فوت را هم نمی‌دانیم! در مورد کرونا هم اعداد موجود حول یک تا دو درصد است و برخی هم حتی پایین‌تر از یک درصد را پیش بینی کرده‌اند. درصد دقیق مرگ و میر عملا در انتهای دوره بیماری بدست می‌آید: زمانی که بیماری وجود نداشته باشد، درصد فوت با تقسیم تعداد کل فوت بر جمع تعداد کل فوت و بهبود بدست می‌آید. در بیماریهای دیگر معمولا درصد فوت در ابتدا بسیار بالاتر از واقعیت تخمین زده شده بود.
3- سومین منبع، تخمین زمان ورود اولین مورد بیمار است، بیمارِ صفر. اگر این را بدانید و اگر بدانید که با چه تابعی تعداد بیماران رشد می‌کند، می‌توانید حدس خوبی از تعداد بیماران در روزهای ابتدایی داشته باشید. مشکل بزرگ این است که نمی‌دانید کِی اولین بیمار وارد ایران شد! اصلا چرا یک نفر، شاید دو نفر، شاید ده نفر وارد شده باشند. تخمینی وجود دارد که نشان می‌دهد تا اواسط ژانویه چهارصد نفر از مبتلایان بیماری از چین وارد کشورهای دیگر شده اند که فقط یک سوم آن‌ها در فرودگاه‌ها شناسایی شده‌اند. (از این رو می‌توان مطمئن بود که کشورهای متعددی در حال حاضر به صورت قابل ملاحظه ای بیمار دارند و به آن آگاه نیستند). با چند محاسبه سرانگشتی به نظر می‌رسد زمان شروع بیماری در ایران و ایتالیا هم در همان دوران اوایل ژانویه و تعطیلات سال نو میلادی است. اما بازهم عدد دقیق لازم است، چرا که توابع نمایی بسیار حساس به شرایط اولیه خواهند بود.
4- چهارمین منبع، استفاده از گزارش‌های هواپیمایی است. یعنی به تعداد مسافرانی نگاه کنیم که در بدو ورود به کشوری خارجی تست شده‌اند و تست آن‌ها مثبت اعلام شده است. این مورد، منبع خوبی است و به صورت ایده آل با داشتن نسبت مسافران بیمار به کل مسافران، تخمینی از درصد بیماران در کل کشور را می‌توان پیدا کرد. این تخمین را هم با مدل ساده و پیچیده‌تر می‌توان انجام داد تا کشورهایی که با تست، میانه خوبی ندارند (مثلا عراق و آذربایجان که میزان مسافران متعددی از ایران هستند)، هم با وزن بیشتری لحاظ شوند. مشکل اول این است که در مورد دوران غیرسیمپتومیِ بیماری، برخی از مسافران بیمار که هنوز اوضاعشان حاد نیست ممکن است از چشمان تیزبین ماموران در امان بمانند. و دوم این که در داخل هواپیما افراد همدیگر را مبتلا می کنند و از این رو این طور درصد گرفتن درست نیست. مثل این که یک نفر بگوید در خانواده چهار نفری ما دو نفر مریض شده‌اند، پس پنجاه درصد کل مملکت هم مریضند. براین موارد، این پیچیدگی جدید را هم اضافه کنید که برخی زمان اولیه بیماری (بدون سیمپتوم) را حدودا پنج روز تخمین زده بودند، و جدیدا شاهد اعداد کمتر، در حد یک یا دو روز هم بوده‌ایم.
5- پنجمین منبع، گزارش‌های غیررسمیِ پزشکان و روزنامه‌هاست. گزارش‌های غیررسمی هم لزوما از کانال‌های دقیق تست، عبور نکرده‌اند. اشتباهات محاسباتی زیاد می‌توانند داشته باشند. در این موارد اخیر، معلوم نیست که از چه نمونه ای بی بی سی به نتیجه 200 و خورده‌ای موردِ فوت رسیده بود: مثلا آیا تخمین 50 مرگ از یک چهارم بیمارستان های کشور زده شده یا 20 مرگ از یک دهم آن ها و به همان نسبت برای کشور اعدادش را بزرگ کرده بود. یا کلا 200 مورد از بخشی از بیمارستان‌ها، یا روشی دیگر، مثلا دسترسی به اسم افراد فوت شده وجود داشته است. نمی‌توان گفت. بعد هم اگر این عدد را پیدا کنیم هنوز به دلایل ذکر شده در بند دوم نمی‌توانیم تخمینی از کل بیماران پیدا کنیم.
6- ششمین منبع داده‌های مربوط به چین است. با این فرض که روند بیماری در چین تمام شده، دست کم چند متغیر اصلی، مانند آرنات (R0) و درصد مرگ و میر را محاسبه کنیم و از آن‌ها به عنوان ورودی برای تخمین سایر متغیرها در ایران استفاده کنیم. آرنات متغیری است که همانطور که به خصوصیات بیماری وابسته است، به خصوصیات رفتاری افراد نیز وابسته است. مثلا فاصله افراد در ایران، در هنگام صحبت‌کردن عموما کم است. یا افراد، بیشتر، دست می‌دهند. همه این‌ها، علاوه بر میزان چگالی جمعیت، بر آرنات اثر گذار است. درصد مرگ و میر هم می‌تواند تا حدی وابسته به سیستم بهداشتی کشور باشد و از طرف دیگر تخمین مرگ و میر در چین هم با توجه به این که لزوما همه افراد مبتلا تشخیص داده نشده‌اند مشکل است.
و احتمالا می‌توان محدودیت‌های متعدد دیگری هم اضافه کرد.
.
با توجه به این محدودیت ها، یک مدل ساز چند گزینه دارد. مثلا: 1) باز تلاش کند و داده های دیگر را پیگیری کند، 2) میزان خطا و بازه اطمینان را در پیش بینی‌هایش به دقت لحاظ کند و 3) کار گروهی انجام دهد، و نتیجه نهایی حاصل خروجی مدل‌های مختلف با فرض‌های متفاوت باشد، و 4) یک قدم به عقب برگردد و در مورد سوال اصلی تامل کند. سوال اصلی، شاید، بیش از این که تعداد کنونی بیماران باشد، مربوط به روند بیماری است: آیا روند صعودی است؟ اگر بلی، کِی نزولی می‌شود؟ آیا از نقطه چرخش عبور کرده‌ایم و می‌توانیم مدارس را باز کنیم یا باید صبر کنیم؟ کدام استان‌ها نزدیک‌تر به بهبودی‌اند؟ و الی آخر.

مقاله قبلیمقاله علمی: تاثیر محدودیت سفر روی پخش بیماریمقاله بعدیمقاله علمی: مطالعه مشخصات بالینی 138 بیمار کرونا در چین

نوید غفارزادگان

دانشیار مهندسی صنایع
Virginia Tech

دقت فریبنده تست‌های پادتنی

2020-04-19 01:092020-12-18توسط: بابک حیدریبخش: مفاهیم پایه‌ای و شهود0 دیدگاه2,913 نمایش

بحث دقت‌های فریبنده تست‌های پادتنی همزمان با انتشار نتایج بعضی از این تست‌ها داغ شده (نمونه آلمان و نمونه کالیفرنیا). اصل مساله که توجه به قضیه بیز است که در آمار و احتمالات مقدماتی تدریس می‌شود . اما بدون استفاده از معادله و مقدمات آن هم می‌شود از یک مثال ساده برای انتقال مطلب استفاده کرد.

فرض کنیم تستی پادتنی با “دقت خوب” داریم که ۹۵ درصد کسانی که قبلا به کرونا مبتلا نشده‌اند را به درستی تشخیص منفی می‌دهد. حالا این تست را مثلا به هاوایی می‌بریم و روی ۱۰۰۰ نفر به شکل تصادفی استفاده می‌کنیم. فرض کنید که هاوایی حدود نیم درصد جمعیتش مبتلا شده، ولی ما از این رقم اطلاع نداریم. در این تعداد ۱۰۰۰ نفری٫تست خوش‌دقت ما (حدود) ۵ نفر مبتلای واقعی را کاملا درست تشخیص می‌دهد. از طرفی ۹۹۵ نفر انسان کرونا‌ندیده هم داریم که تست ما ۹۵ درصدشان را به درستی تشخیص منفی می‌دهد. اما آن ۵ درصد خطای ناقابل به عبارتی می‌شود حدود ۵۰ نفر!
یعنی آخر کار، تست ما حدود ۵۵ مورد مثبت اعلام کرده که فقط ۵ تای آنها واقعا کرونا گرفته بودند و ۵۰ تای دیگر اشتباه بوده! یعنی اگر کسی در هاوایی نتیجه تستش مثبت باشد، به احتمال کمتر از ۱۰ درصد قبلا واقعا کرونا گرفته و می‌تواند با خیال‌راحت در جامعه جولان‌بدهد.خوش دقتی تست ما در جایی مثل هاوایی که رواج بیماری محدود‌بوده می‌تواند‌خیلی فریبنده باشد.

مرکز امنیت بهداشت دانشگاه جانزهاپنیز مجموعه جامعی از تست‌های پادتنی مختلفی که در چند ماه گذشته برای بیماری کرونا توسعه یافته را جمع‌آوری کرده و در هر مورد مکانیزم و عددهای ادعایی در مورد حساسیت و ویژگی هر تست را اعلام کرده. مثلا ویژگی ‏(specificity) همین تست فرضی ما ۹۵ درصد بود و بازه ویژگی تست‌های موجود در محدوده ۹۵ تا ۱۰۰ اعلام شده‌اند. هر چند که به اعداد خیلی بالای نزدیک ۱۰۰ باید به خاطر تعداد کم نمونه‌های ازمایش با دیده تردید نگاه کرد. همینطور باید توجه کرد که حتی خطای ۱ درصدی هم در اینجا — به دلیلی که در بالا اشاره شد — ممکن است به نتیجه‌گیری نادرست در مورد میزان گستردگی بیش از مقدار واقعی ویروس در جامعه بیانجامد.

مدل‌سازی در زمانِ شیوع بیماری

2020-04-04 18:342020-12-18توسط: نوید غفارزادگانبخش: تحلیل‌ها, تحلیل‌های مدل محور, مفاهیم پایه‌ای و شهود0 دیدگاه3,145 نمایش

نوید غفارزادگان

تاکنون احتمالا با سیری از مدل‌های ریاضی برای تخمین تعداد بیماران و مرگ و میر ناشی از ویروس کرونا مواجه شده‌اید. هر چند در مورد ایران تعداد مدل‌ها محدود بوده است، اما در مورد سایر کشورها و به خصوص آمریکا انواع مختلفی ارائه شده است. بر اساس مشاهدات، می‌توان مدل‌های موجود تا به این لحظه را در دسته‌بندی‌های زیر قرار داد:

1- روش‌های curve fitting: در این رویکرد، بر اساس نمودارِ از پیش تعیین‌شده‌ای، منحنی خاصی بر روند موجود در داده‌ها منطبق می‌شود، و با استفاده از آن روند آینده بیماری تخمین زده می‌شود. این روش، در صورت انجام مناسب آن، نهایتا برای پیش‌بینی چند روز آینده می‌تواند مفید باشد و در بلند مدت به اشتباه‌های با مقیاس بزرگ منجر می‌شود.

2- مدل‌های ابتداییِ SIR: با توجه به سادگی و در عین حال اعتبارِ این مدل، SIR متداول‌ترین نوع مدل‌سازی است. این مدل‌ها، مبتنی بر تفکیک جمعیتِ در معرض بیماری از افراد بیمار و افراد بهبود یافته (یا متوفی) استوار است و دو فیدبک اصلی را لحاظ می‌کنند: فیدبک مثبتِ افزایش بیماری و فیدبک منفیِ اشباع افراد بیمار. جایگاه SIR در اپیدیمیولوژی مانند جایگاه قوانین نیوتون در فیزیک است: معتبر و عموما خوب برای ارائه یک توصیف ساده. با این حال همانند قوانین نیوتون، باید معادلات بدرستی نوشته شود و پارامترها درست انتخاب شود، که حتی در این حد نیز بسیاری از مدل‌سازهای موجود اشتباه می‌کنند. اما اشتباه اصلی‌تر از آنجا ناشی می‌شود که برخی مدل‌سازان، دینامیک تغییرِ تست را لحاظ نمی‌کنند. (در واقع در مثال فیزیک، مانند این است که داده‌های ارائه شده در مورد حرکت سیاره‌ای که وارد معادلاتمان می‌کنیم، هم با خطای زیاد همراه باشد و هم چند بار تلسکوپ تغییر کرده باشد!) در مورد بیماری اخیر، عموما، رشد ظرفیت تست، مخصوصا در روزهای ابتدایی، از رشد بیماری سریع‌تر بوده است. از این رو، روند ابتدایی رشد داده‌های بیماری که مربوط به رشد تست است، با رشد خودِ بیماری اشتباه گرفته شده است، و در نتیجه R0 تخمین زده شده مقادیری بالاتر از سه و چهار گرفته است.

3- مدل‌های SIR ساده با در نظر گرفتن فیدبک‌های بیشتر: با توجه به شرایط بیماری و پاسخ‌های اجتماع برخی از پارامترهای موجود در مدل SIR به مرور زمان تغییر می‌کنند. در این گونه مدل ها، چنین پارامترهایی به عنوان تابعی از متغیرهای دیگر مدل تعریف می‌شوند. نمونه‌ای از فیدبک‌ها: گسترش تست، افزایش تقاضا برای تست، پاسخ سیستم بهداشت و درمان و ظرفیت محدود بیمارستان‌ها، کاهش تماس‌های اجتماعی، و … در نظر گرفتن این فیدبک‌ها به دقت مدل کمک می‌کند. هر چند ممکن است داده‌ای در مورد این فیدبک‌ها موجود نباشد، اما چشم‌پوشی از آن‌ها مانند این است که فرض کنیم اثرشان صفر است. صفر لزوما عدد دقیق‌تری از فرضِ مبتنی بر شهود مدل ساز نیست.

4- مدل‌های توسعه یافته SIR با در نظر گرفتن “جزییات” بیشتر (و شاید فیدبک بیشتر): این گونه مدلها تمرکز بیشتری بر تفکیک انواع بیماران می‌کنند. مثلا شدت بیماری و گروه سنی دو نوع متداول تقسیم بندی است. یا می توان SIR را برای جغرافیای مختلف ارائه داد، و بعد حمل و نقل بین مناطق مختلف را در مدل لحاظ کرد. این مدل‌ها می تواند فیدبک‌های بیشتر داشته باشد، یا این که مانند مدل ابتدایی SIR فقط بر دو فیدبک اصلی اکتفا کنند. آیا جزییات بیشتر کمک می کنند؟ در برخی موارد، بلی. مثلا اگر سیاست ایزوله کردن فردی را تست می‌کنید، اگر لحاظ نکنید که برخی از بیماران نشانه‌ای ندارند و در نتیجه از بیماری خود آگاه نیستند که خود را ایزوله کنند، ممکن است اثر ایزوله کردن را زیادتر از مقدار واقعی تخمین بزنید. در برخی موارد نیز دیده می‌شود که مدل‌ساز با اضافه کردن جزییات فقط خطای بیشتری در تاخیرها را وارد مدل کرده است که این امر نه تنها کمک نمی‌کند که می‌تواند به تخمین‌های اشتباه منجر شود.

5- مدل‌های با واحد فرد بیمار و ساختار شبکه‌ای: در این گونه مدل‌ها تمرکز بیشتری بر الگوی جغرافیایی و شبکه‌ای پیشرفت بیماری معطوف می‌شود. این گونه مدل‌ها هم عموما فیدبک شیوع بیماری را دارند. مدل‌های بهتر در این دسته باید بازخور شرایط بر رفتار افراد و تغییرات مربوط به تست را نیز مدنظر قرار دهند. با این حال تعداد این گونه مدل‌ها، در زمان شیوع بیماری، کمتر از سایر مدل ها بوده است که دلیل آن احتمالا به زمان زیاد مورد نیاز برای ساختن، و ارزش افزوده کم آن در مقایسه با مدل‌های ساده‌تر، در شرایطی که بیماری از یک گروه و جغرافیای محدود عبور کرده باشد مربوط می‌شود. معمولا مدل‌های از پیش‌ساخته‌ای موجود است که انتظار می‌رود در این شرایط دوباره کالیبره و استفاده شوند که تا به حال این اتفاق کمتر افتاده است. با اتمام دوره بیماری شاهد مدل‌های جزئی و شبکه‌ای بیشتری خواهیم بود.

در برخی مباحث آنلاین، به تفکیک مدل‌ها بر اساس برچسبِ سیستم داینامیکس و کامپارتمنتال و مدلهای شبکه‌ای پرداخته شده، که به نظر غیردقیق است. از منظر سیستم داینامیکس تمامی موارد دو تا پنج می‌توانند مدل سیستم داینامیکس باشند، اگر لوپِ فیدبک داشته باشند. در واقع قدمت SIR که نوعی مدل سیستم داینامیکس است، از واژه “سیستم داینامیکس” بیشتر است. کامپارتمنتال‌ها تمامی موارد دو تا چهار را شامل می‌شوند. مدل‌های شبکه‌ای می‌توانند به صورت حالت چهار یا پنج باشند، بسته به این که واحد تحلیل چقدر جزئی باشد. در نهایت تمامی این مدل‌ها ممکن است اشتباهات ساختاری داشته باشند (مثلا در تقسیم خروجی از بیماری به بهبود و مرگ بی‌دقت باشند) یا فرض‌های ساده کننده داشته باشند. در حال حاضر با «مدل‌سازی در زمانِ شیوع بیماری» مواجه هستیم و محدودیت زمان در انواع مدل‌ها، رویکردها، و خطای تخمین‌ها تاثیرگذار است.