دقت فریبنده تست‌های پادتنی – ایران

بحث دقت‌های فریبنده تست‌های پادتنی همزمان با انتشار نتایج بعضی از این تست‌ها داغ شده (نمونه آلمان و نمونه کالیفرنیا). اصل مساله که توجه به قضیه بیز است که در آمار و احتمالات مقدماتی تدریس می‌شود . اما بدون استفاده از معادله و مقدمات آن هم می‌شود از یک مثال ساده برای انتقال مطلب استفاده کرد.

فرض کنیم تستی پادتنی با “دقت خوب” داریم که ۹۵ درصد کسانی که قبلا به کرونا مبتلا نشده‌اند را به درستی تشخیص منفی می‌دهد. حالا این تست را مثلا به هاوایی می‌بریم و روی ۱۰۰۰ نفر به شکل تصادفی استفاده می‌کنیم. فرض کنید که هاوایی حدود نیم درصد جمعیتش مبتلا شده، ولی ما از این رقم اطلاع نداریم. در این تعداد ۱۰۰۰ نفری٫تست خوش‌دقت ما (حدود) ۵ نفر مبتلای واقعی را کاملا درست تشخیص می‌دهد. از طرفی ۹۹۵ نفر انسان کرونا‌ندیده هم داریم که تست ما ۹۵ درصدشان را به درستی تشخیص منفی می‌دهد. اما آن ۵ درصد خطای ناقابل به عبارتی می‌شود حدود ۵۰ نفر!
یعنی آخر کار، تست ما حدود ۵۵ مورد مثبت اعلام کرده که فقط ۵ تای آنها واقعا کرونا گرفته بودند و ۵۰ تای دیگر اشتباه بوده! یعنی اگر کسی در هاوایی نتیجه تستش مثبت باشد، به احتمال کمتر از ۱۰ درصد قبلا واقعا کرونا گرفته و می‌تواند با خیال‌راحت در جامعه جولان‌بدهد.خوش دقتی تست ما در جایی مثل هاوایی که رواج بیماری محدود‌بوده می‌تواند‌خیلی فریبنده باشد.

مرکز امنیت بهداشت دانشگاه جانزهاپنیز مجموعه جامعی از تست‌های پادتنی مختلفی که در چند ماه گذشته برای بیماری کرونا توسعه یافته را جمع‌آوری کرده و در هر مورد مکانیزم و عددهای ادعایی در مورد حساسیت و ویژگی هر تست را اعلام کرده. مثلا ویژگی ‏(specificity) همین تست فرضی ما ۹۵ درصد بود و بازه ویژگی تست‌های موجود در محدوده ۹۵ تا ۱۰۰ اعلام شده‌اند. هر چند که به اعداد خیلی بالای نزدیک ۱۰۰ باید به خاطر تعداد کم نمونه‌های ازمایش با دیده تردید نگاه کرد. همینطور باید توجه کرد که حتی خطای ۱ درصدی هم در اینجا — به دلیلی که در بالا اشاره شد — ممکن است به نتیجه‌گیری نادرست در مورد میزان گستردگی بیش از مقدار واقعی ویروس در جامعه بیانجامد.

مقاله قبلیمقاله علمی: تخمین بیماران کوید19 در شهر نیویورکمقاله بعدیاخبار نگران کننده؛ «احتیاط» هنوز اولویت اول

بابک حیدری

دانشیار مهندسی سیستم‌ها و علوم شبکه
Northeastern University

مدل‌سازی در زمانِ شیوع بیماری

2020-04-04 18:342020-12-18توسط: نوید غفارزادگانبخش: تحلیل‌ها, تحلیل‌های مدل محور, مفاهیم پایه‌ای و شهود0 دیدگاه3,176 نمایش

نوید غفارزادگان

تاکنون احتمالا با سیری از مدل‌های ریاضی برای تخمین تعداد بیماران و مرگ و میر ناشی از ویروس کرونا مواجه شده‌اید. هر چند در مورد ایران تعداد مدل‌ها محدود بوده است، اما در مورد سایر کشورها و به خصوص آمریکا انواع مختلفی ارائه شده است. بر اساس مشاهدات، می‌توان مدل‌های موجود تا به این لحظه را در دسته‌بندی‌های زیر قرار داد:

1- روش‌های curve fitting: در این رویکرد، بر اساس نمودارِ از پیش تعیین‌شده‌ای، منحنی خاصی بر روند موجود در داده‌ها منطبق می‌شود، و با استفاده از آن روند آینده بیماری تخمین زده می‌شود. این روش، در صورت انجام مناسب آن، نهایتا برای پیش‌بینی چند روز آینده می‌تواند مفید باشد و در بلند مدت به اشتباه‌های با مقیاس بزرگ منجر می‌شود.

2- مدل‌های ابتداییِ SIR: با توجه به سادگی و در عین حال اعتبارِ این مدل، SIR متداول‌ترین نوع مدل‌سازی است. این مدل‌ها، مبتنی بر تفکیک جمعیتِ در معرض بیماری از افراد بیمار و افراد بهبود یافته (یا متوفی) استوار است و دو فیدبک اصلی را لحاظ می‌کنند: فیدبک مثبتِ افزایش بیماری و فیدبک منفیِ اشباع افراد بیمار. جایگاه SIR در اپیدیمیولوژی مانند جایگاه قوانین نیوتون در فیزیک است: معتبر و عموما خوب برای ارائه یک توصیف ساده. با این حال همانند قوانین نیوتون، باید معادلات بدرستی نوشته شود و پارامترها درست انتخاب شود، که حتی در این حد نیز بسیاری از مدل‌سازهای موجود اشتباه می‌کنند. اما اشتباه اصلی‌تر از آنجا ناشی می‌شود که برخی مدل‌سازان، دینامیک تغییرِ تست را لحاظ نمی‌کنند. (در واقع در مثال فیزیک، مانند این است که داده‌های ارائه شده در مورد حرکت سیاره‌ای که وارد معادلاتمان می‌کنیم، هم با خطای زیاد همراه باشد و هم چند بار تلسکوپ تغییر کرده باشد!) در مورد بیماری اخیر، عموما، رشد ظرفیت تست، مخصوصا در روزهای ابتدایی، از رشد بیماری سریع‌تر بوده است. از این رو، روند ابتدایی رشد داده‌های بیماری که مربوط به رشد تست است، با رشد خودِ بیماری اشتباه گرفته شده است، و در نتیجه R0 تخمین زده شده مقادیری بالاتر از سه و چهار گرفته است.

3- مدل‌های SIR ساده با در نظر گرفتن فیدبک‌های بیشتر: با توجه به شرایط بیماری و پاسخ‌های اجتماع برخی از پارامترهای موجود در مدل SIR به مرور زمان تغییر می‌کنند. در این گونه مدل ها، چنین پارامترهایی به عنوان تابعی از متغیرهای دیگر مدل تعریف می‌شوند. نمونه‌ای از فیدبک‌ها: گسترش تست، افزایش تقاضا برای تست، پاسخ سیستم بهداشت و درمان و ظرفیت محدود بیمارستان‌ها، کاهش تماس‌های اجتماعی، و … در نظر گرفتن این فیدبک‌ها به دقت مدل کمک می‌کند. هر چند ممکن است داده‌ای در مورد این فیدبک‌ها موجود نباشد، اما چشم‌پوشی از آن‌ها مانند این است که فرض کنیم اثرشان صفر است. صفر لزوما عدد دقیق‌تری از فرضِ مبتنی بر شهود مدل ساز نیست.

4- مدل‌های توسعه یافته SIR با در نظر گرفتن “جزییات” بیشتر (و شاید فیدبک بیشتر): این گونه مدلها تمرکز بیشتری بر تفکیک انواع بیماران می‌کنند. مثلا شدت بیماری و گروه سنی دو نوع متداول تقسیم بندی است. یا می توان SIR را برای جغرافیای مختلف ارائه داد، و بعد حمل و نقل بین مناطق مختلف را در مدل لحاظ کرد. این مدل‌ها می تواند فیدبک‌های بیشتر داشته باشد، یا این که مانند مدل ابتدایی SIR فقط بر دو فیدبک اصلی اکتفا کنند. آیا جزییات بیشتر کمک می کنند؟ در برخی موارد، بلی. مثلا اگر سیاست ایزوله کردن فردی را تست می‌کنید، اگر لحاظ نکنید که برخی از بیماران نشانه‌ای ندارند و در نتیجه از بیماری خود آگاه نیستند که خود را ایزوله کنند، ممکن است اثر ایزوله کردن را زیادتر از مقدار واقعی تخمین بزنید. در برخی موارد نیز دیده می‌شود که مدل‌ساز با اضافه کردن جزییات فقط خطای بیشتری در تاخیرها را وارد مدل کرده است که این امر نه تنها کمک نمی‌کند که می‌تواند به تخمین‌های اشتباه منجر شود.

5- مدل‌های با واحد فرد بیمار و ساختار شبکه‌ای: در این گونه مدل‌ها تمرکز بیشتری بر الگوی جغرافیایی و شبکه‌ای پیشرفت بیماری معطوف می‌شود. این گونه مدل‌ها هم عموما فیدبک شیوع بیماری را دارند. مدل‌های بهتر در این دسته باید بازخور شرایط بر رفتار افراد و تغییرات مربوط به تست را نیز مدنظر قرار دهند. با این حال تعداد این گونه مدل‌ها، در زمان شیوع بیماری، کمتر از سایر مدل ها بوده است که دلیل آن احتمالا به زمان زیاد مورد نیاز برای ساختن، و ارزش افزوده کم آن در مقایسه با مدل‌های ساده‌تر، در شرایطی که بیماری از یک گروه و جغرافیای محدود عبور کرده باشد مربوط می‌شود. معمولا مدل‌های از پیش‌ساخته‌ای موجود است که انتظار می‌رود در این شرایط دوباره کالیبره و استفاده شوند که تا به حال این اتفاق کمتر افتاده است. با اتمام دوره بیماری شاهد مدل‌های جزئی و شبکه‌ای بیشتری خواهیم بود.

در برخی مباحث آنلاین، به تفکیک مدل‌ها بر اساس برچسبِ سیستم داینامیکس و کامپارتمنتال و مدلهای شبکه‌ای پرداخته شده، که به نظر غیردقیق است. از منظر سیستم داینامیکس تمامی موارد دو تا پنج می‌توانند مدل سیستم داینامیکس باشند، اگر لوپِ فیدبک داشته باشند. در واقع قدمت SIR که نوعی مدل سیستم داینامیکس است، از واژه “سیستم داینامیکس” بیشتر است. کامپارتمنتال‌ها تمامی موارد دو تا چهار را شامل می‌شوند. مدل‌های شبکه‌ای می‌توانند به صورت حالت چهار یا پنج باشند، بسته به این که واحد تحلیل چقدر جزئی باشد. در نهایت تمامی این مدل‌ها ممکن است اشتباهات ساختاری داشته باشند (مثلا در تقسیم خروجی از بیماری به بهبود و مرگ بی‌دقت باشند) یا فرض‌های ساده کننده داشته باشند. در حال حاضر با «مدل‌سازی در زمانِ شیوع بیماری» مواجه هستیم و محدودیت زمان در انواع مدل‌ها، رویکردها، و خطای تخمین‌ها تاثیرگذار است.