تحلیلِ شرایط فعلی و روند رشدِ بیماری کرونا از نیازهای اولیه سیاستگذاران است. برای چنین تحلیلی طبیعتا داده مناسب در مورد متغیرهای متعددی لازم است. یکی از مهمترین آنها، تعداد کل افراد بیمار است. به دلایل متعددی عدد دقیقی برای این متغیر، که اصولا روزانه تغییر میکند، وجود ندارد. از این رو مدلسازان سعی میکنند با توسعه مدل های ریاضی/فیزیکی/رفتاری/اجتماعی مختلف، از شواهد موجود استفاده کنند و تعداد افراد بیمار را تخمین بزنند. اما چه چیز داریم؟ تقریبا هیچ!
1- اولین منبع، برای تخمین تعداد بیماران، طبیعتا، گزارشهای رسمی است. گزارش رسمی در بهترین حالت مبتنی بر تستهای انجام شده است. همه جامعه تست نمیشوند. در مورد خیلیها، خصوصا، در ابتدای شیوع بیماری، تشخیصها نادرست و عموما آنفولانزا یا سرماخوردگی است. افزون بر این، همه تستهای تشخیص پزشکی هم خطا دارند؛ هم sensitivity و هم specificity آن ها زیر یک است؛ یعنی تعدادی از بیماران به اشتباه، سالم، و تعدادی از سالمها، به اشتباه بیمار تشخیص داده میشوند (معمولا مورد دوم بیشتر است). «یک» نبودن این دو متغیر از خصوصیاتهای تمامی سیستمهای تشخیص (detection) است و همیشه ، در محدوده دقت ثابت، با اضافه کردن یکی، آن یکی کم میشود. این پیچیدگیها را اضافه کنید به تاخیرهای قابل ملاحظه بین درخواست برای تست، انجامِ تست، جواب تست و ثبت رسمی آن. و نهایتا علایق ذی نفعان همیشه بر دادهها و نحوه گزارش آنها میتواند اثرگذار باشد.
2- دومین منبع، تعداد مرگ و میر است. از این داده این طور استنباط میشود که با فرضِ دانستن و ثابت بودنِ احتمال فوتِ افراد بیمار، با یک محاسبه معکوس، از تعداد متوفی، تعداد بیماران را میتوان حساب کرد. این حساب هم به شدت اشتباه است. اولا دادههای مرگ و میر دقیق نیست (هر چند دقیقتر از دادههای بیماران است). تاخیر در تشخیص علت فوت وجود دارد، مگر این که فرد قبل از مرگ تست شده باشد. اما یک نکته دیگر، این که، اصلا درصد فوت را هم نمیدانیم! در مورد کرونا هم اعداد موجود حول یک تا دو درصد است و برخی هم حتی پایینتر از یک درصد را پیش بینی کردهاند. درصد دقیق مرگ و میر عملا در انتهای دوره بیماری بدست میآید: زمانی که بیماری وجود نداشته باشد، درصد فوت با تقسیم تعداد کل فوت بر جمع تعداد کل فوت و بهبود بدست میآید. در بیماریهای دیگر معمولا درصد فوت در ابتدا بسیار بالاتر از واقعیت تخمین زده شده بود.
3- سومین منبع، تخمین زمان ورود اولین مورد بیمار است، بیمارِ صفر. اگر این را بدانید و اگر بدانید که با چه تابعی تعداد بیماران رشد میکند، میتوانید حدس خوبی از تعداد بیماران در روزهای ابتدایی داشته باشید. مشکل بزرگ این است که نمیدانید کِی اولین بیمار وارد ایران شد! اصلا چرا یک نفر، شاید دو نفر، شاید ده نفر وارد شده باشند. تخمینی وجود دارد که نشان میدهد تا اواسط ژانویه چهارصد نفر از مبتلایان بیماری از چین وارد کشورهای دیگر شده اند که فقط یک سوم آنها در فرودگاهها شناسایی شدهاند. (از این رو میتوان مطمئن بود که کشورهای متعددی در حال حاضر به صورت قابل ملاحظه ای بیمار دارند و به آن آگاه نیستند). با چند محاسبه سرانگشتی به نظر میرسد زمان شروع بیماری در ایران و ایتالیا هم در همان دوران اوایل ژانویه و تعطیلات سال نو میلادی است. اما بازهم عدد دقیق لازم است، چرا که توابع نمایی بسیار حساس به شرایط اولیه خواهند بود.
4- چهارمین منبع، استفاده از گزارشهای هواپیمایی است. یعنی به تعداد مسافرانی نگاه کنیم که در بدو ورود به کشوری خارجی تست شدهاند و تست آنها مثبت اعلام شده است. این مورد، منبع خوبی است و به صورت ایده آل با داشتن نسبت مسافران بیمار به کل مسافران، تخمینی از درصد بیماران در کل کشور را میتوان پیدا کرد. این تخمین را هم با مدل ساده و پیچیدهتر میتوان انجام داد تا کشورهایی که با تست، میانه خوبی ندارند (مثلا عراق و آذربایجان که میزان مسافران متعددی از ایران هستند)، هم با وزن بیشتری لحاظ شوند. مشکل اول این است که در مورد دوران غیرسیمپتومیِ بیماری، برخی از مسافران بیمار که هنوز اوضاعشان حاد نیست ممکن است از چشمان تیزبین ماموران در امان بمانند. و دوم این که در داخل هواپیما افراد همدیگر را مبتلا می کنند و از این رو این طور درصد گرفتن درست نیست. مثل این که یک نفر بگوید در خانواده چهار نفری ما دو نفر مریض شدهاند، پس پنجاه درصد کل مملکت هم مریضند. براین موارد، این پیچیدگی جدید را هم اضافه کنید که برخی زمان اولیه بیماری (بدون سیمپتوم) را حدودا پنج روز تخمین زده بودند، و جدیدا شاهد اعداد کمتر، در حد یک یا دو روز هم بودهایم.
5- پنجمین منبع، گزارشهای غیررسمیِ پزشکان و روزنامههاست. گزارشهای غیررسمی هم لزوما از کانالهای دقیق تست، عبور نکردهاند. اشتباهات محاسباتی زیاد میتوانند داشته باشند. در این موارد اخیر، معلوم نیست که از چه نمونه ای بی بی سی به نتیجه 200 و خوردهای موردِ فوت رسیده بود: مثلا آیا تخمین 50 مرگ از یک چهارم بیمارستان های کشور زده شده یا 20 مرگ از یک دهم آن ها و به همان نسبت برای کشور اعدادش را بزرگ کرده بود. یا کلا 200 مورد از بخشی از بیمارستانها، یا روشی دیگر، مثلا دسترسی به اسم افراد فوت شده وجود داشته است. نمیتوان گفت. بعد هم اگر این عدد را پیدا کنیم هنوز به دلایل ذکر شده در بند دوم نمیتوانیم تخمینی از کل بیماران پیدا کنیم.
6- ششمین منبع دادههای مربوط به چین است. با این فرض که روند بیماری در چین تمام شده، دست کم چند متغیر اصلی، مانند آرنات (R0) و درصد مرگ و میر را محاسبه کنیم و از آنها به عنوان ورودی برای تخمین سایر متغیرها در ایران استفاده کنیم. آرنات متغیری است که همانطور که به خصوصیات بیماری وابسته است، به خصوصیات رفتاری افراد نیز وابسته است. مثلا فاصله افراد در ایران، در هنگام صحبتکردن عموما کم است. یا افراد، بیشتر، دست میدهند. همه اینها، علاوه بر میزان چگالی جمعیت، بر آرنات اثر گذار است. درصد مرگ و میر هم میتواند تا حدی وابسته به سیستم بهداشتی کشور باشد و از طرف دیگر تخمین مرگ و میر در چین هم با توجه به این که لزوما همه افراد مبتلا تشخیص داده نشدهاند مشکل است.
و احتمالا میتوان محدودیتهای متعدد دیگری هم اضافه کرد.
.
با توجه به این محدودیت ها، یک مدل ساز چند گزینه دارد. مثلا: 1) باز تلاش کند و داده های دیگر را پیگیری کند، 2) میزان خطا و بازه اطمینان را در پیش بینیهایش به دقت لحاظ کند و 3) کار گروهی انجام دهد، و نتیجه نهایی حاصل خروجی مدلهای مختلف با فرضهای متفاوت باشد، و 4) یک قدم به عقب برگردد و در مورد سوال اصلی تامل کند. سوال اصلی، شاید، بیش از این که تعداد کنونی بیماران باشد، مربوط به روند بیماری است: آیا روند صعودی است؟ اگر بلی، کِی نزولی میشود؟ آیا از نقطه چرخش عبور کردهایم و میتوانیم مدارس را باز کنیم یا باید صبر کنیم؟ کدام استانها نزدیکتر به بهبودیاند؟ و الی آخر.
دقت فریبنده تستهای پادتنی
بحث دقتهای فریبنده تستهای پادتنی همزمان با انتشار نتایج بعضی از این تستها داغ شده (نمونه آلمان و نمونه کالیفرنیا). اصل مساله که توجه به قضیه بیز است که در آمار و احتمالات مقدماتی تدریس میشود . اما بدون استفاده از معادله و مقدمات آن هم میشود از یک مثال ساده برای انتقال مطلب استفاده کرد.
فرض کنیم تستی پادتنی با “دقت خوب” داریم که ۹۵ درصد کسانی که قبلا به کرونا مبتلا نشدهاند را به درستی تشخیص منفی میدهد. حالا این تست را مثلا به هاوایی میبریم و روی ۱۰۰۰ نفر به شکل تصادفی استفاده میکنیم. فرض کنید که هاوایی حدود نیم درصد جمعیتش مبتلا شده، ولی ما از این رقم اطلاع نداریم. در این تعداد ۱۰۰۰ نفری٫تست خوشدقت ما (حدود) ۵ نفر مبتلای واقعی را کاملا درست تشخیص میدهد. از طرفی ۹۹۵ نفر انسان کروناندیده هم داریم که تست ما ۹۵ درصدشان را به درستی تشخیص منفی میدهد. اما آن ۵ درصد خطای ناقابل به عبارتی میشود حدود ۵۰ نفر!
یعنی آخر کار، تست ما حدود ۵۵ مورد مثبت اعلام کرده که فقط ۵ تای آنها واقعا کرونا گرفته بودند و ۵۰ تای دیگر اشتباه بوده! یعنی اگر کسی در هاوایی نتیجه تستش مثبت باشد، به احتمال کمتر از ۱۰ درصد قبلا واقعا کرونا گرفته و میتواند با خیالراحت در جامعه جولانبدهد.خوش دقتی تست ما در جایی مثل هاوایی که رواج بیماری محدودبوده میتواندخیلی فریبنده باشد.
مرکز امنیت بهداشت دانشگاه جانزهاپنیز مجموعه جامعی از تستهای پادتنی مختلفی که در چند ماه گذشته برای بیماری کرونا توسعه یافته را جمعآوری کرده و در هر مورد مکانیزم و عددهای ادعایی در مورد حساسیت و ویژگی هر تست را اعلام کرده. مثلا ویژگی (specificity) همین تست فرضی ما ۹۵ درصد بود و بازه ویژگی تستهای موجود در محدوده ۹۵ تا ۱۰۰ اعلام شدهاند. هر چند که به اعداد خیلی بالای نزدیک ۱۰۰ باید به خاطر تعداد کم نمونههای ازمایش با دیده تردید نگاه کرد. همینطور باید توجه کرد که حتی خطای ۱ درصدی هم در اینجا — به دلیلی که در بالا اشاره شد — ممکن است به نتیجهگیری نادرست در مورد میزان گستردگی بیش از مقدار واقعی ویروس در جامعه بیانجامد.
مدلسازی در زمانِ شیوع بیماری
نوید غفارزادگان
تاکنون احتمالا با سیری از مدلهای ریاضی برای تخمین تعداد بیماران و مرگ و میر ناشی از ویروس کرونا مواجه شدهاید. هر چند در مورد ایران تعداد مدلها محدود بوده است، اما در مورد سایر کشورها و به خصوص آمریکا انواع مختلفی ارائه شده است. بر اساس مشاهدات، میتوان مدلهای موجود تا به این لحظه را در دستهبندیهای زیر قرار داد:
1- روشهای curve fitting: در این رویکرد، بر اساس نمودارِ از پیش تعیینشدهای، منحنی خاصی بر روند موجود در دادهها منطبق میشود، و با استفاده از آن روند آینده بیماری تخمین زده میشود. این روش، در صورت انجام مناسب آن، نهایتا برای پیشبینی چند روز آینده میتواند مفید باشد و در بلند مدت به اشتباههای با مقیاس بزرگ منجر میشود.
2- مدلهای ابتداییِ SIR: با توجه به سادگی و در عین حال اعتبارِ این مدل، SIR متداولترین نوع مدلسازی است. این مدلها، مبتنی بر تفکیک جمعیتِ در معرض بیماری از افراد بیمار و افراد بهبود یافته (یا متوفی) استوار است و دو فیدبک اصلی را لحاظ میکنند: فیدبک مثبتِ افزایش بیماری و فیدبک منفیِ اشباع افراد بیمار. جایگاه SIR در اپیدیمیولوژی مانند جایگاه قوانین نیوتون در فیزیک است: معتبر و عموما خوب برای ارائه یک توصیف ساده. با این حال همانند قوانین نیوتون، باید معادلات بدرستی نوشته شود و پارامترها درست انتخاب شود، که حتی در این حد نیز بسیاری از مدلسازهای موجود اشتباه میکنند. اما اشتباه اصلیتر از آنجا ناشی میشود که برخی مدلسازان، دینامیک تغییرِ تست را لحاظ نمیکنند. (در واقع در مثال فیزیک، مانند این است که دادههای ارائه شده در مورد حرکت سیارهای که وارد معادلاتمان میکنیم، هم با خطای زیاد همراه باشد و هم چند بار تلسکوپ تغییر کرده باشد!) در مورد بیماری اخیر، عموما، رشد ظرفیت تست، مخصوصا در روزهای ابتدایی، از رشد بیماری سریعتر بوده است. از این رو، روند ابتدایی رشد دادههای بیماری که مربوط به رشد تست است، با رشد خودِ بیماری اشتباه گرفته شده است، و در نتیجه R0 تخمین زده شده مقادیری بالاتر از سه و چهار گرفته است.
3- مدلهای SIR ساده با در نظر گرفتن فیدبکهای بیشتر: با توجه به شرایط بیماری و پاسخهای اجتماع برخی از پارامترهای موجود در مدل SIR به مرور زمان تغییر میکنند. در این گونه مدل ها، چنین پارامترهایی به عنوان تابعی از متغیرهای دیگر مدل تعریف میشوند. نمونهای از فیدبکها: گسترش تست، افزایش تقاضا برای تست، پاسخ سیستم بهداشت و درمان و ظرفیت محدود بیمارستانها، کاهش تماسهای اجتماعی، و … در نظر گرفتن این فیدبکها به دقت مدل کمک میکند. هر چند ممکن است دادهای در مورد این فیدبکها موجود نباشد، اما چشمپوشی از آنها مانند این است که فرض کنیم اثرشان صفر است. صفر لزوما عدد دقیقتری از فرضِ مبتنی بر شهود مدل ساز نیست.
4- مدلهای توسعه یافته SIR با در نظر گرفتن “جزییات” بیشتر (و شاید فیدبک بیشتر): این گونه مدلها تمرکز بیشتری بر تفکیک انواع بیماران میکنند. مثلا شدت بیماری و گروه سنی دو نوع متداول تقسیم بندی است. یا می توان SIR را برای جغرافیای مختلف ارائه داد، و بعد حمل و نقل بین مناطق مختلف را در مدل لحاظ کرد. این مدلها می تواند فیدبکهای بیشتر داشته باشد، یا این که مانند مدل ابتدایی SIR فقط بر دو فیدبک اصلی اکتفا کنند. آیا جزییات بیشتر کمک می کنند؟ در برخی موارد، بلی. مثلا اگر سیاست ایزوله کردن فردی را تست میکنید، اگر لحاظ نکنید که برخی از بیماران نشانهای ندارند و در نتیجه از بیماری خود آگاه نیستند که خود را ایزوله کنند، ممکن است اثر ایزوله کردن را زیادتر از مقدار واقعی تخمین بزنید. در برخی موارد نیز دیده میشود که مدلساز با اضافه کردن جزییات فقط خطای بیشتری در تاخیرها را وارد مدل کرده است که این امر نه تنها کمک نمیکند که میتواند به تخمینهای اشتباه منجر شود.
5- مدلهای با واحد فرد بیمار و ساختار شبکهای: در این گونه مدلها تمرکز بیشتری بر الگوی جغرافیایی و شبکهای پیشرفت بیماری معطوف میشود. این گونه مدلها هم عموما فیدبک شیوع بیماری را دارند. مدلهای بهتر در این دسته باید بازخور شرایط بر رفتار افراد و تغییرات مربوط به تست را نیز مدنظر قرار دهند. با این حال تعداد این گونه مدلها، در زمان شیوع بیماری، کمتر از سایر مدل ها بوده است که دلیل آن احتمالا به زمان زیاد مورد نیاز برای ساختن، و ارزش افزوده کم آن در مقایسه با مدلهای سادهتر، در شرایطی که بیماری از یک گروه و جغرافیای محدود عبور کرده باشد مربوط میشود. معمولا مدلهای از پیشساختهای موجود است که انتظار میرود در این شرایط دوباره کالیبره و استفاده شوند که تا به حال این اتفاق کمتر افتاده است. با اتمام دوره بیماری شاهد مدلهای جزئی و شبکهای بیشتری خواهیم بود.
در برخی مباحث آنلاین، به تفکیک مدلها بر اساس برچسبِ سیستم داینامیکس و کامپارتمنتال و مدلهای شبکهای پرداخته شده، که به نظر غیردقیق است. از منظر سیستم داینامیکس تمامی موارد دو تا پنج میتوانند مدل سیستم داینامیکس باشند، اگر لوپِ فیدبک داشته باشند. در واقع قدمت SIR که نوعی مدل سیستم داینامیکس است، از واژه “سیستم داینامیکس” بیشتر است. کامپارتمنتالها تمامی موارد دو تا چهار را شامل میشوند. مدلهای شبکهای میتوانند به صورت حالت چهار یا پنج باشند، بسته به این که واحد تحلیل چقدر جزئی باشد. در نهایت تمامی این مدلها ممکن است اشتباهات ساختاری داشته باشند (مثلا در تقسیم خروجی از بیماری به بهبود و مرگ بیدقت باشند) یا فرضهای ساده کننده داشته باشند. در حال حاضر با «مدلسازی در زمانِ شیوع بیماری» مواجه هستیم و محدودیت زمان در انواع مدلها، رویکردها، و خطای تخمینها تاثیرگذار است.