برآورد همخوانی بالینی برای آزمایشهای کیفی
یک حسابگر اینترنتی برای جدول 2×2 پیشامدهای محتمل
توضیح:
اصل این مقاله بر روی وبسایت Westgard QC منتشر شده است:
https://www.westgard.com/qualitative-test-clinical-agreement.htm
ترجمه این مقاله برای تقدیم به آزمایشگاهیان ایران، از طریق انتشار در فضای مجازی و نیز چاپ در مجله اخبار آزمایشگاهی، با کسب اجازه از استن وستگارد مدیر وبسایت Westgard QC انجام شده است. از لطف ایشان و نیز پروفسور وستگارد بسیار سپاسگزاریم.
همچنین از لطف جناب آقای دکتر عابدی سردبیر محترم اخبار آزمایشگاهی و کارکنان تلاشگر آن ماهنامه بابت انتشار این ترجمه سپاسگزاریم.
مترجمان: مهدی صابونی و حسن بیات؛ دکترای علوم آزمایشگاهی
چگونه یک آزمایش کیفی را ارزشیابی میکنید؟ در اینجا ابزار کوچکی که ممکن است برای ارزشیابی آزمایشهای ویروسی به کارتان بیاید، معرفی میشود.
جیمز اُ. وستگارد، پاتریشیا ای. گرت، پائول شیلینگ
آوریل 2020
وسط پاندمی جاری کووید-19، کمک به آزمایشگاههای پزشکی برای ارزشیابی آزمایشهای کیفی میتواند مفید باشد. آزمایشگاههای بزرگتر که آزمایشهای rRNA-PCR را برای پیدا کردن ویروس و آزمایشهای سرولوژی را برای پیدا کردن آنتیبادیهای ضد SARS-CoV-2 انجام میدهند، احتمالاً به برنامههای آماری دسترسی دارند که از توصیههای FDA و CLSI برای ارزشیابی روشها تبعیت میکنند، اما احتمال اینکه آزمایشگاههای کوچکتر چنین برنامههایی داشته باشند کمتر است، با این وجود، با ورود روشهای سادهتر یا خودکارتر (more automated)، آزمایشگاههای کوچک نیز برخی بررسیهای حداقلی را برای ارزشیابی یا گواهی کردن (راستی آزمایی) نیاز خواهند داشت.
برای اینکه شفاف صحبت کنیم باید اشاره کنیم که دو نوع آزمایش جدید وجود دارد:
(1) آزمایشهایی برای شناسایی خود ویروس SARS-CoV-2 و
(2) آزمایشهایی برای شناسایی آنتیبادیهای ضد این ویروس
در حال حاضر برای آزمایش هر یک از این مارکرها از روشهای متعددی استفاده میشود که بهسرعت توسط FDA تحت عنوان « مجوز استفاده اضطراری» (Emergency Use Authorization ;EUA) در حال دریافت تأییدیه هستند. اغلب روشهای شناسایی ویروس، اما نه همه آنها، بر مبنای PCR هستند و اکثر قریب به اتفاق روشهای شناسایی آنتیبادیها اساساً در دسته آزمایشهای سرولوژی قرار میگیرند. معمولاً PCR و سایر روشهای اسید نوکلئیکی و مولکولی بسته به اینکه دستگاههای لازم برای این فناوریها کجا نصب شدهاند، در یکی از بخشهای آزمایشگاه و آزمایشهای سرولوژی معمولاً در بخش دیگری انجام میشوند. با معرفی آزمایشهای ساده مبتنی بر فنآوری جریان جانبی (lateral flow) [تستهای تشخیص سریع]، این آزمایشها در محل مراقبت (Point of Care) نیز انجام خواهند شد. همه این آزمایشها آزمایشهای کیفی هستند؛ به این معنی که برای دستهبندی نتایج به مثبت و منفی یک نقطه تصمیمگیری بالینی [تمایزگاه] (cutoff) دارند. آزمایشگاههایی که توسط CLIA برای انجام آزمایشهای دارای پیچیدگی متوسط و زیاد تأیید شدهاند صلاحیت آن را دارند که کیتهایی را که تحت EUA تأیید شدهاند، به کار ببرند. البته این آزمایشگاهها برای استفاده از این روشها باید ارزشیابی روش را انجام دهند و علاوه بر آن با هر دور از نمونههای بیماران، نمونههای مثبت و منفی را هم آزمایش کنند [1].
بررسی همخوانی بالینی
سازمان غذا و داروی امریکا (FDA) برای انجام ارزشیابی (validation) روشها، «بررسی همخوانی بالینی» (Clinical Agreement Study) به همراه تعیین حد شناسایی (Limit of Detection ;LoD) و بررسی واکنش متقاطع (Cross reactivity) را توصیه میکند. در این نوشته ما بر همخوانی بالینی تمرکز میکنیم که معمولاً عبارت است از مقایسه نتایج دو روش مختلف. بنا بر گفته FDA، میتوان از نمونههای ساختگی یا «نمونههای بالینی غیر اصیل» استفاده کرد؛ یعنی میتوان از نمونههایی که به آنها مواد کنترلی با غلظت بالا (ترجیحاً غیرفعال) اضافه شده است، استفاده نمود. توصیه FDA این است که 30 نمونه واکنشدهنده (reactive) [مثبت] (20 تا در محدوده 1 یا 2 برابر LoD و 10 تا در سطوح بالاتر، طوری که بازه آزمایش را پوشش دهد) و 30 نمونه غیرواکنشدهنده (non-reactive) [منفی] استفاده شود. همچنین FDA الزام میکند که 5 نتیجه اول مثبت و 5 نتیجه اول منفی بیماران واقعی با روش دیگری که قبلاً مجوز EUA گرفته است، تأیید شوند.
در سند CLSI EP-12-A2، راهکارنمای مقایسه یک روش آزمایش جدید یا «نامزد» با یک روش آزمایش موجود یا «مقیاس» فراهم شده است [2]. ما انتظار داریم بیشتر آزمایشگاهها به نمونههایی دسترسی داشته باشند که قبلاً توسط آزمایشگاه دیگری در آن منطقه، شاید یک آزمایشگاه مرجع که شبکه بیمارستانی از آن استفاده میکند، یا یک آزمایشگاه بزرگتر دارای سطح پیچیدگی بیشتر که برای ارجاع استفاده میشود، آزمایش شده باشد. بهعنوان راه جایگزین، آزمایشگاه میتواند از نمونههای بیمارانی که عفونت ایشان مسجل شده است و نمونههای بیماران فاقد عفونت استفاده کند.
تحلیل دادهها با استفاده از جدول 2×2 پیشامدهای محتمل
نظر به اینکه در بررسی مقایسهای، نتایج روش نامزد و روش مقیاس بهصورت مثبت و منفی دستهبندی میشوند، میتوان نتایج را بهصورت زیر خلاصهبندی کرد:
a = تعداد نتایجی که با هر دو روش مثبت است؛
b = تعداد نتایجی که با روش مقیاس منفی است، اما با نامزد مثبت است؛
c = تعداد نتایجی که با روش مقیاس مثبت است، اما با نامزد منفی است؛
d = تعداد نتایجی که با هر دو روش منفی است.
این نتایج را میتوان در یک جدول 2×2 پیشامدهای محتمل که گاهی «جدول حقیقت” (truth table) نامیده میشود، مرتب کرد.
روش مقیاس |
|||
روش (آزمایش) نامزد |
Positive | Negative | Total |
Positive | A | b |
a + b |
Negative |
C | d | c + d |
Total | a + c | b + d |
N |
محاسبه ویژگیهای عملکردی
همانطور که میبینید، این جدولبندی مبنایی بــــــــرای محاســــبه «درصد همخوانی مثبت» (Percent Positive Agreement ;PPA)، «درصد همخوانـی منفی» (Percent Negative Agreement ;PNA) و «درصد همخوانی کل» (Percent Overall Agreement ;POA) را فراهم میکند:
PPA = [(a/(a+c)] x 100
PNA = [d/(b+d)] x 100
POA = [(a+d)/n] x 100
اگر آرمانی فکر کنیم، درصد همخوانی مثبت (PPA) و درصد همخوانی منفی (PNA) باید 100% بشود، در صورتی چنین خواهد شد که b و c صفر باشند. مقادیر پایینتر PPA و PNA نمایانگر این است که عملکرد روش نامزد کاملاً مطلوب نیست؛ بنابراین برآورد PPA و PNA ممکن است برای قضاوت درباره قابل قبول بودن روش نامزد ثمربخش باشد. POA کمتر به درد میخورد زیرا ممکن است حتی وقتی که PPA و PNA پایین هستند، بالا باشد. [توجه: اگر روش مقیاس یک «معیار طلایی» (gold standard) باشد، آنگاه میتوان PPA را «حساسیت تشخیصی» و PNA را «اختصاصیت تشخیصی» روش نامزد در نظر گرفت، گاهی POA را «کارآیی» (efficiency) مینامند]. برای اینکه بتوان این ویژگیهای محاسبهشده را تفسیر کرد، باید دامنه اطمینان (confidence interval) این ویژگیها (یعنی قابلیت اطمینان این ارقام)، معلوم باشد. در جدول زیر مثالی همراه دامنه اطمینان ارائه شده است. برای اطلاع از چگونگی محاسبه حدود اطمینان، ضمیمه را ببینید.
|
روش مقیاس | ||
روش (آزمایش) نامزد | Positive | Negative |
Total |
Positive |
285 | 15 |
300 |
Negative |
14 | 222 | 236 |
Total | 299 | 237 |
536 |
دامنههای اطمینان 95% |
|||
خلاصه آمارها |
Percent | Lo Limit |
Hi Limit |
همخوانی مثبت PPA |
95.3% | 92.3% | 97.2% |
همخوانی منفی PNA | 93.7% | 89.8% |
96.1% |
همخوانی کل POA | 94.6% | 92.3% |
96.2% |
در مثال بالا [که از CLSI EP-12-A2، صفحه 30 تا 31 گرفته شده است]، PPA برابر 95/35% برآورد شده است و میتوان 95% اطمینان داشت که بین 92/3% تا 97/2% است. PNA برابر 97/3% برآورد شده است و میتوان 95% اطمینان داشت که بین 89/8% تا 96/1% است. در حالی که ما POA را برابر 94/6% و بازه اطمینان 95% آن را تقریباً 92/3% تا 96/2% برآورد کردهایم، این ویژگی به اندازه دو ویژگی دیگر سودمند نیست و لازم نیست برای قضاوت درباره قابل قبول بودن روش، در نظر گرفته شود. [مترجم: هر چه دامنه اطمینان برای یک روش باریکتر باشد، ویژگی محاسبهشده قابل اعتمادتر است].
توجه داشته باشید که وقتی تعداد نمونهها اندک است، انتظار میرود که بازه اطمینان وسیع باشد [قابلیت اطمینان ویژگی محاسبهشده کمتر باشد]. بهعنوان مثال، حد پایین اطمینان برای 5 نتیجه مثبت و 5 نتیجه منفی بدون هیچ مثبت کاذب و منفی کاذبی، تقریباً 57% خواهد بود [مترجم: یعنی در حالی که با این دادهها، حساسیت و اختصاصیت 100% محاسبه میشود، اما به دلیل اینکه تعداد نمونههای بررسیشده اندک است، نمیتوان خیلی مطمئن بود که حساسیت و اختصاصیت واقعاً 100% باشد، بلکه با توجه به حد اطمینان پایین که برابر با 57% است میتوان گفت که حساسیت و اختصاصیت واقعی با احتمال 95% در دامنه 57% تا 100% قرار دارد؛ یعنی ممکن است حتا تا حد 57% پایین باشد]؛ در حالی که برای 10 نتیجه مثبت و 10 نتیجه منفی تقریباً 72%؛ برای 30 تا تقریباً 89%؛ برای 40 تا تقریباً 91%؛ و برای 50 تا تقریباً 93% خواهد بود. همه این حدها برای مقایسههایی با سازگاری کامل [بدون هیچ مثبت کاذب و منفی کاذبی] هستند. هرچه تعداد نمونهها کمتر باشد، حتا با یک نازساگاری (مثبت کاذب یا منفی کاذب) شاهد افت اطمینان شدیدتری خواهیم بود. [جدول A1 در EP 12-A2، صفحه 35 را ببینید]. این مثال نشان میدهد که چرا FDA توصیه میکند دستکم از 30 نمونه مثبت و 30 نمونه منفی استفاده شود تا بتوان برآوردهایی با قابلیت اطمینان بالاتر از کف قابل قبول بهدست آورد. [مترجم: در حال حاضر FDA تعداد نمونه منفی را از حداقل 30 به حداقل 75 نمونه افزایش داده است].
حسابگر 2×2 پیشامدهای محتمل درWestgard QC
http://tools.westgard.com/two-by-two-contingency.shtml
برای استفاده از این حسابگر، 4 عدد مربوط به a (مثبت واقعی)، b (مثبت کاذب)، c (منفی کاذب) و d (منفی واقعی) را در جدول پیشامدهای محتمل بگذارید. سپس روی دکمه ”Calculate“ کلیک کنید تا مقادیر «همخوانی مثبت» (PPA)، «همخوانی منفی» (PNA) و «همخوانی کل» (POA)، همراه با حدود اطمینان 95% بالایی و پائینی آنها نمایش داده شود. برای دیدن مثالی که در این درس عرضه شد، روی ”Load Example Data“ کلیک کنید. برای مستندسازی نتایجتان میتوانید صفحه را چاپ کنید.
[یک درس دیگر بر روی وبسایت وستگارد درباره ارزشیابی آزمایشهای کیفی وجود دارد که توسط دکتر Paulo Pereira ارائه شده است و حاوی جزئیات بیشتر است. برای مطالعه آن میتوانید به نشانی زیر مراجعه کنید]:
https://www.westgard.com/validating-qualitative-tests.htm
References:
- US Dept Health and Human Services. FDA Policy for Diagnostic Tests for Coronavirus Disease-2019 during Public Health Emergency: Immediately in Effect Guidance for Clinical Laboratories, Commercial Manufacturers, and Food and Drug Administration Staff. March 16, 2020. https://www.fda.gov/media/135010/download
- Garrett PE, Lasky FD, Meier KL. CLSI EP12-A2. User Protocol for Evaluation of Qualitative Test Performance. Clinical and Laboratory Standards Institute, 940 West Valley Road, Suite 1400, Wayne, PA, 2008.
ضمیمه: محاسبه حدود اطمینان
این محاسبات سخت نیستند، اما اندکی پردردسرند. محاسبات در دو مرحله توضیح داده شدهاند: ابتدا محاسبه برخی کمیّتها (Qi) از جدول، سپس محاسبه محدودههای اطمینان بالایی و پائینی از این Qها. [این محاسبات در CLSI EP12-A2، صفحات 23 تا 25 توضیح داده شده است].
محاسبات لازم برای حدود اطمینان 95% برای PPA:
Q1 = 2a + 3.84
Q2 = 1.96*[3.84 + 4a*c/(a+c)]1/2
Q3 = 2(a+c) + 7.68
PPA lo limit = 100*(Q1-Q2)/Q3
PPA hi limit = 100*(Q1+Q2)/Q3
سپس، محاسبات مشابه برای PNA:
Q4 = 2d + 3.84
Q5 = 1.96*[3.84 + 4bd/(b+d)]1/2
Q6 = 2(b+d) + 7.68
PNA lo limit = 100*(Q4-Q5)/Q6
PNA hi limit = 100*(Q4+Q5)/Q6
نهایتاً، محاسبات مشابه برای POA:
Q7 = 2(a+d) + 3.84
Q8 = 1.96*[3.84 + 4(a+d)(b+c)/n]1/2
Q9 = 2n + 7.68
POA lo limit = 100*(Q7-Q8)/Q9
POA hi limit = 100*(Q7+Q8)/Q9
آموزش این ماشین تغییر (2) احراز شغلهای کلیدی
عوامل مداخلهگر، تداخلات دارویی و مقادير بحراني در تستهاي بیوشيمي ( 1)
برای دانلود فایل pdf بر روی لینک زیر کلیک کنید
ورود / ثبت نام