یادگیری عمیق[1] در مسیر ورود به آزمایشگاه

یادگیری عمیق[1] در مسیر ورود به آزمایشگاه

زهرا مولایی

آیا دوران پاتولوژیست‌ها به سر رسیده است؟ اگرچه پاسخ این سؤال قطعاً منفی است اما به‌موازات پیشرفت‌های تکنولوژیکی در تشخیص بالینی این سؤال باید با اهمیت و تأکید بیشتری پرسیده شود؛ تکنولوژی‌هایی مانند یادگیری ماشین[2] و هوش مصنوعی که ثابت شده است تشخیص آنها می‌تواند به‌اندازه تشخیص متخصصان انسانی دقیق و کارآمد باشد.

یکی از حوزه‌های پاتولوژی که گسترش سریعی را در قدرت تشخیصی فناوری رایانه تجربه می‌کند، آنالیز خودکار تصاویر دیجیتال است [3](DIA) است. یک پژوهش جدید نشان داده است که اسکورینگ بیومارکرهای سرطان سینه (Ki67، ER، PR و HER2) با استفاده از DIA می‌تواند زیرگروه مولکولی سرطان را با حساسیت و اختصاصیت بیشتری نسبت به اسکورینگ دستی توسط پاتولوژیست‌های دارای مدرک بورد، پیش‌بینی نماید. چشم‌انداز استفاده از چنین ابزارهایی به تحقیقات و پژوهش‌ها محدود نمی‌شود؛ چرا که استفاده از آنالیزورها برای اسکورینگ این بیومارکرها توسط سازمان غذا و دارو (FDA) تأیید شده است.

پاتولوژی بالینی به یک بستر مناسب برای استفاده از DIA تبدیل شده است، این بار به‌صورت یک آنالیزور برای بررسی گسترش خون محیطی که توسط FDA نیز تأیید شده است. این آنالیزور با استفاده از روش یادگیری ماشین و بر اساس انواع مورفولوژیکی، لکوسیت‌ها را شناسایی، طبقه‌بندی و شمارش می‌کند و از این طریق به تکنسین یا پاتولوژیست در انجام شمارش افتراقی دستی کمک می‌کند، با این وجود در حال حاضر هیچ ابزار مشابهی برای توصیف مورفولوژیکی اریتروسیت‌ها (RBCs) وجود ندارد که توسط FDA تأیید شده باشد.

در این شماره از ژورنال Clinical Chemistry، دورانت و همکاران یک ابزار DIA جدید را معرفی کرده‌اند که از شبکه‌های عصبی پیچشی [4](CNNs) بسیار عمیق برای پیش‌بینی مورفولوژی RBCها به‌منظور شناسایی جمعیت‌های ناهنجار چشمگیر استفاده می‌کند و می‌تواند به تشخیص بیماری‌های هماتولوژیک و غیر‌هماتولوژیک کمک کند. آنها دریافتند که روششان از یک آنالیزور تأییدنشده توسط FDA بهتر عمل می‌کند، همانند دستگاهی که برای طبقه‌بندی مورفولوژی لکوسیت‌ها مورد استفاده قرار می‌گیرد. روش آنها نه‌تنها در طبقه‌بندی مورفولوژیکی از دقت بالایی برخوردار است، بلکه می‌تواند سازگاری، تکرارپذیری و کارایی بسیار بیشتری را نسبت به پروسه آهسته و دستی فعلی برای بررسی گسترش خون محیطی به ارمغان بیاورد.

الگوریتم استفاده‌شده توسط دورانت و همکاران، مثالی است از یادگیری عمیق؛ مجموعه‌ای از تکنیک‌های قدرتمند و جدید یادگیری ماشین که برای طبقه‌بندی موارد جدید مانند RBCها، با استفاده از الگوریتم‌های «یاد گرفته‌شده» از الگوهای از قبل تهیه‌شده، طراحی شده است. یادگیری عمیق هم در حیطه پزشکی و هم در سایر حوزه‌ها کاربردهای فراوانی دارد؛ از جمله: شناسایی تصویر، تشخیص گفتار، داروپژوهی[5] و آنالیز جهش[6]. اگرچه مطالعه دورانت و همکاران نشان‌دهنده کاربرد اول یادگیری عمیق در DIA در حیطه پاتولوژی بالینی است، اما قبلاً برای استفاده در پاتولوژی آناتومیک نیز مورد بررسی قرار گرفته است.

یادگیری عمیق از چند جنبه با تکنیک‌های سابق یادگیری ماشین متفاوت است؛ مهم‌ترین تفاوت آنها توانایی یادگیری «ویژگی» است. ویژگی‌هایی که اجزاء اطلاعاتی مواردی هستند که باید طبقه‌بندی شوند. الگوریتم‌هایی با پیچیدگی کمتر باید به تعداد محدودی از ویژگی‌های از پیش تعیین‌شده (مانند ناحیه کمرنگ مرکزی و اسپیکول‌های غشایی در RBCها) متکی باشند، اما یادگیری عمیق مجموعه‌ای از مفیدترین ویژگی‌های آن را شناسایی می‌کند. یکی دیگر از مزایای استفاده از CNN توسط دورانت و همکاران قابلیت عملکرد آن در یک میدان موضعی کوچک از تصویر به‌جای کل تصویر است. این امر به مدل این امکان را می‌دهد که جهت و چرخش تصویر را نادیده بگیرد و اگر غیر از این بود استفاده از آن در گسترش خون محیطی که RBCها در آن به‌صورت اتفاقی پراکنده شده‌اند، دشوار بود و در نهایت همانطور که از نام این تکنیک برمی‌آید، دیگر حسن یادگیری عمیق، عمق آن است، یا به عبارتی توانایی جمع‌آوری اطلاعات از لایه‌های متعدد ورودی و از بین مقدار بسیار زیادی داده آموزشی برای ارتقای دقت طبقه‌بندی.

با این وجود یادگیری عمیق نیز مانند یادگیری ماشین، محدودیت‌ها و چالش‌های خاص خود را دارد. این تکنیک مانند «جعبه سیاه» به نظر می‌رسد؛ زمانی که نتیجه یک طبقه‌بندی غیرمنتظره یا غیرواقعی است، شناسایی منبع خطا یا توضیح پروسه عملکرد آن به‌گونه‌ای که قابل‌فهم باشد، بسیار دشوار به‌نظر می‌رسد. یکی از مزایای یادگیری عمیق (یادگیری بی‌نظارت ویژگی‌ها[7]) زمانی که لازم است توضیح دهیم الگوریتم از چه ویژگی‌هایی برای پیش‌بینی کردن استفاده می‌کند، تبدیل به یک نقص می‌شود، به‌علاوه در حوزه یادگیری ماشین اصطلاحات و عباراتی استفاده می‌شود که ممکن است پزشکان به‌ویژه متخصصان آزمایشگاه را سردرگم کند؛ مانند «فراخوانی[8]» به‌جای «حساسیت» و «دقت» به‌جای «ارزش پیش‌بینی مثبت[9]». با این وجود این اصطلاحات به روشن شدن تفاوت‌های عملی، کاربردی و استنتاجی بین یادگیری ماشین در سطح مجموعه‌های عظیم اطلاعات و معیارهای ساده‌ی دقت تست‌ها کمک می‌کند. آنها سعی می‌کنند این واقعیت را که یادگیری ماشین در اصل خود یک ابزار تشخیص است که عمدتاً به شیوه هر تست آزمایشگاهی تشخیصی دیگری عمل می‌کند، کمرنگ سازند.

با تداوم افزایش محبوبیت یادگیری ماشین، این تکنولوژی انتقادات نسبت به محدودیت‌های خود را به چالش می‌کشد. هرچند برخی از این انتقادات به دلیل عدم درک آن است. بسیار مهم است که بدانیم چرا و چگونه این سیستم در انجام وظیفه خود شکست می‌خورد. این خطاها ممکن است به دلیل چگونگی ساخت مجموعه آموزشی باشد. اگر متخصصانی که مجموعه آموزشی را با طبقه‌بندی «صحیح» برچسب‌گذاری می‌کنند، دچار خطا شوند یا در برچسب مناسب به توافق نرسند، این الگوریتم ممکن است خطاهایی را مرتکب شود.

خوشبختانه اگر اکثر برچسب‌ها صحیح باشند، این خطاها بسیار کاهش می‌یابند، زیرا الگوریتم اثر برچسب‌های نادرست را به حداقل خواهد رساند. این مسئله را دورانت و همکارانش زمانی کشف کردند که متوجه شدند تعداد کمی از RBCها در مجموعه تست آنها به‌صورت نادرست برچسب‌گذاری شده‌اند. این اتفاق باعث شد الگوریتم آنها «اشتباه» کند اما به لحاظ بالینی پیش‌بینی مناسبی را ارائه دهد. روش‌های یادگیری عمیق ممکن است به میزان داده‌های در دسترس[10] نیز حساس باشند و به همین دلیل نیازمند مجموعه‌های آموزشی بزرگ است تا از خطاهای پیش برازش[11] اجتناب شود. دورانت و همکاران همچنین خاطرنشان کردند که دقت طبقه‌بندی در مورد انواعی از RBCها که در مجموعه آموزشی آنها به‌خوبی نمایش داده شده بودند (ماند شیستوسیت‌ها و سلول‌های هدف) بسیار بالاتر از انواعی بود که به‌صورت ضعیفی نمایش داده شده بودند (مانند داکروسیت‌ها).

در نهایت خائنانه‌ترین محدودیت یادگیری ماشین، ناتوانی در تلفیق و گردآوری اطلاعات و آگاهی‌هایی است که در مجموعه آموزشی اصلی وجود نداشته است. در پزشکی این بدان معناست که ویژگی‌های پیچیده و کیفی بیمار (برای مثال سابقه بیمار) در طبقه‌بندی شرکت داده نمی‌شود. مباحث بالینی در بررسی نتایج DIA نقش حیاتی دارند، به‌صورتی که ممکن است سلول‌های ناهنجار بر اساس سابقه و شرح‌حال بیمار به شیوه منطقی دیگری تفسیر شوند. در واقع این تکنیک با دیگر تست‌های آزمایشگاهی تفاوتی ندارد و همه دستگاه‌های DIA مورد تأیید FDA تنها می‌توانند به‌عنوان یک مساعدت  به اپراتور یا پاتولوژیست که مسئول طبقه‌بندی نهایی هستند، در نظر گرفته شوند. سرانجام ممکن است بتوان داده‌های ورودی کافی برای یک الگوریتم مانند الگوریتم دورانت فراهم آورد تا بتواند به‌عنوان یک دستگاه تشخیص ابتدایی عمل کنند.

علی‌رغم این محدودیت‌ها، فرصت‌های بسیاری برای وارد کردن یادگیری ماشین به آزمایشگاه‌های بالینی وجود دارد. با وجود این حجم از داده‌های جداگانه که برای هر بیمار ذخیره شده است، سیستم‌های اطلاعاتی آزمایشگاه‌ها می‌توانند یک مجموعه داده‌های ورودی ارزشمند را ایجاد کنند که می‌تواند منجر به تشخیص قابل اعتماد شود، به‌علاوه تصاویر خروجی DIA می‌توانند به رکوردهای پزشکی الکترونیک اضافه شوند تا به پزشکان در اتخاذ تصمیم درمانی کمک کنند. اگر پاتولوژیست‌ها در زمینه انفورماتیک، مهارت‌های کافی کسب کنند، فرصت بزرگی برای رشد تکنولوژیکی وجود دارد چرا که آنها می‌توانند این ابزارها را به‌طور مؤثر طراحی و راه‌اندازی کنند.

آیا دوران پاتولوژیست‌ها به سر رسیده است؟ نه، این اتفاق هرگز رخ نمی‌دهد اگر آنها در خط مقدم تکامل و یکپارچه‌سازی تکنولوژی‌های جدید مانند یادگیری ماشین باقی بمانند.

این مقاله ترجمه ای است از:

Deep Learning Makes Its Way to the

Clinical Laboratory

Ronald Jackups, Jr.1*

Clinical Chemistry 63:12

17901791 (2017)

منابع:

1. Gandomkar Z, Brennan PC, Mello-Thomas C. Computer-based image analysis in

breast pathology. J Pathol Inform 2016;7:43.

2. Stهlhammar G, Fuentes Martinez N, Lippert M, Tobin NP, Mّlholm I, Kis L, et al. Digital

image analysis outperforms manual biomarker assessment in breast cancer. Mod

Pathol 2016;29:318 29.

3. 510(k) premarket notification: Ventana Image Analysis System. Vol. 510(k) Number:

K050012 2005.

4. 510(k) premarket notification: Aperio ePathology eIHC IVD System. Vol. 510(k)

Number: K141109 2014.

5. 510(k) premarket notification: Cellavision DM96 Automatic Hematology Analyzer.

Vol. 510(k) Number: K033840 2004.

6. Durant TJS, Olson EM, Schulz WL, Torres R. Very deep convolutional neural networks

for morphologic classification of erythrocytes. Clin Chem 2017;63:184755.

7. Criel M, Godefroid M, Deckers B, Devos H, Cauwelier B, Emmerechts J. Evaluation of

the red blood cell advanced software application on the CellaVision DM96. Int J Lab

Hematol 2016;38:366 74.

8. Egele´ A, Stouten K, van der Heul-Nieuwenhuijsen L, de Bruin L, Teuns R, van Gelder W,

Riedl J. Classification of several morphological red blood cell abnormalities by DM96

digital imaging. Int J Lab Hematol 2016;38:e98 e101.

9. LeCun Y, Bengio Y, Hinton G. Deep learning. Nature 2015;521:436 44.

10. Janowczyk A, Madabhushi A. Deep learning for digital pathology image analysis: a

comprehensive tutorial with selected use cases. J Pathol Inform 2016;7:29.

11. Madabhushi A, Lee G. Image analysis and machine learning in digital pathology:

challenges and opportunities. Med Image Anal 2016;33:170 5.

12. Cabitza F, Rasoini R, Gensini GF. Unintended consequences of machine learning in

medicine. JAMA 2017;318:517 8.

13. Richardson A, Signor BM, Lidbury BA, Badrick T. Clinical chemistry in higher

dimensions: machine-learning and enhanced prediction from routine clinical chemistry

data. Clin Biochem 2016;49:121320.


[1]Deep Learning

[2]Machine Learning

[3]Automated digital Image Analysis(DIA)

[4] Convolutional neural Networks (CNNs)

[5]Drug discovery

[6] Mutation analysis

[7] Unsupervised learning of features

[8]Recall

[9]Positive predictive value.”

[10]Data available

[11]Overfitting

مشکلات حقوقی بیمه مسئولیت پزشکان و پیراپزشکان و ضرورت تأسیس شرکت بیمه نظام پزشکی ایران

آموزش این ماشین تغییر

برای دانلود پی دی اف برروی لینک زیر کلیک کنید

پاسخی قرار دهید

ایمیل شما هنوز ثبت نشده است.