یادگیری عمیق[1] در مسیر ورود به آزمایشگاه
زهرا مولایی
آیا دوران پاتولوژیستها به سر رسیده است؟ اگرچه پاسخ این سؤال قطعاً منفی است اما بهموازات پیشرفتهای تکنولوژیکی در تشخیص بالینی این سؤال باید با اهمیت و تأکید بیشتری پرسیده شود؛ تکنولوژیهایی مانند یادگیری ماشین[2] و هوش مصنوعی که ثابت شده است تشخیص آنها میتواند بهاندازه تشخیص متخصصان انسانی دقیق و کارآمد باشد.
یکی از حوزههای پاتولوژی که گسترش سریعی را در قدرت تشخیصی فناوری رایانه تجربه میکند، آنالیز خودکار تصاویر دیجیتال است [3](DIA) است. یک پژوهش جدید نشان داده است که اسکورینگ بیومارکرهای سرطان سینه (Ki67، ER، PR و HER2) با استفاده از DIA میتواند زیرگروه مولکولی سرطان را با حساسیت و اختصاصیت بیشتری نسبت به اسکورینگ دستی توسط پاتولوژیستهای دارای مدرک بورد، پیشبینی نماید. چشمانداز استفاده از چنین ابزارهایی به تحقیقات و پژوهشها محدود نمیشود؛ چرا که استفاده از آنالیزورها برای اسکورینگ این بیومارکرها توسط سازمان غذا و دارو (FDA) تأیید شده است.
پاتولوژی بالینی به یک بستر مناسب برای استفاده از DIA تبدیل شده است، این بار بهصورت یک آنالیزور برای بررسی گسترش خون محیطی که توسط FDA نیز تأیید شده است. این آنالیزور با استفاده از روش یادگیری ماشین و بر اساس انواع مورفولوژیکی، لکوسیتها را شناسایی، طبقهبندی و شمارش میکند و از این طریق به تکنسین یا پاتولوژیست در انجام شمارش افتراقی دستی کمک میکند، با این وجود در حال حاضر هیچ ابزار مشابهی برای توصیف مورفولوژیکی اریتروسیتها (RBCs) وجود ندارد که توسط FDA تأیید شده باشد.
در این شماره از ژورنال Clinical Chemistry، دورانت و همکاران یک ابزار DIA جدید را معرفی کردهاند که از شبکههای عصبی پیچشی [4](CNNs) بسیار عمیق برای پیشبینی مورفولوژی RBCها بهمنظور شناسایی جمعیتهای ناهنجار چشمگیر استفاده میکند و میتواند به تشخیص بیماریهای هماتولوژیک و غیرهماتولوژیک کمک کند. آنها دریافتند که روششان از یک آنالیزور تأییدنشده توسط FDA بهتر عمل میکند، همانند دستگاهی که برای طبقهبندی مورفولوژی لکوسیتها مورد استفاده قرار میگیرد. روش آنها نهتنها در طبقهبندی مورفولوژیکی از دقت بالایی برخوردار است، بلکه میتواند سازگاری، تکرارپذیری و کارایی بسیار بیشتری را نسبت به پروسه آهسته و دستی فعلی برای بررسی گسترش خون محیطی به ارمغان بیاورد.
الگوریتم استفادهشده توسط دورانت و همکاران، مثالی است از یادگیری عمیق؛ مجموعهای از تکنیکهای قدرتمند و جدید یادگیری ماشین که برای طبقهبندی موارد جدید مانند RBCها، با استفاده از الگوریتمهای «یاد گرفتهشده» از الگوهای از قبل تهیهشده، طراحی شده است. یادگیری عمیق هم در حیطه پزشکی و هم در سایر حوزهها کاربردهای فراوانی دارد؛ از جمله: شناسایی تصویر، تشخیص گفتار، داروپژوهی[5] و آنالیز جهش[6]. اگرچه مطالعه دورانت و همکاران نشاندهنده کاربرد اول یادگیری عمیق در DIA در حیطه پاتولوژی بالینی است، اما قبلاً برای استفاده در پاتولوژی آناتومیک نیز مورد بررسی قرار گرفته است.
یادگیری عمیق از چند جنبه با تکنیکهای سابق یادگیری ماشین متفاوت است؛ مهمترین تفاوت آنها توانایی یادگیری «ویژگی» است. ویژگیهایی که اجزاء اطلاعاتی مواردی هستند که باید طبقهبندی شوند. الگوریتمهایی با پیچیدگی کمتر باید به تعداد محدودی از ویژگیهای از پیش تعیینشده (مانند ناحیه کمرنگ مرکزی و اسپیکولهای غشایی در RBCها) متکی باشند، اما یادگیری عمیق مجموعهای از مفیدترین ویژگیهای آن را شناسایی میکند. یکی دیگر از مزایای استفاده از CNN توسط دورانت و همکاران قابلیت عملکرد آن در یک میدان موضعی کوچک از تصویر بهجای کل تصویر است. این امر به مدل این امکان را میدهد که جهت و چرخش تصویر را نادیده بگیرد و اگر غیر از این بود استفاده از آن در گسترش خون محیطی که RBCها در آن بهصورت اتفاقی پراکنده شدهاند، دشوار بود و در نهایت همانطور که از نام این تکنیک برمیآید، دیگر حسن یادگیری عمیق، عمق آن است، یا به عبارتی توانایی جمعآوری اطلاعات از لایههای متعدد ورودی و از بین مقدار بسیار زیادی داده آموزشی برای ارتقای دقت طبقهبندی.
با این وجود یادگیری عمیق نیز مانند یادگیری ماشین، محدودیتها و چالشهای خاص خود را دارد. این تکنیک مانند «جعبه سیاه» به نظر میرسد؛ زمانی که نتیجه یک طبقهبندی غیرمنتظره یا غیرواقعی است، شناسایی منبع خطا یا توضیح پروسه عملکرد آن بهگونهای که قابلفهم باشد، بسیار دشوار بهنظر میرسد. یکی از مزایای یادگیری عمیق (یادگیری بینظارت ویژگیها[7]) زمانی که لازم است توضیح دهیم الگوریتم از چه ویژگیهایی برای پیشبینی کردن استفاده میکند، تبدیل به یک نقص میشود، بهعلاوه در حوزه یادگیری ماشین اصطلاحات و عباراتی استفاده میشود که ممکن است پزشکان بهویژه متخصصان آزمایشگاه را سردرگم کند؛ مانند «فراخوانی[8]» بهجای «حساسیت» و «دقت» بهجای «ارزش پیشبینی مثبت[9]». با این وجود این اصطلاحات به روشن شدن تفاوتهای عملی، کاربردی و استنتاجی بین یادگیری ماشین در سطح مجموعههای عظیم اطلاعات و معیارهای سادهی دقت تستها کمک میکند. آنها سعی میکنند این واقعیت را که یادگیری ماشین در اصل خود یک ابزار تشخیص است که عمدتاً به شیوه هر تست آزمایشگاهی تشخیصی دیگری عمل میکند، کمرنگ سازند.
با تداوم افزایش محبوبیت یادگیری ماشین، این تکنولوژی انتقادات نسبت به محدودیتهای خود را به چالش میکشد. هرچند برخی از این انتقادات به دلیل عدم درک آن است. بسیار مهم است که بدانیم چرا و چگونه این سیستم در انجام وظیفه خود شکست میخورد. این خطاها ممکن است به دلیل چگونگی ساخت مجموعه آموزشی باشد. اگر متخصصانی که مجموعه آموزشی را با طبقهبندی «صحیح» برچسبگذاری میکنند، دچار خطا شوند یا در برچسب مناسب به توافق نرسند، این الگوریتم ممکن است خطاهایی را مرتکب شود.
خوشبختانه اگر اکثر برچسبها صحیح باشند، این خطاها بسیار کاهش مییابند، زیرا الگوریتم اثر برچسبهای نادرست را به حداقل خواهد رساند. این مسئله را دورانت و همکارانش زمانی کشف کردند که متوجه شدند تعداد کمی از RBCها در مجموعه تست آنها بهصورت نادرست برچسبگذاری شدهاند. این اتفاق باعث شد الگوریتم آنها «اشتباه» کند اما به لحاظ بالینی پیشبینی مناسبی را ارائه دهد. روشهای یادگیری عمیق ممکن است به میزان دادههای در دسترس[10] نیز حساس باشند و به همین دلیل نیازمند مجموعههای آموزشی بزرگ است تا از خطاهای پیش برازش[11] اجتناب شود. دورانت و همکاران همچنین خاطرنشان کردند که دقت طبقهبندی در مورد انواعی از RBCها که در مجموعه آموزشی آنها بهخوبی نمایش داده شده بودند (ماند شیستوسیتها و سلولهای هدف) بسیار بالاتر از انواعی بود که بهصورت ضعیفی نمایش داده شده بودند (مانند داکروسیتها).
در نهایت خائنانهترین محدودیت یادگیری ماشین، ناتوانی در تلفیق و گردآوری اطلاعات و آگاهیهایی است که در مجموعه آموزشی اصلی وجود نداشته است. در پزشکی این بدان معناست که ویژگیهای پیچیده و کیفی بیمار (برای مثال سابقه بیمار) در طبقهبندی شرکت داده نمیشود. مباحث بالینی در بررسی نتایج DIA نقش حیاتی دارند، بهصورتی که ممکن است سلولهای ناهنجار بر اساس سابقه و شرححال بیمار به شیوه منطقی دیگری تفسیر شوند. در واقع این تکنیک با دیگر تستهای آزمایشگاهی تفاوتی ندارد و همه دستگاههای DIA مورد تأیید FDA تنها میتوانند بهعنوان یک مساعدت به اپراتور یا پاتولوژیست که مسئول طبقهبندی نهایی هستند، در نظر گرفته شوند. سرانجام ممکن است بتوان دادههای ورودی کافی برای یک الگوریتم مانند الگوریتم دورانت فراهم آورد تا بتواند بهعنوان یک دستگاه تشخیص ابتدایی عمل کنند.
علیرغم این محدودیتها، فرصتهای بسیاری برای وارد کردن یادگیری ماشین به آزمایشگاههای بالینی وجود دارد. با وجود این حجم از دادههای جداگانه که برای هر بیمار ذخیره شده است، سیستمهای اطلاعاتی آزمایشگاهها میتوانند یک مجموعه دادههای ورودی ارزشمند را ایجاد کنند که میتواند منجر به تشخیص قابل اعتماد شود، بهعلاوه تصاویر خروجی DIA میتوانند به رکوردهای پزشکی الکترونیک اضافه شوند تا به پزشکان در اتخاذ تصمیم درمانی کمک کنند. اگر پاتولوژیستها در زمینه انفورماتیک، مهارتهای کافی کسب کنند، فرصت بزرگی برای رشد تکنولوژیکی وجود دارد چرا که آنها میتوانند این ابزارها را بهطور مؤثر طراحی و راهاندازی کنند.
آیا دوران پاتولوژیستها به سر رسیده است؟ نه، این اتفاق هرگز رخ نمیدهد اگر آنها در خط مقدم تکامل و یکپارچهسازی تکنولوژیهای جدید مانند یادگیری ماشین باقی بمانند.
این مقاله ترجمه ای است از:
Deep Learning Makes Its Way to the
Clinical Laboratory
Ronald Jackups, Jr.1*
Clinical Chemistry 63:12
1790–1791 (2017)
منابع:
1. Gandomkar Z, Brennan PC, Mello-Thomas C. Computer-based image analysis in
breast pathology. J Pathol Inform 2016;7:43.
2. Stهlhammar G, Fuentes Martinez N, Lippert M, Tobin NP, Mّlholm I, Kis L, et al. Digital
image analysis outperforms manual biomarker assessment in breast cancer. Mod
Pathol 2016;29:318 –29.
3. 510(k) premarket notification: Ventana Image Analysis System. Vol. 510(k) Number:
K050012 2005.
4. 510(k) premarket notification: Aperio ePathology eIHC IVD System. Vol. 510(k)
Number: K141109 2014.
5. 510(k) premarket notification: Cellavision DM96 Automatic Hematology Analyzer.
Vol. 510(k) Number: K033840 2004.
6. Durant TJS, Olson EM, Schulz WL, Torres R. Very deep convolutional neural networks
for morphologic classification of erythrocytes. Clin Chem 2017;63:1847–55.
7. Criel M, Godefroid M, Deckers B, Devos H, Cauwelier B, Emmerechts J. Evaluation of
the red blood cell advanced software application on the CellaVision DM96. Int J Lab
Hematol 2016;38:366 –74.
8. Egele´ A, Stouten K, van der Heul-Nieuwenhuijsen L, de Bruin L, Teuns R, van Gelder W,
Riedl J. Classification of several morphological red blood cell abnormalities by DM96
digital imaging. Int J Lab Hematol 2016;38:e98 – e101.
9. LeCun Y, Bengio Y, Hinton G. Deep learning. Nature 2015;521:436 – 44.
10. Janowczyk A, Madabhushi A. Deep learning for digital pathology image analysis: a
comprehensive tutorial with selected use cases. J Pathol Inform 2016;7:29.
11. Madabhushi A, Lee G. Image analysis and machine learning in digital pathology:
challenges and opportunities. Med Image Anal 2016;33:170 –5.
12. Cabitza F, Rasoini R, Gensini GF. Unintended consequences of machine learning in
medicine. JAMA 2017;318:517– 8.
13. Richardson A, Signor BM, Lidbury BA, Badrick T. Clinical chemistry in higher
dimensions: machine-learning and enhanced prediction from routine clinical chemistry
data. Clin Biochem 2016;49:1213–20.
[1]Deep Learning
[2]Machine Learning
[3]Automated digital Image Analysis(DIA)
[4] Convolutional neural Networks (CNNs)
[5]Drug discovery
[6] Mutation analysis
[7] Unsupervised learning of features
[8]Recall
[9]Positive predictive value.”
[10]Data available
[11]Overfitting
مشکلات حقوقی بیمه مسئولیت پزشکان و پیراپزشکان و ضرورت تأسیس شرکت بیمه نظام پزشکی ایران
برای دانلود پی دی اف برروی لینک زیر کلیک کنید
ورود / ثبت نام