חדשות

מודלי AI עשויים לשנות בקרוב את האופן שבו לומדים רפואה

מחקר חדש מאוניברסיטת ת"א בחן את היכולת של ChatGPT לשמש כלי עזר לקבלת החלטות קליניות | היתרון: זמן תגובה מהיר והסבר מפורט | החיסרון: אובר-טריאז' וכמות טקסט קיצונית בהשוואה לקלינאי אנושי

ChatGPT, בינה מלאכותית ברפואה. אילוסטרציה

מחקר חדש מהפקולטה לרפואה ומדעי הבריאות באוניברסיטת תל אביב בחן את היעילות של מודל בינה מלאכותית גנרטיבית (GenAI) - במקרה זה, ChatGPT - ככלי עזר לקבלת החלטות קליניות ברפואה. על פי המחקר, המודל נוטה כעת יותר מדי ל"אובר-טריאז'" (over-triage), כלומר שליחה לבדיקות מרובות מדי ללא הצדקה מספקת, כדי להצדיק את הכנסתו המיידית לשימוש רחב, אך היתרונות שלו במהירות תגובה ובשקיפות הסברתית עשויים להפוך אותו לכלי לימודי תומך יעיל לסטודנטים ולמטפלים מועטי ניסיון.

המחקר נערך בהובלת ד"ר מור סבאן וד"ר אילנה דובובי מהחוג לסיעוד בבית הספר למקצועות הבריאות בפקולטה למדעי הרפואה והבריאות באוניברסיטת תל אביב ופורסם לאחרונה בכתב העת Journal of Advanced Nursing כחלק מקבוצת מחקרים של החוקרות בנושא יישומי מודלי שפה גדולים ברפואה ושילוב בינה מלאכותית בתהליכי קבלת החלטות קליניות.

במסגרת המחקר נבחנו תרחישים קליניים אמיתיים על ידי אחיות וסטודנטים לסיעוד והושוו למודל הבינה מלאכותית. "אנחנו מגלים שכבר עכשיו קיימות ראיות לכך שהבינה המלאכותית יכולה להוות מערכת תמיכה לקבלת החלטות במפגש הראשוני של הקלינאי עם המטופל, כאשר היתרונות ברורים מאוד", אומרת ד"ר סבאן. "אנחנו עובדים על סדרה של מחקרים בנושא עם מגוון כלים אחרים. זמן התגובה של המודלים האלה מהיר מאוד".

על פי המחקר, זמן התגובה הקצר של מודלי הבינה המלאכותית עשוי להיות חשוב במיוחד עבור מטפלים מועטי ניסיון, שנדרשו לכמות זמן כמעט כפולה ביחס למטפלים מנוסים יותר על מנת לקבל החלטה קלינית.

"החיסרון הוא, כמובן, כמות המילים", מסבירה ד"ר סבאן. על פי המחקר, ChatGPT השתמש בכמות מילים ממוצעת גבוהה באופן קיצוני ביחס לקלינאים (בין פי 27 לפי 41 יותר מילים מהקלינאי). "עם זאת, מאז שעשינו את המחקר כבר יצאו הרבה חידושים בתחום, כמו קביעת טמפרטורה (adjust the temperature), המאפשרת לקבוע את מידת היצירתיות של הכלי", מוסיפה ד"ר סבאן. "צריך לזכור שהמודלים האלה זזים בקצב מאוד מאוד מהיר, ולכן המגבלות שראינו במחקר הזה - וורד קאונט משמעותי או יכולת הסברתיות נמוכה - ילכו וייפתרו לדעתי".

"מספר המילים הרב עשוי גם להיות יתרון", אומרת ד"ר דובובי. "התשובה שהכלי מספק מגיעה בתבנית ברורה של הסקה דדוקטיבית. הוא מנמק כל החלטה רפואית, וזה יכול להיות יעיל ככלי תמיכה לקלינאי חדש שנכנס לשטח. בדרך כלל הקלינאי החדש לומד לצד רופא מומחה, שתהליך קבלת ההחלטות שלו מהיר, מתרחש ברובו מתחת לפני השטח ואינו מוסבר בפירוט בכל פעם. מודל השפה מוסיף שקיפות לתהליך קבלת ההחלטות הרפואי, דבר שעשוי להאיץ את תהליך הלמידה של הקלינאי הטירון".

אך בעוד המודל מראה פוטנציאל רב ככלי עזר חינוכי, החוקרות מצאו במודל בעיה נוספת שעלולה להאט את כניסתם של הכלים האלה לשימוש רחב. "במאמר קראנו לתופעה אובר-טריאז', כאשר המודל קצת משתולל ומחליט לשלוח מטופלים לבדיקות שלא בהכרח היו רלוונטיות לאותה נקודת זמן, ויש לזה משמעויות על העלויות והעומסים במערכת הבריאות", מציינת ד"ר דובובי.

עם זאת אומרת ד"ר דובובי כי תופעת האובר-טריאז' אינה מפחיתה מהפוטנציאל של המודל להפוך כבר בשנים הקרובות כלי עזר יעיל לסטודנטים ולקלינאים חסרי ניסיון. "לא באנו לבדוק אם המודל יכול להחליף את הקלינאי, אנחנו גם לא חושבות ש-ChatGPT יכול להוות תחליף לקלינאי אלא שמודל הבינה המלאכותית עשוי להיות כלי תומך לקבלת החלטות. אני רואה את זה כמו Waze: לא מחליף את הנהג, רק מציג מסלולים אפשריים כדי להגיע ליעד".

נושאים קשורים:  בינה מלאכותית,  ChatGPT,  מחקרים,  אוניברסיטת תל אביב,  ד"ר מור סבאן,  ד"ר אילנה דובובי,  לימודי רפואה,  חדשות
תגובות