לתקן את ההיסטוריה: שימוש במודלים חישוביים לתיקון נזקי תת ייצוג של נשים במחקר רפואי

שונית אגמון ופליאה גיליס מספרות על מחקרן לתיקון ההשפעות של תת הייצוג של נשים במחקרים קליניים על מודלים של למידת מכונה

מחקרים קליניים מהווים שלב הכרחי בבדיקת תרופות וטיפולים חדשים לפני אישורם לשימוש הציבור, והם מהווים חלק בלתי נפרד מתהליך גילוי ופיתוח של תרופות ובדיקות. במהלכם, נבחנת הבטיחות והיעילות של הטיפול החדש, מתבצעת למידה של פרופיל תופעות הלוואי ואיתור האוכלוסייה שיכולה להרוויח מהטיפול.

במשך עשורים, נשים, וכן מיעוטים, סבלו מתת ייצוג בולט במחקרים קליניים, כאשר ההנחה הרווחת הייתה שתוצאות המחקר על גברים ניתנות ליישום גם על נשים. הנחה זו הופרכה כבר מזמן, בין היתר לאור הגילוי וההבנה כי זכרים ונקבות נבדלים זה מזה אפילו ברמה התאית. על כן, התגובה לטיפול תרופתי והתערבויות טיפוליות שונות, וכן תופעות הלוואי הנצפות, יכולות להיות שונות בתכלית. נשים הודרו לאורך ההיסטוריה ממחקרים קליניים מסיבות רבות, למשל בשל ההשפעות הלא ידועות של המחזור החודשי על תוצאות המחקר.

נקודת ציון משמעותית שהחריפה את תת הייצוג של נשים במחקרים קליניים הייתה פרשת התלידומיד בשנת 1977, בה תרופה למניעת בחילות בוקר שניתנה לנשים בהריון גרמה למומים קשים בעוברים. כתוצאה מכך, מנהל המזון והתרופות האמריקאי (ה-FDA) המליץ שלא לכלול נשים בגילאי הפריון במחקרים קליניים, מחשש לסיכון העובר; בפועל, ההמלצה גרמה לתת ייצוג של נשים בכל הגילאים.

רק בשנת 1993 ה-FDA פרסם הנחייה כי יש לכלול אוכלוסיות מגוונות במין וגזע ולנתח את תוצאות המחקר לפי קבוצות אלו. בשנת 2014, נכנסה לתוקף הדרישה לחייב חוקרים וחוקרות לערוך ניסויים גם בבעלי חיים ממין נקבה (למשל עכברות, ולא רק עכברים). למרות שינויים אלו, תת הייצוג של נשים במחקרים נמשך עד היום. כתוצאה מכך, נשים סובלות מאיחור באבחנה של מחלות ומתופעות לוואי של תרופות. לדוגמה, רק לאחר יציאתה לשוק של התרופה לטיפול בבעיות שינה אמביאן (זולפידם) התגלה שנדרש מינון נמוך יותר (ב-50%!) מהתרופה עבור נשים.

דו״ח ממשלתי שפורסם בארה״ב לפני כעשור הראה כי בין השנים 1997 ל-2001, עשר תרופות הוסרו מהמדפים לאחר שקיבלו אישור להפצה. שמונה מתוך התרופות האלה הוסרו מהמדפים בעקבות תופעות לוואי קשות בנשים.

בתמונה: שכיחות הנשים המאובחנות במחלה/מצב רפואי כפי שנלקח מנתוני קופ"ח מכבי (עיגולים כחולים), לעומת שיעור המשתתפות במחקרים קליניים בנושא, נלקח מ-ClinicalTrials.gov (יהלומים אדומים).

תיקון העיוות באמצעות מודלים חישוביים

בשנים האחרונות השימוש במודלים חישוביים ולמידת מכונה (Machine Learning Models) לצורך פתרון בעיות ועיבוד מאגרי מידע גדולים, הולך וצובר תאוצה, גם בתחום הרפואה. בעזרת למידת מכונה, ניתן לבנות מודלים בהם האלגוריתם לומד מתוך דוגמאות, וכך יכול לעזור בחיזוי וגילוי של עובדות חדשות מתוך מקורות מידע גדולים.

בתחום של עיבוד שפה טבעית (Natural Language Processing, NLP), קיימים מודלים  שיכולים לעבד כמויות גדולות של טקסט לכדי מידע שאלגוריתם ממוחשב יכול להשתמש בו. מודלים של עיבוד שפה טבעית יכולים להיות שימושיים ביותר בעולם הרפואה; אלגוריתם יכול לעבור על סיכומי ביקור של מטופלים ומטופלות ולהוסיף תיוגים של קודים רפואיים לפי הטקסט, או לבצע מיון ראשוני של מטופלים על פי תשובות מילוליות שנעשו בטפסי הקבלה, ועוד.

במחקר שלנו, התמקדנו בשיטה שנקראת Word Embeddings (WE), שמהווה אבן בניין במודלים חישוביים רבים. זוהי דרך למפות מילה לייצוג מספרי שתופס את משמעותה, כך שלמילים דומות או קשורות יהיו ייצוגים דומים. באמצעות הייצוג המספרי של המילה, מודלים חישוביים יכולים למפות ולהבין קשרים בין מילים.

ננסה להסביר זאת בדוגמה – למילה "פריז" למשל, יהיה ייצוג דומה למילה "רומא", כי שתיהן ערי בירה, וגם למילה "צרפת" יהיה ייצוג דומה למילה "פריז". לאחר מכן ניתן גם לקשר בין המילים, כאשר כל קשר יכול להעיד על סוג אחר של קרבה – הקשר בין "צרפת" ל"פריז", יהיה דומה למשל לקשר בין "איטליה" ו"רומא". כך, אפשר לייצג טקסט באופן שמודלים חישוביים יכולים להשתמש בו.

לפני שניתן להשתמש במודל WE, צריך לאמן אותו – כלומר, לחשוף אותו לכמויות גדולות של טקסט כדי שילמד את הקשרים בין המילים. כדי לאמן WE עבור אפליקציות קליניות, קיים שימוש נרחב במאגר המאמרים המתארים מחקרים קליניים.

עם זאת, מודלים חישוביים אינם חפים מבעיות. הבעיה העיקרית נובעת מכך שמודלים אלו נוטים להיות מושפעים מהטיות בנתונים שעליהם אומנו, ולכן עלולים להציג הטיות חמורות יותר מאשר היו במקור. כתוצאה מההטיות וחוסר הייצוג של נשים במאגר המחקרים הקליניים, גם WE לוקים בהטיות, כי הם למעשה אומנו על תמונה חלקית, שבה חסרות תוצאות קליניות על נשים. לכן, תוצאות החיזוי של מודלים המשתמשים ב-WE יהיו פחות מדויקות עבור נשים מאשר עבור גברים.

כדי להתמודד עם הטיה זו פיתחנו אלגוריתם לאימון WE שנותן "משקל" לכל מחקר קליני על פי מספר המשתתפות בו. מחקרים שכללו נשים רבות שוקלים יותר ומשפיעים יותר על אימון ה-WE, בעוד שמחקרים ללא ייצוג של נשים משפיעים פחות. האלגוריתם החדש שיפר את הביצועים של מודלי חיזוי על נשים כך שהביצועים השתוו לאלו על גברים במשימות רבות! בחנו את הביצועים של האלגוריתם על מודלים רבים, ביניהם על מודלים לחיזוי משך השהות של המטופל/ת בבית החולים, על מודלים שנועדו לחזות האם יידרש אשפוז חוזר תוך זמן קצר, ועל מודלים שמטרתם זיהוי קשרים בין מחלות שונות. בכולם הביצועים השתפרו כתוצאה מהשקלול החדש.

 

השלכות המחקר על מתכנני מחקרים קליניים, צוותים רפואיים ומטופלות

על אף השימוש המבורך במודלים טכנולוגיים חדשניים, עולה מסקנה חשובה לא פחות – יש בעיה מהותית באופן התכנון של מחקרים קליניים. למסקנה זו משמעויות עבור מתכנני המחקר, מנתחי תוצאות המחקר, צוותים רפואיים והמטופלות והמטופלים עצמם.

כאשר מתכננים ומתכננות מחקר קליני, חשוב לגייס אוכלוסיית מחקר המשקפת את אוכלוסיית הטיפול. כאשר רופא או רופאה קוראים מחקר חדש, חשובה תשומת הלב להטיות מידע שונות. כמטופלים ומטופלות חשובה הערנות לטיפול ואם משהו מרגיש לא כשורה – יש לעבור בירור רפואי ולשקול החלפת טיפול. כמו כן, אם עומדת בפנינו האופציה להשתתף במחקר קליני – כדאי לזכור את ההשלכות של מגוון משתתפים, ואת החשיבות הפוטנציאלית של השתתפותנו.

גם לנשות ואנשי מדעי המחשב שבונים את המודלים, יש אחריות לבניית מודל אמין, ושהמידע בו מונגש באופן מובן לצוות הרפואי. ככל שגדל השימוש במודלים של למידת מכונה בהחלטות אנושיות, וספציפית בהחלטות קליניות, כך אנו חשופים יותר להחמרת הטיות קיימות. יש להעדיף מודלים ברורים ככל האפשר, שתוצאותיהם מוסברות בקלות. כמו כן, מודלים מסוימים מכילים "הערכת ביטחון" בתוצאותיהם המאפשרת למשתמשים להעריך את אמינות התוצאה, על ידי כלים סטטיסטיים כמו רווח סמך או רמת הכיול של המודל (בהינתן חיזוי מסוים של המודל, מה ההסתברות לתוצאה חיובית); שקיפות המידע לגבי מהימנות המודל צריכה להיות הסטנדרט.

לסיכום, בעשור האחרון ניכרת מגמת השיפור בייצוג אוכלוסיות שונות במחקרים קליניים, אך הדרך עוד ארוכה. אנו מאמינות שמחקר זה יעלה את המודעות לחשיבות של ייצוג אוכלוסיות שונות במחקרים קליניים. אם בעבר הדרת נשים ממחקרים נעשתה מתוך כוונה (חלקית לפחות) להגן עליהן, כיום אנחנו יודעים שזה פוגע בהן. המחקר מראה את השלכות ההדרה הזו על מודלים לומדים, אבל ניתן להסיק מכך גם לגבי המשמעות הקלינית שלה. החשיבות של הדבר היא לא רק במובן האתי והמוסרי או עניין של "פוליטקלי קורקט" – יש לכך השלכות על חיי אדם.

הכותבות הן שונית אגמון, דוקטורנטית למדעי המחשב מהטכניון ופליאה גיליס, סטודנטית שנה שישית לרפואה באוניברסיטת תל אביב.

המחקר נעשה בהנחיית ד"ר קירה רדינסקי מהטכניון ובשיתוף ד"ר אריק הורביץ מ-Microsoft Research.

למאמר המלא שהתפרסם ב-Journal of the American Medical Informatics

שונית מספרת על המחקר בכנס של ארגון NOGAFem

כתיבת תגובה

האימייל לא יוצג באתר.

כתבות דומות