מיוחד: מי מלמד את המכונית האוטונומית

סטארט אפ ישראלי עושה בית ספר למכונית האוטונומית

אייל אברהמי 30.10.18 - 18:41

שנה גודל פונט א א א א

איך מכינים את המוח של המכונית האוטונומית למה שצפוי על הכביש? איך בודקים אם המכוניות הללו בטוחות לשימוש? דן ינסון ואברהם יופה, מייסדי הסטארט-אפ החיפאי thewhollysee, מפתחים פתרון שהדליק את ענקית הטכנולוגיה העולמית Nvidia בראיון מיוחד לעולם הרכב.

הכתבה הזאת היא על סטארט-אפ חיפאי - thewhollysee שמו - שעוסק בתהליכי ה"לימוד" והרישוי של מכוניות אוטונומיות, אבל כדי שמשמעות הפיתוח שלו תהיה ברורה, צריך להתחיל במקום אחר והרבה יותר רחוק; בהודו, בבנגלדש, בפיליפינים ובמדינות נוספות באסיה מגיעים מדי יום, וכבר לא מעט שנים, אלפי בני אדם, אולי אפילו יותר, לעבודתם כמנתחי תמונות. הם עוברים על כמות צילומים אינסופית ומתעדים איזה אובייקטים נראים בהם.

כאן אופניים נוסעות, שם עץ ופה הולך רגל שחוצה כביש. זאת פרה שעומדת ליד אוטוסטרדה וזהו ילד על מדרכה בערפל. ההיקף האדיר של הדאטה שנאסף משמש כדי "ללמד" את המוח שבמרכזן של המכוניות האוטונומיות על הסיטואציות והדמויות השונות שבהן הוא יפגוש על הכביש.

"סווט-שופס" מודרניים
יש לא מעט אירוניה בעובדה שהמהפכה הכי גדולה בעתיד התחבורה בעולם מגיעה מסוג של "סווט-שופס" מודרניים במדינות עולם שלישי, אבל מעבר לאירוניה יש עם השיטה הזאת גם לא מעט בעיות. הראשונה והמרכזית שבהן היא שכנראה אין תמונות שמכסות את כל האופציות האפשריות. ובמילים אחרות בכלל לא בטוח שתימצא תמונה של למשל נכה בכיסא גלגלים, שמצולם מטווח של 70 מטרים בעת שהוא חוצה מעבר חציה דהוי בלילה גשום, ולכן מפגש של מכונית אוטונומית עם סיטואציה כזאת יכול להסתיים באסון. זה אגב מה שקרה בתאונה שעשתה המכונית האוטונומית של אובר במארס השנה שנגמרה במוות של הולכת רגל - עוד על כך בהמשך. ד"ר דן ינסון - אחד משני מייסדי הסטארט-אפ - מעריך כי רמת הכיסוי בשיטה הזאת יכולה להגיע ל-97% -96%, מספר שרחוק מלהשרות ביטחון/בטיחות.

הבעיה השנייה היא שגם אם עושים את הניתוח ב"סווט-שופס" אסיתיות עם עובדים זולים ההליך מסורבל, איטי ויקר, מה שאומר שלא מופרך להעריך שיהיו מי שינסו לחתוך פינות. וכאן נכנסים לתמונה ינסון ושותפו, אברהם יופה, שהקימו בחיפה את thewhollysee, שמציע פתרון לבעיה באמצעות אוגמנטציה של צילומים שעליה מיד נרחיב. השיטה שהם מפתחים פותרת לא רק את הקושי ב"לימוד" אלא אמורה לגעת בעוד סוגיה מורכבת להפליא - איך רגולטורית תאושר בטיחותו של רכב אוטונומי לנוע על הכביש.

הסטארט-אפ אמנם רק בן קצת יותר משנתיים ומעסיק בסך הכל 4 עובדים אבל חברת רכב גדולה מגרמניה כבר סגרה איתם על פיילוט. בנוסף, וממש לאחרונה, הם זכו בתחרות הסטארטאפים Inception Awards של הענקית העולמית Nvidia שעוסקת גם בתחום הרכב ושואפת להיות שחקנית משמעותית בעולם האוטונומי העתידי. הפרס, בסך 100 אלף דולרים, אומר ינסון ייתן לחברה שנאבקה בשנתיים האחרונות על גיוס משקיעים, דחיפה לא קטנה. חשוב לדבריו לא פחות הוא חלק אחר של הפרס - תחנת עבודה של מחשב העל Nvidia DGX - שעליו יתבצע הפיתוח.

איך מלמדים מכונית אוטונומית?
ינסון, 45, נשוי ואב לארבעה, נולד וגדל ברוסיה אך את הדוקטורט שלו בפיזיקה, עם התמחות בלייזר ובפוטוניקה, עשה באוניברסיטת גלזגו שבסקוטלנד. לפני כעשר שנים קיבל הצעת עבודה בישראל ובעקבותיה עשה עלייה. במקביל לסטארט-אפ הוא עדיין עובד באותה חברה שאין לה שום קשר לעולם הרכב. בארץ הוא הכיר את אברהם יופה, 45, ואב לחמישה, יליד אוקראינה שהגיע לארץ בגיל 17, התמחה בלוגריטמיקה ואינטגרציית חומרה-תוכנה ועבד במשך השנים בענקיות טכנולוגיה בינלאומיות וביניהן אינטל, סיסקו ועוד.

לפני כשלוש וחצי שנים, ועל רקע בעיה שבה נתקל יופה בפרויקט שעליו עבד, פיתחו השניים את מה שהם מגדירים כ"פתרון גנרי לזיהוי מרחוק של אובייקטים" על ידי מחשבים. הם רשמו פטנט על הפיתוח, החלו לחשוב על אפליקציות שבהן יהיה לו שימוש ומהר מאוד הגיעו לקושי של 'לימוד' הרכב האוטונומי.

"מוח מלאכותי, ממש כמו מוח של ילד, צריך למידה והשכלה, ואת זה עושים באמצעות דאטה שמוזנת אליו. בכל הנוגע לזיהוי אובייקטים צריך לספק ויז'ואל שלהם למוח עם הסבר מה הם, ובמקרה של המכונית האוטונומית עושים את זה באמצעות כמות עצומה של תמונות. החוזק של רשתות נוירוניות - שעליהן מתבססת הארכיטקטורה של המערכות הללו - היא ביכולת לעשות הערכה של אובייקטים שהם לא ראו בזמן הלימוד; זאת אומרת אם הם ראו מיליון תמונות של בן אדם, ואחר כך הם יראו צללית שאולי לא הייתה בדאטה שלהם אבל היא מספיק דומה, הרכבים יהיו מסוגלים להבין שזה אדם. כדי שפעולת הזיהוי תהיה יעילה צריך כמובן שהדאטה בייס הראשוני יהיה כמה שיותר רחב".

למכוניות אוטונומיות אין יכולת ללמוד מה"ניסיון" שהן צוברות על הכביש?
"נכון להיום לא. היכולת ללמוד היא סוג של בינה מלאכותית אחרת שנקראת 'למידה ללא השגחה'. יש לא מעט חברות שעוסקות בזה אבל התחום עדיין בחיתוליו. אני מעריך שבסופו של דבר מכוניות אוטונומיות יתבססו על שילוב של שתי השיטות - בסיס ראשוני שעליו יתווסף לימוד עצמאי של סיטואציות חדשות".

רק לפני שנמשיך אתה יכול להסביר מה בעצם הכשל הטכני שגרם לתאונה הקטלנית שעשתה המכונית האוטונומית של אובר באריזונה במרץ?
"בדוח בדיקה של התאונה נמצא שהמערכת, באמצעות הרשתות הנוירוניות, עשתה כמה ניחושים לגבי מה יכול להיות האובייקט שהיא קלטה על הכביש. מבחינת המערכת האובייקט היה לא מוכר, ההערכה הראשונית שלה הייתה שזה רכב אחר ורק ברגע האחרון היא הבינה שמדובר באישה, אבל זה כבר היה מאוחר מדי. זה מקרה קלאסי של חוסר זיהוי".

למה זה משנה מבחינת המכונית מה האובייקט? הרי היא בכל מקרה צריכה לבלום.
"אם הסנסורים מזהים שיש משהו לפני המכונית הם יעצרו אבל כדי שהנסיעה לא תיעצר לחלוטין צריך שהאובייקט יזוהה. אם לא יהיה זיהוי משהו כמו ערימה של זבל על הכביש עלול לעצור לחלוטין את הנסיעה. אחרי שהאובייקט מזוהה הרכב האוטונומי בונה תרחישים לגבי ההתנהגות האפשרית של האובייקט שזיהה - לאיפה הולך הרגל יגיע על מעבר החציה, מתי אפשר להתחיל לנסוע אחרי שהמכונית שלפניו סיימה את הפנייה וכך הלאה. בתאונה באריזונה הרכב לא עצר כי הוא לא זיהה את הולכת הרגל ולא העריך לאיפה על הכביש היא יכולה להגיע".

צפו בתאונה:

אגב, בסוגריים נוסיף כי הכשל הטכנולוגי היה רחוק מלהיות היחיד באותה תאונה. דוח משטרתי מיוני מצא כי 'נהגת הבטיחות' במכונית של אובר, שהייתה יכולה למנוע את התאונה, הייתה עסוקה בצפייה THE VOICE בטלפון הסלולרי שלה ולכן לא בלמה ומנעה את התאונה. האם היא בעצם אחראית לתאונה הקטלנית ואם לא אז מי כן אחראי? גם לשאלות הללו - שכרגע אין להן תשובה ברורה - יש לפיתוח של thewhollysee משמעות.

להנדס את התמונות
הפתרון של thewhollysee לבעיית המחסור בסיטואציות/תמונות פשוט בהיגיון שלו גם אם לא לביצוע: הם מייצרים את התמונות, או בלשונם של ינסון ויופה "עושים להן אוגמנטציה". בניגוד לסטארט-אפ ישראלי אחר, שיוצר מציאות וירטואלית שלמה ולפיכך גם מורכבת ומסובכת לביצוע, thewhollysee משתמשים בבסיס קיים - זאת אומרת רקע מצולם - שעליו מושתלים באיכות גבוה האובייקטים שאותם אמור המוח ללמוד לזהות. כך שבהפשטה רבה וכנראה מוגזמת מספיקה תמונה אחת של ערפל שעליה מושתלים מלאכותית כל סוגי הולכי הרגל במרחקים שונים (שיוצרים הבדלים ב"צורה" שלהם) כדי ללמד את המערכת איך יראו הולכי רגל בערפל. או לחילופין מספיקה תמונה של כביש ריק כדי ללמד את המערכת איך ייראו כל סוגי התנועה - מפקק כבד ועד תנועה דלילה - שיושתלו עליו. ינסון אומר שאיכות ה"השתלה" גבוהה מאוד וכי השיטה הופכת כל תמונה לעשרות תמונות, חוסכת את הצורך לנתח אנושית את האובייקטים ומאפשרת ליצור בסיס דאטה שכולל כמה שיותר סיטואציות אפשריות.

אמרת שאחוזי הכיסוי של השיטה הידנית הם 96%-97%. לכמה אתם יכולים להגיע עם השיטה שלכם?
"אנחנו עוד לא יודעים את זה. אחרי שתהליך הפיתוח יסתיים ולקוחות יעשו ניסויי שטח עם השיטה שלנו אפשר יהיה לתת לזה תשובה ברורה".

רישוי: מי אחראי לתאונה?

כשנהג אנושי גורם לתאונה יש לאחריות שמוטלת עליו השלכות פליליות, משפטיות וכלכליות; הוא יצטרך לעמוד לדין, תיבדק השאלה אם הוא כשיר להמשיך לנהוג, הוא יידרש לפצות על הנזק שגרם וכו' וכו'. מי לעומת זאת אחראי לתאונה של מכונית אוטונומית - הבעלים שלה, החברה שייצרה אותה או אולי בכלל הגוף שמתחזק את הכביש שבו התרחשה התאונה? בשום מדינה בעולם אין לשאלה הזאת תשובה בחקיקה וחשובה לא פחות העובדה שאין כיום גם שום דרך לבחון את המכוניות האוטונומיות לצורכי רישוי ותקינה. ובמילים אחרות, למשרד התחבורה, שמחייב אפילו צמיגים של קטנוע לעמוד בתקנים מסוימים, אין שום כלי שבאמצעותו הוא יכול לבדוק ולהחליט אם מכונית אוטונומית כזאת או אחרת בטוחה לשימוש.

יופה אומר כי מכוניות רגילות נדרשות כיום על ידי הרגולטורים בעולם למסלול רישוי ברור שכולל מעבר לבדיקות טכניות גם קילומטראז' מסוים על כבישים מבוקרים ועל כבישים ציבוריים. לרכב האוטונומי לעומת זאת, אין כאמור מסלול רישוי ויופה מוסיף כי הניסויים שמתקיימים כיום מבוססים על הסכמות מקומיות - למשל בפיטסבורג בארה"ב שם תחת תנאים שונים ובראשם 'נהג חירום' מאחורי ההגה ונסיעה רק בשעות שאינן עמוסות, נבחנת הטכנולוגיה.

איך כל זה מתקשר לסטארט-אפ החיפאי? יופה מסביר ששיטת האוגמנטציה שלהם יכולה לייצר את הדאטה בייס הנדרש ללימוד וכי הדאטה בייס הזה יוכל לשמש גם לבחינת היכולות של המכונית האוטונומית לצורכי רישוי. איך זה יעבוד? לפי יופה באמצעות האוגמנטציה תייצר החברה תסריטים של סיטואציות כביש מגוונות כמו ש'רואה' אותן הרכב האוטונומי. המכונית שתגיע לרישוי תחובר ל'וידאו' שבו ירוצו סיטואציות במהירות גבוהה וייבחנו התגובות שלה. השיטה הזאת, הוא מוסיף, תאפשר לעדכן את 'מבחן הרישוי 'בהתאם להתפתחויות ולשינויים בכבישים, בתעשייה ועוד.

ואיפה עומד הפיתוח של זה?
"עוד לא עשינו את זה בגלל ההשקעה הגדולה שזה דורש אבל זה בהחלט על הפרק".

מחפשים משקיעים
את המימון הראשוני לפעילות קיבלו ינסון ויופה מהטכניון, שבחממה שלו השתתפו (ולאור זאת הטכניון גם מחזיק באחוזים מסויימים מהסטארט-אפ). בהמשך הם לקחו חלק בחממה נוספת, מאס צ'לנג' שמה בירושלים ובין לבין כיתתו רגליים בין אנג'לים וקרנות וחיפשו מימון.
ינסון אומר כי היחס שקיבלו היה בסך הכל חיובי ונעים אך שהתשובה הרווחת הייתה 'זה שלב מוקדם מדי - תחזרו בהמשך'. התחרות של NVIDIA, הזרמת ההון הקטנה באמצעות הפרס והגישה למחשב העל, בוודאי עם הפיילוט שנעשה עם החברה הגרמנית, הוא מקווה, ידחפו את החברה קדימה ובמהירות לא רק בכל הנוגע לפיתוח אלא גם ביכולת לגייס משקיעים לשלבים הבאים.