אני מניח שעל פרוייקט נייטאל/נטאל (Natal באנגלית) רוב מי שגולש כאן באתר כבר שמע.
לטובת מי שלא מכיר, עדיף פשוט לצפות בסרטונים לפני שננסה להסביר:
החזון של מיקרוסופט
הדגמה חיה מE3
הדגמה טכנולוגית של משחק בשם מיילו

רוב האנשים ששמעו על הנושא לא מבינים איך העסק בעצם עובד. אני אתמקד כאן בטכנולוגיה שמאחורי נטאל, אבל מאחר ומדובר בטכנולוגיה לא כל כך מוכרת סביר להניח שחלק מהדברים לא יהיו מדוייקים (למעשה, אפילו שם הפרוייקט הוא לא בהכרח השם שבו תשתמש מיקרוסופט כשהמוצר יגיע לחנויות).
מה זה נטאל?
נטאל הוא הניסיון של מיקרוסופט לפתח צורת שליטה במשחקים שתהיה נטולת שלט. החידוש העיקרי (והמוקצן ביותר) הוא מצלמת העומק היחודית של נטאל, אבל הוא משלב גם טכנולוגיות לזיהוי תנועה, פיענוח תמונה ופיענוח קול.
הקופסא עצמה היא שטוחה וארוכה, ומכילה מצלמת תלת מימד (Depth Sensor), מצלמה רגילה (RGB), מיקרופון המסוגל להפריד קולות (Multiarray), וכן מעבד ותוכנה יעודיים לביצוע כל החישובים הנדרשים ללא עומס נוסף על המעבד של הקונסולה.
מצלמת הRGB והמיקרופון הם חידושים פחות משמעותיים בנטאל: מצלמות RGB מסוגלות לפענח תמונה דו מימדית, וקיימות כבר מצלמות שכאלו עבור הPS3, הX360 והמחשב האישי. גם מיקרופון אישי בא עם כל X360 ומתחבר לשלט, כך שהחידוש כאן הוא רק בעצם העובדה שמיקרופון Multiarray מסוגל לקלוט מספר קולות במקביל, ובאמצעות חומרה ותוכנה להשקיט רעשי רקע ולהפריד בין קולות שמגיעים ממקורות שונים.
את המצלמה כבר ניתן היה לראות בהדגמה של מיקרוסופט בE3, ומאז היא התחילה להציג אותה בשלל מקומות אחרים - ואפשר כבר לסכם חד משמעית לכל מי שהיה סקפטי שהעסק אכן עובד. השמועות מדברות על עונת החגים של 2010 כתאריך נוח להשקה רשמית של המוצר, אבל עד אז יהיה לנו מספיק זמן להתווכח על הטכנולוגיה ומה שמאחוריה...
למי שרוצה רקע נוסף,
ראיון מקיף נערך בVenturebeat עם Shane Kim ממיקרוסופט, ובו הוא פירט לא מעט על איך נולד הפרוייקט ומה הכיוון של מיקרוסופט איתו.
מה החידוש הגדול במצלמת תלת מימד?
מצלמת התלת מימד שמשולבת בנטאל היא למעשה משהו שלא היה קיים עד היום בשוק המשחקים (וכנראה גם לא היה קיים בכלל בצורה מסחרית).
בעוד מצלמה דו מימדית "רגילה" משלבת חיישן שמזהה צבעים של כל פיקסל בתמונה, מצלמת תלת מימד מזהה במקום זה את המרחק של כל פיקסל מהמצלמה. לא ניכנס לטכנולוגיות השונות שמאפשרות דבר כזה (כגון Time of Flight), אבל רק נציין שמיקרוסופט הבטיחה לעצמה גישה לכמה מהן.
הטכנולוגיה מאפשרת להפוך כל תמונה שהחיישן מזהה לתלת מימדית לחלוטין, ובאמצעות תוכנה מתאימה ניתן להפריד בין שכבות שונות של עומק (וכך בין אנשים לרקע שלהם), לסובב תמונה דו מימדית על ציר תלת מימדי תוך שמירה על העומק שלה, לזהות תנועה על שלושה צירים וכדומה.
ברגע שנוסף ציר של עומק, ניתן לפענח תמונות, תנועות, תווי פנים וכדומה בצורה שלעולם לא תתאפשר באמצעות מצלמה דו מימדית סטנדרטית, ואפילו לא באמצעות מצלמה סטריאוסקופית (המצלמות שמצלמות את סרטי התלת מימד שמרכיבים עבורם משקפיים).
עוד יתרון במצלמה התלת מימדית היא שמאחר והיא לא מבוססת על אור, היא מסוגלת לעבוד בכל תנאי תאורה כולל חושך מוחלט בחדר (דבר חשוב כשמשחקים).
בשביל להבין כיצד העסק עובד, דמיינו שהמצלמה שמצלמת אתכם היא כמו צעצועי המנהלים האלו שמורכבים מהמון סיכות קטנות וניתן לשקע בהם את היד שלכם בשביל לקבל צורה תלת מימדית - ואז תדמיינו שהמצלמה עושה את זה לכל החדר שבו אתם נמצאים 30 עד 60 פעמים בשניה בזמן אמת.
איפה הזווית הישראלית כאן?
רבות דובר על החברות הישראליות שעסקו בפיתוחים דומים. הדליפה על כך שמיקרוסופט קנתה את הטכנולוגיה של
חברת 3DV הישראלית כבר לפני כמה חודשים (שנסגרה לאחר מכירת הטכנולוגיה), ולאחרונה דובר על כך שמיקרוסופט גם חתמה הסכם בלעדי
עם חברת PrimeSense הישראלית שפיתחה טכנולוגיה מקבילה, אבל על בסיס שונה שאמורה להיות זולה משמעותית. למעשה, מלבד חברות בודדות כמו
Canesta (דווקא לא ישראלית), אין כיום כמעט חברות שעוסקות בפיתוח תלת מימדי, ובטח לא בשלב שבו הן כבר מציגות מוצר מסחרי.
אז כן, אפשר לשמוח על זה שמשהו בבסיס של הטכנולוגיה הוא ישראלי, אבל בתכלס זה לא כל כך עוזר לנו (זה כנראה לא מה שיגרום למיקרוסופט להחליט להשיק רשמית את הקונסולה בארץ).
ניתן לקרוא בVenturebeat שמסקרים את הטכנולוגיה הזו על ההסכמים שמיקרוסופט חתמה עם החברות הישראליות.
כמה מיקרוסופט השקיעה בטכנולוגיה?
הרבה. הרבה מאד כנראה.
צריך לזכור שבאופן עקבי מיקרוסופט היא לא רק אחת החברות הגדולות בעולם, אלא חברת ההייטק (ואולי גם בכלל) עם תקציב המחקר ופיתוח
הגדול בעולם (גם מעל IBM ואינטל). מעל 6.5 מיליארד דולר שפכה החברה על R&D בשנת 2006.
מיקרוסופט היא חברה שעוסקת במחקר פעיל בעשרות תחומים שונים של טכנולוגיה: מהנדסים, חוקרים ומדענים עובדים בקבוצות שונות תחת
Microsoft Research. נראה כי הנאטאל הוא פרוייקט ששאב לתוכו תולדה של R&D במספר גדול של תחומים שונים, ונראה כי למרות החידוש של המצלמה התלת מימדית - מיקרוסופט מתגאה בעיקר בתוכנה של הנאטאל.
פיענוח תמונה, זיהוי והפרדת קולות, ניתוח דיבור ושפה טבעית, ממשקי משתמש, תלת מימד, זיהוי בימוטרי, בינה מלאכותית: כל אלו תחומים שמיקרוסופט משקיעה בהן מיליונים ואולי גם מיליארדים.
וכל התחומים האלו חופפים בעצם למה שמיקרוסופט הציגה בתערוכה עם ההדגמות של נאטאל ושל מילו. זה נראה כאילו הם הצליחו לדחוס לתוך הפרוייקט הזה את כל הידע המצטבר שלהם בתחומים האחרים שמיקרוסופט חוקרת. זה משהו שלא הולך ברגל, וספק רב לכמה חברות יהיו משאבים דומים להשקיע בטכנולוגיה כזו.
רק כדי להמחיש את הנקודה: מיקרוסופט עסקה בפיתוח של חיישן התלת מימד באופן עצמאי בתוך החברה, ולמרות שלא ידוע לאיזה שלב היא הגיעה בצורה עצמאית, ידוע שהיא שילמה 35 מיליון דולר ל3DV בשביל לשים את הידיים גם על הטכנולוגיה שלה, וכנראה שגם סכום לא מבוטל עבור הבלעדיות של הטכנולוגיה של PrimeSense.
למה שחברה תרצה כל כך הרבה טכנולוגיות במקביל אם ברור שהיא בסופו של דבר תתנקז לטכנולוגיה אחת? בשביל למנוע תביעות פטנטים, בשביל האפשרות לבחור את הטכנולוגיה הטובה ביותר, ובשביל למנוע מהמתחרים בכלל לחשוב לנסות להתחרות בה בתחום הזה. כשחברה מוכנה לשים 35 מיליון דולר על השולחן בשביל טכנולוגיה
רק כדי להיות מכוסה - זה איתות עסקי מאד רציני לחברות האחרות.
במקביל, היא העסיקה צוותים שלמים על הפרוייקט הספציפי, לקחה יועצים וחוקרים ונעזרה בכל מי שאפשר להעזר בו. צאנג לי למשל (הבחור שבזמנו הפנוי בנה והציג את
טכנולוגיית הHead Tracking ל-Wii) היה מעורב בפרוייקט נאטאל.
הוא מספר שהטכנולוגיה שפותחה שם למעקב אחרי בני אדם היא יותר מתקדמת מכל מה שהוא ראה אי פעם במחקר אקדמי או מעשי, ושהפרוייקט עצמו הרגיש לו כמו "פרוייקט מנהטן" מינאטורי, שבו חוקרים מכל העולם התאספו בשביל לגרום לעסק לעבוד.
אז מה לגבי התחרות?
נינטנדו נמצאת כבר היום עמוק בעסקי התנועה עם הWiimote, בעוד סוני הציגה בעצמה בתערוכת E3 טכנולוגיה לזיהוי תנועה. ההבדל הוא ששתיהן נמצאות במרחק של דור שלם מאחורי הטכנולוגיה של מיקרוסופט:
נינטנדו עצמה מציעה טכנולוגיה לזיהוי תנועה שמבוססת על שלט. זה אומר שלא ניתן לזהות באמצעות הטכנולוגיה של נינטנדו דבר מלבד השלט עצמו, ובמידה ורוצים לשחק ארבעה אנשים יש צורך ב-4 שלטים, או 8 שלטים במידה וכל אחד רוצה לשחק בשתי הידיים.
הטכנולוגיה של סוני נראית קצת יותר מתקדמת מזו של נינטנדו, מהסיבה הפשוטה שהיא משלבת את השלטים עם מצלמה דו מימדית (מצלמת הEye המוכרת). גם כאן ניתן לזהות רק את השלטים באופן תלת מימדי מלא, אבל המצלמה מסוגלת לתת ערך מוסף באמצעות זיהוי דו מימדי (למשל זיהוי פנים או צבעים). אבל עדיין מדובר בזיהוי תלת מימדי של אובייקטים ספציפיים בלבד, וכאן יש צורך גם בשלטים יעודיים וגם במצלמה - מה שהופך את כל העסק לעוד יותר מסורבל.
הטכנולוגיה של מיקרוסופט לעומת זאת היא היחידה שמציעה מצלמה תלת מימדית, נטולת שלט יעודי לחלוטין (ולכן יכולה לעבוד בעצם עם כל שלט או חתיכת פלסטיק שתרצו לשים ביד), ומאפשרת לזהות הרבה יותר ממספר מצומצם של נקודות בחלל תלת מימדי.
למעשה, הטכנולוגיה של מיקרוסופט מאפשרת לזהות עד 48 נקודות שונות בחלל, וכך בעצם מאפשרת זיהוי תנועה מורכב יחסית של שלד/גפיים של בנאדם או אפילו מספר בני אדם במקביל עד לרמת הפרדה של אצבעות בודדות לפי מיקרוסופט (למעשה ניתן גם להשמיש את הטכנולוגיה לצילומי Motion Capture שהיום נעשים באמצעים יקרים בהרבה). זה משהו שהטכנולוגיות שנינטנדו וסוני הציגו עד היום פשוט לא יכולות להשתוות אליו (וזה רק דבר אחד).
ייתכן שבעתיד הן יציעו פיתרון דומה, אבל עם יתרון הזמן שיש למיקרוסופט בשוק, ועם האחיזה שלה בטכנולוגיות השונות (והגנה עליהן באמצעות פטנטים), קשה לראות את סוני או נינטנדו מציעים אלטרנטיבה מקבילה בדור הזה, ואולי גם בדור הבא.
וגם במידה והן כן ימצאו טכנולוגיה מקבילה לחומרה, השאלה הגדולה היא האם תהיה להם התוכנה להתמודד עם זה. הזכרתי כבר קודם כמה מיקרוסופט משקיעה בR&D של התחומים השונים שמשולבים בנאטאל, בדגש על התוכנה. זה לא משהו שלסוני ונינטנדו יהיה קל להתמודד איתו בכלל.
האם הנטאל תחליף את צורת השליטה הרגילה עם כפתורים?
בעוד שהטכנולוגיה יכולה להחליף את השליטה הקונבנציונלית במשחקים שונים, ובעיקר מתאימה במשחקים יעודיים שמפותחים עבור המצלמה, עדיין שליטה קונבנציונלית מתאימה הרבה יותר למשחקים שאנו מכירים היום.
הנקודה היא שנטאל לא חייבת לבוא על חשבון השליטה שיש היום: ניתן לשחק בנטאל גם בזמן שמחזיקים שלט X360 סטנדרטי בשתי הידיים, או גיטרה של גיטר הירו, או הגה מרוצים. למעשה, מפתחים יכולים אפילו להשתמש בנטאל על מנת לנצל את השלטים הקיימים בצורה יותר טובה: למשל באמצעות הצצה מצידי קירות באמצעות הטיית השלט במשחקי FPS (בדומה לקילזון 2 עם שלט הsixaxis), שימוש בפקודות קוליות לצורך יצירת ובחירת קבוצות של יחידות במשחקי RTS (כמו בEndWar), סריקת פנים לתוך דמויות במשחקים כמו Fight Night, או שימוש במחוות יד לצורך זריקת רימון בזווית מסוימת (מה שיקל על הפעולה במשחק כמו גירס).
אבל אלו סתם דוגמאות פשוטות, ומה שיהיה מעניין באמת הוא לראות מה מפתחים יחשבו לעשות עם הנאטאל ברגע שהם ישימו על ערכת הפיתוח את הידיים. בלי משחקים טובים שום טכנולוגיה כזו לא תהיה שווה כלום (לפחות עבור הקהל כאן אני מניח), והמשחקים הם מה שיגרמו לנאטאל ליפול או להצליח.
אבל אנחנו יודעים שבאנג'י ואפיק כבר התנסו עם הטכנולוגיה.
אנחנו גם יודעים שRare מעורבת בנושא, ושהטכנולוגיה יכולה לעבוד גם עם משחקים קיימים. אז אפשר להישאר אופטימיים ו לקוות שהמשחקים שיגיעו באמת יצדיקו את הטכנולוגיה הזו.
שורה תחתונה
אין עדיין שורה תחתונה - זו רק התחלה של הדיון. כשיהיה עוד מידע משמעותי ורלוונטי (כמו למשל שמועות על מחירים, או משחקים שמפותחים עבור נאטאל) אז נביא אותו לכאן.