פרוייקט אוקספורד של Microsoft מסייע למפתחים לבנות אפליקציות חכמות יותר

face-verification-photo-2

אתה מפתח, עם רעיון נפלא לאפליקציית כושר.

בעולם אידיאלי, האפליקציה הייתה מבצעת כל מיני טריקים מגניבים כמו לזהות את פניהם של המשתמשים השונים בתמונות, או להבין כאשר משתמש מבקש ממנה להתחיל ולהפסיק לעקוב אחרי אימון ריצה. אך תכונות מתוחכמות אלה אפשריות רק עם למידת מכונה (Machine Learning) מתקדמת, מסוג שלרוב אין באפשרותך להשיג מטעמי זמן או משאבים.

“כל אלה הם דברים שאנשים לא רוצים לדאוג לגביהם כשהם בונים את האפליקציה שלהם,” אמר מנאז מרצ’נט (Meenaz Merchant), מנהל תוכנית ראשי בצוות Bing Experiences של Microsoft.

בכנס Build 2015 הציגה Microsoft פתרון לכך. החברה פרסמה ערכת טכנולוגיות שנקראת פרוייקט אוקספורד, שמאפשרת למפתחים ליצור אפליקציות חכמות יותר המסוגלות לבצע אלמנטים הכוללים זיהוי פנים ופיענוח שפה טבעית, גם אם מפתחי האפליקציות אינם מומחים בתחומים אלה.

“אם אתה מפתח אפליקציות, אתה יכול פשוט לנצל את יכולות ה- API ולא לדאוג להיבט של למידת מכונה”, אמר ויז’אי ווקרארן (Vijay Vokkaarne), מנהל תוכנית ראשי לקבוצות עם Bing, שצוותו עובד על היבט השפה בפרויקט אוקספורד.

ערכת השירותים זמינה בשלב זה בגרסת בטא בחינם.

השירותים מאפשרים למפתחים לבצע אוטומציה של משימות שעלולות לעלות יותר מידי, או כאלה הצורכות יותר מדי זמן לביצוע באופן ידני. לדוגמה, ההיבט החזותי של השירות יכול לעבור על אלפי תמונות שנשלחו על-ידי משתמשים, כדי לזהות את אלה שעשויות להכיל תוכן מעורר מחלוקת או לא הולם, או פשוט לזהות תמונות שצולמו בחוף הים. לחילופין, ההיבט החזותי יכול לקבץ תמונות לפי ערכת צבעים דומיננטית, או לפי אלמנטים שונים שידרשו על ידי המפתח.

לבצע זאת באופן ידני זה “כמו לחפש מחט בערימה של שחת”, העיר מרצ’נט.

השירות עובד גם בין פלטפורמות תכנות ושפות שונות, החל מ- Windows ו- Windows Phone וכלה ב- iOS ו- Android. כדי לנסות את השירותים החדשים, יש צורך בחשבון Azure.

ריאן גלגון (Ryan Galgon), מנהל תוכניות בכיר בחטיבת הטכנולוגיה והמחקר של Microsoft, אמר כי החברה מציעה את השירותים משום שהיא רוצה לשתף עם קהילת המפתחים טכנולוגיות שהיא כבר יוצרת בכל מקרה עבור המוצרים והשירותים שלה.

בשלב הראשון, Microsoft מציעה את השירותים בגרסת בטא בחינם, בין היתר כדי שתוכל לקבל מובן טוב יותר של אופן השימוש בשירותים האמורים.

“אנחנו רוצים להבין מה מפתחים צריכים מהשירותים האלה”, אמר גלגון.

הגלריה החדשה של הצעות Machine Learning במסגרת פרויקט אוקספורד מסופקת למפתחים כחלק מחבילת מוצרי Azure. היא מתווספת ליכולות הנרחבות בתחום ה-Machine Learning הקיימות בפלטפורמת Azure ומאפשרות לבנות מודלים חכמים לאנליזות מתקדמות.

בשלב זה פרוייקט אוקספורד כולל ארבעה רכיבים מרכזיים:

זיהוי פנים: טכנולוגיה זו מזהה באופן אוטומטי פנים בתמונות, מסוגלת לקבץ יחדיו פנים דומות ולוודא אם הפנים הם אכן של אותו משתמש, או של מישהו אחר. ניתן להשתמש בה גם עבור זיהוי של המשתמשים המופיעים בתמונות מסוימות, וכדי לאפשר למשתמשים להיכנס למערכת באמצעות אימות פניהם. זוהי אותה הטכנולוגיה שנעשה בה שימוש באתר האינטרנט  שיצרנו, המסוגל לנחש את גילם של אנשים על פי תמונותיהם.

עיבוד דיבור: הטכנולוגיה מסוגלת לזהות דיבור ולתרגם אותו לטקסט, ולהפך. מפתחים יכולים להשתמש בטכנולוגיה עבור מגוון יכולות, כגון הכתבת טקסט או לגרום לקול אוטומטי להקריא הוראות או פונקציות חיוניות אחרות.

כלים ויזואליים: שירות זה יכול לנתח תוכן ויזואלי במטרה לחפש דברים כמו תוכן לא הולם או ערכת צבעים דומיננטית. הוא יכול גם לזהות ולהבין טקסט בתמונות, למשל שם של צוות, ויכול למיין תמונות לפי תוכן, למשל תמונות של חופים, בעלי חיים או אוכל. בנוסף, השירות יכול לכווץ תמונות ל-Thumbnail שימושי וניתן לזיהוי, לצורך סריקה קלה.

שירות חכם להבנת שפה (LUIS): שירות זה, שכרגע מוצע בגרסת בטא, מאפשר לאפליקציות להבין למה משתמשים מתכוונים כאשר הם אומרים או מקלידים משהו באמצעות שפה טבעית ויומיומית. באמצעות למידת מכונה, שבמסגרתה מערכות משתפרות בחיזוי רצונו של המשתמש על סמך ניסיון, השירות מפענח את מה שאנשים רוצים שהאפליקציה תעשה.

לדוגמה, באפליקציית כושר, המערכת יכולה ללמוד שכאשר המשתמש אומר “אני רוצה להתחיל בריצה שלי”, “התחל ריצה” או אפילו “יוצא לריצה”, המשמעות של כל האפשרויות האלה היא שהאפליקציה אמורה להתחיל לעקוב אחרי המרחק שהאדם עובר, ושסוג פעילות זה הוא “ריצה”. בדומה לכך, אמירות כמו “הפסק את הריצה שלי”, “בוא נפסיק את הריצה” או “סיימתי לרוץ”, ינחו את המערכת להפסיק את המעקב.

המערכת בנויה על ממשק פשוט יחסית, כך שמפתחים מרקעים שונים יכולים ללמד את LUIS את המשמעות של מילים מבחינת פעולות. בנוסף, בזמן שאנשים ישתמשו באפליקציה, LUIS ילמד להבין למה הם מתכוונים כשהם אומרים דברים כמו “אני לא מסוגל להמשיך עוד. סיים את הריצה”.

מפתחים, אם אתם מתעניינים בפרוייקט אוקספורד, תוכלו לנסות אותו כבר עכשיו. הכלים לזיהוי דיבור, תמונות ופנים זמינים בגרסת בטא, כשכאמור, בשלב זה פרוייקט LUIS הוא למשתמשים מוזמנים בלבד.

הפוסט נכתב על ידי אליסון לין מחטיבת Microsoft Research