מהם השירותיים העיקריים?
השירותים העיקריים כוללים:
- למידת מכונה – לעתים קרובות זהו הבסיס למערכת AI והוא הדרך שבה אנו "מלמדים" מודל ממוחשב כדי לבצע חיזוי ולהסיק מסקנות מנתונים.
- זיהוי אנומליה – היכולת לזהות באופן אוטומטי שגיאות או פעילות חריגה במערכת.
- ראייה ממוחשבת – היכולת של תוכנות לפרש את העולם באופן חזותי באמצעות מצלמות, וידאו ותמונות.
- עיבוד שפה טבעית – היכולת של מחשב לפרש שפה כתובה או מדוברת , ולהגיב בעין.
- כריית ידע – היכולת לחלץ מידע מכמויות גדולות של נתונים לא מובנים לעתים קרובות כדי ליצור מאגר ידע הניתן לחיפוש.
למידת מכונה היא הבסיס לרוב פתרונות הבינה המלאכותית.
נתחיל בהסתכלות על דוגמה מהעולם האמיתי לאופן שבו ניתן להשתמש בלמידת מכונה כדי לפתור בעיה קשה.
כיצד פועלת למידת מכונה
אז איך מכונות לומדות?
התשובה היא, מנתונים. בעולם של היום, אנו יוצרים כמויות עצומות של נתונים תוך כדי חיי היומיום שלנו. מהודעות הטקסט, המיילים והפוסטים במדיה החברתית שאנו שולחים ועד לתמונות ולסרטונים שאנו מצלמים בטלפונים שלנו, אנו מייצרים כמויות עצומות של מידע. נתונים נוספים עדיין נוצרים על ידי מיליוני חיישנים בבתים, במכוניות, בערים, בתשתיות התחבורה הציבורית ובמפעלים שלנו.
מדעני נתונים יכולים להשתמש בכל הנתונים האלה כדי לאמן מודלים של למידת מכונה שיכולים לבצע תחזיות והסקת מסקנות בהתבסס על הקשרים שהם מוצאים בנתונים.
לדוגמה, נניח שארגון לשימור הסביבה מעוניין שמתנדבים יזהו ויצטטו מינים שונים של פרחי בר באמצעות אפליקציית טלפון. ההנפשה הבאה מציגה כיצד ניתן להשתמש בלמידת מכונה כדי להפוך תרחיש זה לזמין.
- צוות של בוטנאים ומדענים אוספים נתונים על דגימות של פרחי בר.
- הצוות מתייג את הדגימות עם המינים הנכונים.
- הנתונים המסומנים מעובדים באמצעות אלגוריתם שמוצא קשרים בין התכונות של הדגימות לבין המינים המסומנים.
- תוצאות האלגוריתם עטופות במודל.
- כאשר דגימות חדשות נמצאות על ידי מתנדבים, המודל יכול לזהות לפי התווית את המין הנכון.
למידת מכונה ב- Microsoft Azure
Microsoft Azure מספק את שירות למידת המכונה של Azure – פלטפורמה מבוססת ענן ליצירה, ניהול ופרסום של מודלים של למידת מכונה.
למידת מכונה של Azure מספקת את התכונות והיכולות הבאות:
תכונה | יכולת |
למידת מכונה אוטומטית | תכונה זו מאפשרת לאנשים שאינם מומחים ליצור במהירות מודל יעיל של למידת מכונה מנתונים. |
מעצב למידת מכונה של Azure | ממשק גרפי המאפשר פיתוח ללא קוד של פתרונות למידת מכונה. |
ניהול נתונים ומחשוב | אחסון נתונים מבוסס ענן ומשאבי מחשוב שמדעני נתונים מקצועיים יכולים להשתמש בהם כדי להריץ קוד ניסוי נתונים בקנה מידה גדול. |
צינורות | מדעני נתונים, מהנדסי תוכנה ומומחי תפעול IT יכולים להגדיר צינורות כדי לתאם משימות הדרכה, פריסה וניהול של מודלים. |
תארו לעצמכם שאתם יוצרים מערכת תוכנה לניטור עסקאות בכרטיסי אשראי ולזיהוי דפוסי שימוש חריגים שעשויים להצביע על הונאה. או יישום שעוקב אחר הפעילות בקו ייצור אוטומטי ומזהה כשלים. או מערכת טלמטריה של מכונית מירוץ המשתמשת בחיישנים כדי להזהיר מהנדסים באופן יזום מפני כשלים מכניים פוטנציאליים לפני שהם מתרחשים.
ניתן לטפל בתרחישים מסוג זה באמצעות זיהוי אנומליות – טכניקה מבוססת למידת מכונה המנתחת נתונים לאורך זמן ומזהה שינויים חריגים.
בואו נחקור כיצד זיהוי אנומליות עשוי לעזור בתרחיש של מכונית מירוץ.
- חיישנים במכונית אוספים טלמטריה, כגון סיבובי מנוע, טמפרטורת בלם וכן הלאה.
- מודל זיהוי אנומליות מאומן להבין תנודות צפויות במדידות הטלמטריה לאורך זמן.
- אם מדידה מתרחשת מחוץ לטווח הצפוי הרגיל, המודל מדווח על אנומליה שניתן להשתמש בה כדי להתריע בפני מהנדס המרוץ לקרוא לנהג לעצור את הבור כדי לתקן את הבעיה לפני שהוא מאלץ פרישה מהמרוץ.
זיהוי אנומליה ב- Microsoft Azure
ב- Microsoft Azure, שירות גלאי האנומליה מספק ממשק תיכנות יישומים (API) שמפתחים יכולים להשתמש בו כדי ליצור פתרונות לזיהוי אנומליות.
הבנת הראייה הממוחשבת
ראייה ממוחשבת היא תחום של בינה מלאכותית העוסק בעיבוד חזותי. בואו נחקור כמה מהאפשרויות שראייה ממוחשבת מביאה.
אפליקציית הבינה המלאכותית הרואה היא דוגמה מצוינת לכוחה של ראייה ממוחשבת. האפליקציה 'רואה בינה מלאכותית', שתוכננה עבור קהילת העיוורים ולקויי הראייה, רותמת את כוחה של הבינה המלאכותית כדי לפתוח את העולם החזותי ולתאר אנשים, טקסט ואובייקטים בקרבת מקום.
מודלים ויכולות ראייה ממוחשבת
רוב פתרונות הראייה הממוחשבת מבוססים על מודלים של למידת מכונה שניתן ליישם על קלט חזותי ממצלמות, סרטונים או תמונות. הטבלה הבאה מתארת משימות נפוצות של ראייה ממוחשבת.
סיווג תמונות – סיווג תמונות כרוך באימון מודל למידת מכונה כדי לסווג תמונות על סמך התוכן שלהן. לדוגמה, בפתרון ניטור תנועה ייתכן שתשתמש במודל סיווג תמונות כדי לסווג תמונות לפי סוג הרכב שהן מכילות, כגון מוניות, אוטובוסים, רוכבי אופניים וכן הלאה.
זיהוי אובייקטים – מודלים של למידת מכונה לזיהוי אובייקטים מאומנים לסווג אובייקטים בודדים בתוך תמונה, ולזהות את מיקומם באמצעות תיבה תוחמת. לדוגמה, פתרון ניטור תנועה עשוי להשתמש בזיהוי אובייקטים כדי לזהות את המיקום של סוגים שונים של כלי רכב.
סגמנטציה סמנטית – סגמנטציה סמנטית היא טכניקת למידת מכונה מתקדמת שבה פיקסלים בודדים בתמונה מסווגים לפי האובייקט שאליו הם שייכים. לדוגמה, פתרון ניטור תנועה עשוי לכסות תמונות תנועה בשכבות "מסיכה" כדי להדגיש כלי רכב שונים באמצעות צבעים ספציפיים.
ניתוח תמונות – ניתן ליצור פתרונות המשלבים מודלים של למידת מכונה עם טכניקות מתקדמות לניתוח תמונות כדי לחלץ מידע מתמונות, כולל "תגים" שיכולים לעזור לקטלג את התמונה או אפילו כיתובים תיאוריים המסכמים את הסצנה המוצגת בתמונה.
זיהוי פנים, ניתוח וזיהוי פנים – זיהוי פנים הוא צורה מיוחדת של זיהוי אובייקטים המאתרת פנים אנושיות בתמונה. ניתן לשלב זאת עם טכניקות סיווג וניתוח גיאומטריית פנים כדי לזהות אנשים על סמך תווי הפנים שלהם.
זיהוי תווים אופטי (OCR) – זיהוי תווים אופטי הוא טכניקה המשמשת לזיהוי וקריאה של טקסט בתמונות. באפשרותך להשתמש בזיהוי תווים אופטי (OCR) כדי לקרוא טקסט בתצלומים (לדוגמה, תמרורים או חזיתות חנויות) או כדי לחלץ מידע ממסמכים סרוקים כגון מכתבים, חשבוניות או טפסים.
שירותי ראייה ממוחשבת ב- Microsoft Azure
Microsoft Azure מספק את השירותים הקוגניטיביים הבאים כדי לעזור לך ליצור פתרונות ראייה ממוחשבת:
שירות | יכולות |
ראייה ממוחשבת | אתה יכול להשתמש בשירות זה כדי לנתח תמונות ווידאו, ולחלץ תיאורים, תגים, אובייקטים וטקסט. |
חזון מותאם אישית | השתמש בשירות זה כדי לאמן מודלים מותאמים אישית של סיווג תמונות וזיהוי אובייקטים באמצעות תמונות משלך. |
פנים | שירות Face מאפשר לך לבנות פתרונות זיהוי פנים וזיהוי פנים. |
מזהה טפסים | השתמש בשירות זה כדי לחלץ מידע מטפסים וחשבוניות שנסרקו. |
הבנת עיבוד שפה טבעית בבינה מלאכותית
עיבוד שפה טבעית (NLP) הוא תחום הבינה המלאכותית העוסק ביצירת תוכנה שמבינה שפה כתובה ומדוברת.
NLP מאפשר לך ליצור תוכנה שיכולה:
- לנתח ולפרש טקסט במסמכים, בהודעות דואר אלקטרוני ובמקורות אחרים.
- לפרש שפה מדוברת ולסנתז תגובות דיבור.
- לתרגם באופן אוטומטי ביטויים מדוברים או כתובים בין שפות.
- פירוש פקודות וקביעת פעולות מתאימות.
לדוגמה, Starship Commander, הוא משחק מציאות מדומה (VR) מבית Human Interact, המתרחש בעולם מדע בדיוני. המשחק משתמש בעיבוד שפה טבעית כדי לאפשר לשחקנים לשלוט בנרטיב ולקיים אינטראקציה עם דמויות במשחק ומערכות חלליות.
עיבוד שפה טבעית ב- Microsoft Azure
ב- Microsoft Azure, באפשרותך להשתמש בשירותים הקוגניטיביים הבאים כדי לבנות פתרונות לעיבוד שפה טבעית:
שירות | יכולות |
שפה | השתמש בשירות זה כדי לגשת לתכונות להבנה ולניתוח של טקסט, לאימון מודלים של שפות שיכולות להבין פקודות מדוברות או מבוססות טקסט ולבניית יישומים חכמים. |
מתרגם | השתמש בשירות זה כדי לתרגם טקסט בין יותר מ-60 שפות. |
דיבור | השתמש בשירות זה כדי לזהות ולסנתז דיבור, ולתרגם שפות מדוברות. |
Azure Bot | שירות זה מספק פלטפורמה לבינה מלאכותית של שיחה, היכולת של "סוכן" תוכנה להשתתף בשיחה. מפתחים יכולים להשתמש במסגרת הבוט כדי ליצור תוכנית Bot ולנהל אותה באמצעות Azure Bot Service – שילוב שירותים עורפיים כגון שפה, והתחברות לערוצים עבור צ'אט באינטרנט, דואר אלקטרוני, Microsoft Teams ואחרים. |
יכולות של מודלים של בינה מלאכותית של OpenAI
קיימות שלוש קטגוריות עיקריות של יכולות הנמצאות במודלים של OpenAI AI:
יכולת | דוגמאות |
יצירת שפה טבעית | כגון: סיכום טקסט מורכב לרמות קריאה שונות, הצעת ניסוח חלופי למשפטים ועוד |
יצירת קוד | כגון: תרגום קוד משפת תכנות אחת לאחרת, זיהוי ופתרון באגים בקוד, ועוד |
יצירת תמונות | כגון: הפקת תמונות לפרסומים מתיאורי טקסט ועוד |
מהי בינה מלאכותית גנרטיבית?
OpenAI הופכת את מודלי הבינה המלאכותית שלה לזמינים למפתחים כדי לבנות יישומי תוכנה רבי עוצמה, כגון ChatGPT. ישנן המון דוגמאות אחרות ליישומי OpenAI באתר OpenAI, החל מעשיות, כגון יצירת טקסט מקוד, ועד משעשעות גרידא, כגון המצאת סיפורים מפחידים.
בואו נזהה היכן מודלי OpenAI משתלבים בנוף הבינה המלאכותית.
- בינה מלאכותית מחקה התנהגות אנושית על ידי הסתמכות על מכונות כדי ללמוד ולבצע משימות ללא הנחיות מפורשות על מה להפיק.
- מודלים של למידת מכונה קולטים נתונים כמו תנאי מזג אוויר ומתאימים את הנתונים לאלגוריתם, כדי ליצור תחזיות כמו כמה כסף חנות עשויה להרוויח ביום נתון.
- מודלים של למידה עמוקה משתמשים בשכבות של אלגוריתמים בצורה של רשתות עצביות מלאכותיות כדי להחזיר תוצאות למקרי שימוש מורכבים יותר. שירותי הבינה המלאכותית של Azure מבוססים על מודלים של למידה עמוקה. תוכל לעיין במאמר זה כדי ללמוד עוד על ההבדל בין למידת מכונה ללמידה עמוקה.
- מודלים של בינה מלאכותית גנרטיבית הם תת-קבוצה של מודלים של למידה עמוקה שיכולים לייצר תוכן חדש המבוסס על מה שמתואר בקלט. מודלי OpenAI הם אוסף של מודלים גנרטיביים של בינה מלאכותית שיכולים לייצר שפה, קוד ותמונות.
בשלב הבא תלמד כיצד Azure OpenAI מעניק למשתמשים את היכולת לשלב את הפתרונות ברמה ארגונית של Azure עם רבים מאותם מודלים של בינה מלאכותית גנרטיבית של OpenAI.
מה זה Azure OpenAI?
OpenAI הופכת את מודלי הבינה המלאכותית שלה לזמינים למפתחים כדי לבנות יישומי תוכנה רבי עוצמה, כגון ChatGPT. ישנן המון דוגמאות אחרות ליישומי OpenAI באתר OpenAI, החל מעשיות, כגון יצירת טקסט מקוד, ועד משעשעות גרידא, כגון המצאת סיפורים מפחידים.
Microsoft משתפת פעולה עם OpenAI כדי להשיג שלוש מטרות עיקריות:
- כדי לנצל את התשתית של Azure, כולל אבטחה, תאימות וזמינות אזורית, כדי לעזור למשתמשים לבנות יישומים ברמה ארגונית.
- כדי לפרוס יכולות מודל AI של OpenAI במוצרי Microsoft, כולל מוצרי בינה מלאכותית של Azure ומעבר להם.
- כדי להשתמש ב- Azure כדי להפעיל את כל עומסי העבודה של OpenAI.
מבוא לשירות OpenAI של Azure
שירות OpenAI של Azure הוא תוצאה של השותפות בין Microsoft ו- OpenAI. השירות משלב את היכולות ברמה ארגונית של Azure עם יכולות מודל הבינה המלאכותית הגנרטיבית של OpenAI.
Azure OpenAI זמין עבור משתמשי Azure ומורכב מארבעה רכיבים:
- מודלים של בינה מלאכותית גנרטיבית שהוכשרו מראש
- יכולות התאמה אישית; היכולת לכוונן מודלים של בינה מלאכותית עם נתונים משלך
- כלים מוכללים לזיהוי וצמצום מקרי שימוש מזיקים כדי שמשתמשים יוכלו ליישם בינה מלאכותית בצורה אחראית
- אבטחה ברמה ארגונית עם בקרת גישה מבוססת תפקידים (RBAC) ורשתות פרטיות
השימוש ב- Azure OpenAI מאפשר לך לעבור בין העבודה שלך עם שירותי Azure ו- OpenAI, תוך שימוש ברשת הפרטית של Azure, הזמינות האזורית וסינון תוכן AI אחראי.
Azure OpenAI תומך בעומסי עבודה נפוצים רבים של בינה מלאכותית ופותר עבור כמה חדשים.
עומסי עבודה נפוצים של בינה מלאכותית כוללים למידת מכונה, ראייה ממוחשבת, עיבוד שפה טבעית, בינה מלאכותית בשיחה, זיהוי אנומליות וכריית ידע.
ניתן לסווג עומסי עבודה אחרים של AI שבהם תומך Azure OpenAI לשלוש קבוצות:
- יצירת שפה טבעית
- השלמת טקסט: יצירה ועריכה של טקסט
- הטבעות: חיפוש, סיווג והשוואה של טקסט
- יצירת קוד: יצירה, עריכה והסבר של קוד
- יצירת תמונות: יצירה ועריכה של תמונות
הקשר של Azure OpenAI לשירותי הבינה המלאכותית של Azure
שירותי הבינה המלאכותית של Azure הם כלים לפתרון עומסי עבודה של בינה מלאכותית וניתן לסווג אותם לפלטפורמת למידת המכונה של Azure, לשירותים קוגניטיביים ולשירותי AI יישומיים.
Azure Cognitive Services כולל חמישה עמודי תווך: חזון, דיבור, שפה, החלטה ושירות OpenAI של Azure . השירותים שבהם תבחר להשתמש תלויים במה שעליך להשיג. בפרט, ישנן מספר יכולות חופפות בין שירות השפה של השירות הקוגניטיבי לבין השירות של OpenAI, כגון תרגום, ניתוח סנטימנטים וחילוץ מילות מפתח.
אמנם אין הנחיות קפדניות לגבי מתי להשתמש בשירות מסוים, אך ניתן להשתמש בשירות השפה הקיים של Azure עבור מקרי שימוש ידועים הדורשים כוונון מינימלי, התהליך של מיטוב ביצועי המודל. השירות
של Azure OpenAI עשוי להיות מועיל יותר עבור מקרי שימוש הדורשים מודלים גנרטיביים מותאמים אישית, או עבור מחקר אקספלורציה.
בעת קבלת החלטות עסקיות לגבי סוג המודל שבו יש להשתמש או כדי להבין מדוע מודלים של למידת מכונה שהוכשרו מראש מבוקשים כל כך, חשוב להבין כיצד צרכי הזמן והמחשוב משפיעים על הכשרת למידת מכונה. כדי לקבל מודל למידת מכונה עובד, זה צריך להיות מאומן עם נתונים. החלק של ה'למידה' באימון דורש מהמחשב לנסות את כל הפתרונות עד שהוא מזהה את המודל המתאים ביותר לנתונים. מודל בעל ביצועים גבוהים יותר, משימה מורכבת יותר ומערך נתוני אימון גדול יותר מביאים לזמן רב יותר הנדרש כדי לעבור על פתרונות אפשריים.
כיצד להשתמש ב – Azure OpenAI
בשלב זה עליך להגיש בקשה לגישה ל- Azure OpenAI. לאחר קבלת הגישה, באפשרותך להשתמש בשירות על-ידי יצירת משאב OpenAI של Azure , כפי שהיית עושה עבור שירותי Azure אחרים. לאחר יצירת המשאב, באפשרותך להשתמש בשירות באמצעות ממשקי API של REST, Python SDK או ממשק מבוסס אינטרנט ב – Azure OpenAI Studio
Azure OpenAI Studio
ב- Azure OpenAI Studio, באפשרותך לבנות מודלים של בינה מלאכותית ולפרוס אותם לצריכה ציבורית ביישומי תוכנה. היכולות של Azure OpenAI מתאפשרות על-ידי כמה מודלים ספציפיים של בינה מלאכותית גנרטיבית. מודלים שונים מותאמים למשימות שונות; חלק מהמודלים מצטיינים במשימות סיכום פשוטות, חלקם מעולים בתגובות כלליות לא מובנות, ואחרים בנויים ליצירת תמונות ייחודיות מהזנת טקסט.
מודלים אלה של OpenAI מתחלקים לכמה משפחות עיקריות:
- גנרטור מאומן מראש (GPT)
- קודקס
- דאל-אי
המודלים זמינים גם ב- Azure OpenAI.
ניתן לאמן ולהתאים אישית את מודלי הבינה המלאכותית של Azure OpenAI באמצעות כוונון עצמי.
חשוב
למודלים של בינה מלאכותית גנרטיבית יש תמיד הסתברות לשקף ערכים אמיתיים. מודלים בעלי ביצועים גבוהים יותר, כגון מודלים שעברו כוונון עדין למשימות ספציפיות, עושים עבודה טובה יותר בהחזרת תגובות המשקפות ערכים אמיתיים. חשוב לסקור את הפלט של מודלים גנרטיביים של בינה מלאכותית. בנוסף, המודלים המסופקים על-ידי Azure OpenAI מאומנים על נתונים לפני אוקטובר 2019 ואינם גולשים באינטרנט, כך שייתכן שאין להם ידע על אירועים אקטואליים.
הבנת היכולות של OpenAI
OpenAI הופכת את מודלי הבינה המלאכותית שלה לזמינים למפתחים כדי לבנות יישומי תוכנה רבי עוצמה, כגון ChatGPT. ישנן המון דוגמאות אחרות ליישומי OpenAI באתר OpenAI, החל מעשיות, כגון יצירת טקסט מקוד, ועד משעשעות גרידא, כגון המצאת סיפורים מפחידים.
הבנת יכולות השפה הטבעית של OpenAI
מודלי השפה הטבעית של Azure OpenAI מסוגלים לקלוט שפה טבעית וליצור תגובות.
מודלים של לימוד שפה טבעית מאומנים על מילים או גושי תווים המכונים אסימונים. לדוגמה, המילה "המבורגר" מתפרקת לאסימונים ham, bur וger, בעוד שמילה קצרה ונפוצה כמו "אגס" היא אסימון יחיד. אסימונים אלה ממופים לווקטורים עבור מודל למידת מכונה שישמש לאימון. כאשר מודל שפה טבעית מאומן קולט את הקלט של המשתמש, הוא גם מפרק את הקלט לאסימונים.
הבנת מודלים של GPT ליצירת שפה טבעית
מודלים גנרטיביים של גנרטור מאומן מראש (GPT) מצוינים הן בהבנה והן ביצירת שפה טבעית. אם ראית חדשות אחרונות סביב בינה מלאכותית שעונה על שאלות או כותבת פסקה על סמך הנחיה, סביר להניח שהיא נוצרה על ידי מודל GPT. דגמי GPT כוללים לעתים קרובות את הגרסה המצורפת לסוף, כגון GPT-2 או GPT-3. Azure OpenAI מציע גישה ל- GPT-3, ויספק גישה ל- GPT-3.5 בקרוב.
איך נראה GPT-3?
היבט מרכזי של הבינה המלאכותית הגנרטיבית של OpenAI הוא שנדרשת קלט, או הנחיה, כדי להחזיר תגובה של שפה טבעית, חזותית או קוד. GPT מנסה להסיק, או לנחש, את ההקשר של שאלת המשתמש בהתבסס על ההנחיה.
מודלים של GPT מצטיינים בהשלמת מספר משימות בשפה טבעית, שחלקן כוללות:
משימה | בשורת |
סיכום טקסט | "סכם את הטקסט הזה לטשטוש קצר" |
סיווג טקסט | "איזה ז'אנר של ספר זה?" |
יצירת שמות או ביטויים | "כתבו כותרת לחברת הפרחים שלי" |
תרגום | "תרגם את 'מה שלומך' לצרפתית" |
מענה על שאלות | "מה עושה Azure OpenAI ?" |
הצעת תוכן | "תן לי את חמשת שירי החתונות הכי טובים" |
לדוגמה, בהינתן בקשה שבה המשתמש מקליד טקסט המבקש מתכון לבישול:
כתבו מתכון המבוסס על המרכיבים וההוראות הבאים: פאי פירותמרכיבים:תותיםאוכמניותקמחביציםחלב
הנה דוגמה לתגובה שנוצרה על-ידי ה-API של OpenAI:
הוראות: 1. מחממים תנור ל-180 מעלות.2. בקערה בינונית, מערבבים יחד 1 קמח וביצה אחת עד לקבלת בצק.3. משמנים תבנית פאי בקוטר 9 אינץ' בחמאה או בתרסיס בישול נון-סטיק.4. מרדדים את הבצק ומניחים בכלי הפשטידה.5. בקערה נפרדת, מערבבים יחד אחת של תותים, אחת של אוכמניות וכוס אחת של חלב.6. יוצקים את תערובת הפירות לתבנית הפשטידה.7. לאפות
טעים – אולי! חשוב להבין שהתגובות שנוצרו הן הניחושים הטובים ביותר ממכונה. במקרה זה, הטקסט שנוצר עשוי להיות שימושי לבישול משהו שטעמו טוב בחיים האמיתיים, או לא.
כיצד מודלים מוכלים על מקרי שימוש חדשים
ChatGPT הוא צ'אט בוט הבנוי על מודל הבינה המלאכותית הגנרטיבית GPT-3.5. ייתכן שניסית את יכולות החיזוי של ChatGPT בפורטל צ'אט הדומה לצילום מסך זה, שבו תוכל להקליד הנחיות ולקבל תגובות אוטומטיות. הפורטל מורכב מממשק המשתמש הקדמי (UI) שמשתמשים רואים, ומקצה עורפי הכולל את דגם GPT-3.5. ניתן לתאר את השילוב של הקצה הקדמי והאחורי כצ'אט בוט. המודל המסופק בקצה האחורי הוא מה שזמין כאבן בניין עם ה- API של OpenAI. כאשר אתה רואה יכולות דמויות ChatGPT ביישומים אחרים, מפתחים לקחו את אבני הבניין, התאימו אותן אישית למקרה שימוש ובנו אותן בקצה האחורי של ממשקי משתמש חזיתיים חדשים.
הבנת יכולות יצירת הקוד של OpenAI
מודלים של בינה מלאכותית של יצירת קוד מסוגלים לקחת שפה טבעית או קטעי קוד ולתרגם אותם לקוד. משפחת המודלים ליצירת קוד OpenAI, Codex, בקיאה ביותר מתריסר שפות, כגון C#, JavaScript, Perl, PHP, והיא בעלת היכולת הגבוהה ביותר בפייתון.
קודקס
מודלים של קודקס מבוססים על GPT-3 וממוטבים להבנה וכתיבה של קוד. מודלים אלה הוכשרו הן על שפה טבעית והן על מיליארדי שורות קוד ממאגרים ציבוריים. קודקס מסוגל ליצור קוד מהוראות בשפה טבעית כגון הערות קוד, ויכול להציע דרכים להשלים פונקציות קוד.
לדוגמה, בהינתן ההנחיה "כתוב ספירת לולאה מ- 1 עד 10 בפייתון", ניתנת התשובה הבאה:
Python
For i range(1,11): הדפס(i)
מודלים של יצירת קוד יכולים לעזור למפתחים לקודד מהר יותר, להבין שפות קידוד חדשות ולהתמקד בפתרון בעיות גדולות יותר ביישום שלהם. מפתחים יכולים לפרק את המטרה שלהם למשימות פשוטות יותר ולהשתמש ב- Codex כדי לעזור לבנות משימות אלה באמצעות דפוסים ידועים.
דוגמאות ליצירת קוד
חלק מנתוני האימון של GPT-3 כללו שפות תכנות, ולכן אין זה מפתיע שמודלים של GPT יכולים לענות על שאלות תכנות אם הם נשאלים. מה שמיוחד במשפחת המודלים של Codex הוא שהיא מסוגלת יותר על פני יותר שפות מאשר מודלים של GPT.
קודקס הוא הרבה מעבר לכתיבת קוד מהנחיות בשפה טבעית. בהינתן הקוד הבא, הוא יכול ליצור בדיקות יחידה:
Python
# Python 3def mult_numbers(a, b): החזרת a * b # Unit Testabsolutely
Codex builds unit tests for our function:
Python
# Python 3def mult_numbers(a, b): החזרת a * b # Unit Testdef test_mult_numbers():loadmult_numbers(3,4) ==12loadmult_numbers(0,10) ==0loadmult_numbers(4,0) ==0 # Unit Testdef test_mult_numbers_שלילי():Loadmult_numbers(-1,10) ==-10loadmult_numbers(10,-1) ==-10
קודקס יכול גם לסכם פונקציות שכבר נכתבו, להסביר שאילתות או טבלאות SQL ולהמיר פונקציה משפת תכנות אחת לאחרת.
כאשר אתה מקיים אינטראקציה עם מודלים של Codex, באפשרותך לציין ספריות או תגים ספציפיים לשפה כדי להבהיר לקודקס מה אנו רוצים. לדוגמה, אנו יכולים לספק בקשה זו מעוצבת כ HTML תגובה: <!– לבנות דף שכותרתו "בואו ללמוד על בינה מלאכותית"
ולקבל את זה כתוצאה מכך:
<html>
<ראש>
<title>בואו ללמוד על AI</title>
<link rel="stylesheet" type="text/css" href="css/styles.css">
</ראש>
<גוף>
<div class="עטיפה">
<div class="header">
<h1>בואו ללמוד על בינה מלאכותית</h1>
</div>
<div class="nav">
<ul>
<li><a href="index.php">Home</a></li>
<li><a href="about.php">About</a></li>
<li><a href="resources.php">Resources</a></li>
<li><a href="contact.php">Contact</a></li>
</ul>
</div>
<div class="תוכן">
<h2>צור קשר</h2>
<p>
<!– build a form to contact the publisher –>
<פעולת טופס = "יצירת קשר.php" שיטה = "post">
<label for="name">Name:</label>
<input type="text" name="name"ID="name"required>
<label for="email">Email:</label>
<Input Type="Email"Name="Email"ID="Email">
<label for="subject">Subject:</label>
<Input Type="Text"Name="Subject"ID="Subject">
<label for="message">Message:</label>
<textarea name="message" id="message" נדרש></textarea>
<Input Type="Send"Value="Send">
</טופס>
</p>
</div>
<div class="footer">
<p>בואו ללמוד על AI</p>
</div>
</div>
</גוף>
</html>
GitHub Copilot
OpenAI שיתפה פעולה עם GitHub כדי ליצור את ה- GitHub Copilot, שילוב של OpenAI Codex בתוסף לסביבות מפתחים כמו Visual Studio Code.
לאחר התקנת התוסף והפעלתו, תוכל להתחיל לכתוב את הקוד שלך, ו- GitHub Copilot יתחיל להציע באופן אוטומטי את שארית הפונקציה בהתבסס על הערות קוד או שם הפונקציה. לדוגמה, יש לנו רק שם פונקציה בקובץ, והטקסט האפור מוצע באופן אוטומטי להשלמתו.
GitHub Copilot מציע הצעות מרובות להשלמת קוד, אשר ניתן לעבור באמצעות קיצורי מקשים. כאשר ניתנו הערות קוד אינפורמטיביות, הוא יכול אפילו להציע שם פונקציה יחד עם קוד הפונקציה המלא.
הבנת יכולות יצירת התמונות של OpenAI
מודלים של יצירת תמונה יכולים לקבל הנחיה, תמונת בסיס או את שניהם, וליצור משהו חדש. מודלים אלה של בינה מלאכותית גנרטיבית יכולים ליצור תמונות מציאותיות ואמנותיות כאחד, לשנות את הפריסה או הסגנון של תמונה וליצור וריאציות על תמונה מסופקת.
DALL-E
בנוסף ליכולות השפה הטבעית, מודלים אלה של בינה מלאכותית גנרטיבית יכולים לערוך וליצור תמונות. המודל שעובד עם תמונות נקרא DALL-E. בדומה לדגמי GPT, גרסאות מאוחרות יותר של DALL-E מצורפות לשם, כגון DALL-E 2. יכולות תמונה משתייכות בדרך כלל לשלוש הקטגוריות של יצירת תמונה, עריכת תמונה ויצירת וריאציות של תמונה.
יצירת תמונות
ניתן ליצור תמונות מקוריות על ידי מתן הודעת טקסט של מה שאתה רוצה שהתמונה תהיה. ככל שהבקשה מפורטת יותר, כך גדל הסיכוי שהמודל יספק תוצאה רצויה.
עם DALL-E, אתה יכול אפילו לבקש תמונה בסגנון מסוים, כגון "כלב בסגנון וינסנט ואן גוך". ניתן להשתמש בסגנונות גם לעריכות ווריאציות.
לדוגמה, בהינתן ההנחיה "פיל עומד עם המבורגר למעלה, סגנון אמנות דיגיטלית", המודל מייצר תמונות אמנות דיגיטליות המתארות בדיוק את מה שמתבקש
כשמבקשים משהו גנרי יותר כמו "שועל ורוד", התמונות שנוצרות מגוונות ופשוטות יותר ועדיין ממלאות את מה שמתבקש.
עם זאת, כאשר אנו הופכים את ההנחיה לספציפית יותר, כגון "שועל ורוד רץ בשדה, בסגנון מונה", המודל יוצר תמונות מפורטות דומות הרבה יותר.
עריכת תמונה
כשמספקים תמונה, DALL-E יכול לערוך את התמונה כמבוקש על-ידי שינוי הסגנון שלה, הוספה או הסרה של פריטים או יצירת תוכן חדש להוספה. פעולות עריכה מתבצעות על-ידי העלאת התמונה המקורית וציון מסיכה שקופה המציינת איזה אזור בתמונה יש לערוך. יחד עם התמונה והמסיכה, הנחיה המציינת מה יש לערוך מורה למודל ליצור את התוכן המתאים למילוי האזור.
כאשר מקבלים את אחת התמונות הנ"ל של שועל ורוד, מסכה המכסה את השועל, ואת ההנחיה של "גורילה כחולה קוראת ספר בשדה", המודל יוצר עריכות של התמונה על סמך הקלט שסופק.
וריאציות של תמונות
ניתן ליצור וריאציות תמונה על-ידי מתן תמונה וציון מספר הווריאציות של התמונה הרצויה. התוכן הכללי של התמונה יישאר ללא שינוי, אך היבטים יותאמו כגון מיקום או הסתכלות של נושאי הצילום, סצנת רקע וצבעים עשויים להשתנות.
לדוגמה, אם אני מעלה את אחת התמונות של הפיל חובש המבורגר ככובע, אני מקבל וריאציות של אותו נושא.
הערה
הגישה ל-DALL-E ניתנת כרגע על בסיס הזמנה בלבד.
מדיניות הגישה והבינה המלאכותית האחראית של Azure OpenAI
חשוב לקחת בחשבון את ההשלכות האתיות של עבודה עם מערכות בינה מלאכותית. Azure OpenAI מספק מודלים רבי עוצמה של שפה טבעית המסוגלים להשלים משימות שונות ולפעול במספר מקרי שימוש שונים, כל אחד עם שיקולים משלו לשימוש בטוח והוגן. צוותים או אנשים שתפקידם לפתח ולפרוס מערכות בינה מלאכותית צריכים לפעול כדי לזהות, למדוד ולצמצם נזקים.
השימוש ב- Azure OpenAI צריך לפעול בהתאם לששת עקרונות הבינה המלאכותית של Microsoft:
- הגינות: מערכות אל צריכות לקבל החלטות המפלות לרעה או תומכות בהטיה של קבוצה או יחיד.
- אמינות ובטיחות: מערכות Al צריכות להגיב בבטחה למצבים חדשים ולמניפולציות פוטנציאליות.
- פרטיות ואבטחה: מערכות Al צריכות להיות מאובטחות ולכבד את פרטיות הנתונים.
- הכללה: מערכות Al צריכות להעצים את כולם ולערב אנשים.
- אחריותיות: אנשים חייבים להיות אחראים לאופן שבו מערכות Al פועלות.
- שקיפות: למערכות AI צריכים להיות הסברים כדי שמשתמשים יוכלו להבין כיצד הן בנויות ומשמשות אותן.
עקרונות בינה מלאכותית אחראית מנחים את הערות השקיפות של Microsoft ב- Azure OpenAI, כמו גם הסברים על מוצרים אחרים. הערות שקיפות מיועדות לעזור לך להבין כיצד פועלת טכנולוגיית הבינה המלאכותית של Microsoft, את הבחירות שבעלי מערכות יכולים לבצע המשפיעות על ביצועי המערכת ועל התנהגותה, ואת החשיבות של חשיבה על המערכת כולה, כולל הטכנולוגיה, האנשים והסביבה.
אם לא השלמת את תחילת העבודה עם AI במודול Azure , כדאי לבדוק את היחידה שלו ב – AI אחראי.
גישה מוגבלת ל – Azure OpenAI
כחלק מהמחויבות של Microsoft לשימוש אחראי בבינה מלאכותית, הגישה ל – Azure OpenAI מוגבלת כעת. לקוחות המעוניינים להשתמש ב- Azure OpenAI חייבים לשלוח טופס רישום הן לגישה ראשונית לניסויים, והן לאישור שוב לשימוש בייצור.
תחילת העבודה עם ניתוח תמונות ב- Azure
שירות הראייה הממוחשבת הוא שירות קוגניטיבי ב- Microsoft Azure המספק יכולות ראייה ממוחשבת מובנות מראש. השירות יכול לנתח תמונות, ולהחזיר מידע מפורט על תמונה ועל האובייקטים שהיא מתארת.
משאבי Azure עבור ראייה ממוחשבת
כדי להשתמש בשירות הראייה הממוחשבת, עליך ליצור משאב עבורו במנוי Azure שלך. באפשרותך להשתמש באחד מסוגי המשאבים הבאים:
- ראייה ממוחשבת: משאב ספציפי עבור שירות הראייה הממוחשבת. השתמש בסוג משאב זה אם אינך מתכוון להשתמש בשירותים קוגניטיביים אחרים, או אם ברצונך לעקוב אחר הניצול והעלויות עבור משאב הראייה הממוחשבת שלך בנפרד.
- שירותים קוגניטיביים: משאב שירותים קוגניטיביים כללי הכולל ראייה ממוחשבת יחד עם שירותים קוגניטיביים רבים אחרים; כגון ניתוח טקסט, טקסט מתרגם ואחרים. השתמש בסוג משאב זה אם בכוונתך להשתמש בשירותים קוגניטיביים מרובים וברצונך לפשט את הניהול והפיתוח.
לא משנה איזה סוג של משאב תבחר ליצור, הוא יספק שתי פיסות מידע שתצטרך להשתמש בהן:
- מפתח המשמש לאימות יישומי לקוח.
- נקודת קצה המספקת את כתובת ה- HTTP שבה ניתן לגשת למשאב שלך.
ניתוח תמונות באמצעות שירות ראייה ממוחשבת
לאחר שיצרת משאב מתאים במנוי שלך, באפשרותך לשלוח תמונות לשירות הראייה הממוחשבת כדי לבצע מגוון רחב של משימות אנליטיות.
תיאור תמונה
לראייה ממוחשבת יש את היכולת לנתח תמונה, להעריך את האובייקטים שזוהו, וליצור ביטוי או משפט קריא לאדם שיכול לתאר את מה שזוהה בתמונה. בהתאם לתוכן התמונה, השירות עשוי להחזיר תוצאות או ביטויים מרובים. לכל צירוף מילים שיוחזר יהיה ציון ביטחון משויך, המציין עד כמה האלגוריתם בטוח בתיאור שסופק. ביטויי הביטחון הגבוהים ביותר יופיעו ראשונים.
כדי לעזור לך להבין את הרעיון הזה, שקול את התמונה הבאה של בניין האמפייר סטייט בניו יורק. הביטויים המוחזרים מפורטים מתחת לתמונה לפי סדר הביטחון.
- תצלום שחור-לבן של עיר
- תצלום שחור-לבן של עיר גדולה
- בניין לבן גדול בעיר
תיוג תכונות חזותיות
תיאורי התמונות שנוצרו על-ידי Computer Vision מבוססים על קבוצה של אלפי אובייקטים הניתנים לזיהוי, שניתן להשתמש בהם כדי להציע תגים לתמונה. ניתן לשייך תגים אלה לתמונה כמטא-נתונים המסכמים תכונות של התמונה; ויכולה להיות שימושית במיוחד אם ברצונך ליצור אינדקס של תמונה יחד עם קבוצה של מונחי מפתח שעשויים לשמש לחיפוש תמונות עם תכונות או תוכן ספציפיים.
לדוגמה, התגים שהוחזרו עבור תמונת בניין האמפייר סטייט כוללים:
- גּוֹרֵד־שְׁחָקִים
- מגדל
- בניין
איתור אובייקטים
יכולת זיהוי האובייקטים דומה לתיוג, בכך שהשירות יכול לזהות אובייקטים נפוצים; אך במקום לתייג, או לספק תגים עבור האובייקטים המזוהים בלבד, שירות זה יכול גם להחזיר את מה שמכונה קואורדינטות תיבה תוחמת. לא רק שתקבל את סוג האובייקט, אלא גם תקבל קבוצה של קואורדינטות המציינות את החלק העליון, השמאלי, הרוחב והגובה של האובייקט שזוהה, שבהם תוכל להשתמש כדי לזהות את מיקום האובייקט בתמונה, כך:
זיהוי מותגים
תכונה זו מספקת את היכולת לזהות מותגים מסחריים. לשירות מאגר קיים של אלפי לוגואים מוכרים בעולם ממותגים מסחריים של מוצרים.
כאשר אתה קורא לשירות ומעביר לו תמונה, הוא מבצע משימת זיהוי וקובע אם אחד מהאובייקטים המזוהים בתמונה הם מותגים מזוהים. השירות משווה את המותגים מול מסד הנתונים שלו של מותגים פופולריים הכוללים ביגוד, מוצרי צריכה אלקטרוניים וקטגוריות רבות נוספות. אם מזוהה מותג ידוע, השירות מחזיר תגובה המכילה את שם המותג, ציון ביטחון (מ- 0 עד 1 המציין עד כמה חיובי הזיהוי) ותיבה תוחמת (קואורדינטות) עבור המיקום בתמונה של המותג שזוהה.
לדוגמה, בתמונה הבאה, למחשב נייד יש לוגו של Microsoft על המכסה שלו, המזוהה וממוקם על-ידי שירות הראייה הממוחשבת.
זיהוי פרצופים
שירות הראייה הממוחשבת יכול לזהות ולנתח פנים אנושיות בתמונה, כולל היכולת לקבוע גיל ומלבן תיבה תוחמת למיקום הפנים(ים). יכולות ניתוח הפנים של שירות הראייה הממוחשבת הן תת-קבוצה של אלה המסופקות על ידי שירות הפנים הייעודי. אם אתה זקוק לזיהוי וניתוח פנים בסיסיים, בשילוב עם יכולות ניתוח תמונה כלליות, תוכל להשתמש בשירות הראייה הממוחשבת; אך לניתוח פנים מקיף יותר ולפונקציונליות זיהוי פנים, השתמש בשירות Face.
סיווג תמונה לקטגוריות
ראייה ממוחשבת יכולה לסווג תמונות לפי תוכנן. השירות משתמש בהירארכיית אב/צאצא עם קבוצה מוגבלת "נוכחית" של קטגוריות. בשעת ניתוח תמונה, אובייקטים שזוהו מושווים לקטגוריות הקיימות כדי לקבוע את הדרך הטובה ביותר לספק את הסיווג. לדוגמה, אחת מקטגוריות האב היא people_. תמונה זו של אדם על הגג מוקצה קטגוריה של people_.
חלוקה לקטגוריות שונה במקצת מוחזרת עבור התמונה הבאה, המוקצית לקטגוריה people_group מכיוון שישנם מספר אנשים בתמונה:
עיין ברשימה בת 86 הקטגוריות כאן.
זיהוי תוכן ספציפי לתחום
בעת סיווג תמונה, שירות הראייה הממוחשבת תומך בשני מודלים מיוחדים של תחום:
- סלבריטאים – השירות כולל מודל שהוכשר לזהות אלפי ידוענים ידועים מעולמות הספורט, הבידור והעסקים.
- ציוני דרך – השירות יכול לזהות ציוני דרך מפורסמים, כגון הטאג ' מאהל ופסל החירות.
לדוגמה, בעת ניתוח התמונה הבאה עבור ציוני דרך, שירות הראייה הממוחשבת מזהה את מגדל אייפל, בביטחון של 99.41%.
זיהוי תווים אופטי
שירות הראייה הממוחשבת יכול להשתמש ביכולות זיהוי תווים אופטי (OCR) כדי לזהות טקסט מודפס וכתב יד בתמונות.
יכולות נוספות
בנוסף ליכולות אלה, שירות הראייה הממוחשבת יכול:
- זיהוי סוגי תמונות – לדוגמה, זיהוי תמונות אוסף תמונות או ציורי קו.
- זהה ערכות צבעים של תמונה – באופן ספציפי, זיהוי החזית, הרקע והצבעים הכוללים הדומיננטיים בתמונה.
- צור תמונות ממוזערות – יצירת גרסאות קטנות של תמונות.
- תוכן בינוני – זיהוי תמונות המכילות תוכן למבוגרים או מתארות סצנות אלימות וגורליות.
טכניקות ניתוח טקסט
ניתוח טקסט הוא תהליך שבו אלגוריתם בינה מלאכותית (AI), הפועל במחשב, מעריך את אותן תכונות בטקסט, כדי לקבוע תובנות ספציפיות.
אדם בדרך כלל יסתמך על הניסיון והידע שלו כדי להשיג את התובנות. מחשב חייב להיות מסופק עם ידע דומה כדי להיות מסוגל לבצע את המשימה. ישנן כמה טכניקות נפוצות שניתן להשתמש בהן כדי לבנות תוכנה לניתוח טקסט, כולל:
- ניתוח סטטיסטי של מונחים המשמשים בטקסט. לדוגמה, הסרת "מילות עצירה" נפוצות (מילים כמו "the" או "a", החושפות מעט מידע סמנטי על הטקסט), וביצוע ניתוח תדירות של המילים הנותרות (ספירת תדירות הופעת כל מילה) יכולים לספק רמזים לגבי הנושא העיקרי של הטקסט.
- הרחבת ניתוח התדרים לביטויים מרובי מונחים, הידועים בכינוי N-גרם (ביטוי בן שתי מילים הוא דו-גרם, ביטוי בן שלוש מילים הוא טריגרם, וכן הלאה).
- יישום אלגוריתמים של גבעול או למטיזציה כדי לנרמל מילים לפני ספירתן – למשל, כך שמילים כמו "כוח", "כוח", ו"חזק" מתפרשות כאותה מילה.
- יישום כללי מבנה לשוניים לניתוח משפטים – למשל, פירוק משפטים למבנים דמויי עץ כגון ביטוי שם עצם, שבעצמו מכיל שמות עצם, פעלים, שמות תואר וכן הלאה.
- קידוד מילים או מונחים כתכונות מספריות שניתן להשתמש בהן כדי לאמן מודל למידת מכונה. לדוגמה, כדי לסווג מסמך טקסט בהתבסס על המונחים שהוא מכיל. טכניקה זו משמשת לעתים קרובות לביצוע ניתוח סנטימנט, שבו מסמך מסווג כחיובי או שלילי.
- יצירת מודלים וקטוריים הלוכדים קשרים סמנטיים בין מילים על ידי הקצאתם למיקומים במרחב n-ממדי. טכניקת מידול זו עשויה, למשל, להקצות ערכים למילים "פרח" ו"צמח" הממקמים אותם קרוב זה לזה, בעוד ש "סקייטבורד" עשוי לקבל ערך שממקם אותו הרבה יותר רחוק.
בעוד טכניקות אלה ניתן להשתמש כדי להשפיע מאוד, תכנות אותם יכול להיות מורכב. ב- Microsoft Azure, השירות הקוגנטיבי 'שפה' יכול לעזור לפשט את פיתוח היישומים על-ידי שימוש במודלים מאומנים מראש שיכולים:
- קבע את השפה של מסמך או טקסט (לדוגמה, צרפתית או אנגלית).
- בצע ניתוח סנטימנט על טקסט כדי לקבוע סנטימנט חיובי או שלילי.
- חלץ ביטויי מפתח מטקסט שעשויים להצביע על נקודות השיחה העיקריות שלו.
- זהה וסווג ישויות בטקסט. ישויות יכולות להיות אנשים, מקומות, ארגונים או אפילו פריטים יומיומיים כגון תאריכים, שעות, כמויות וכן הלאה.
במודול זה, תחקור כמה מיכולות אלה ותבין כיצד תוכל ליישם אותן על יישומים כגון:
- מנתח פיד מדיה חברתית כדי לזהות סנטימנטים סביב קמפיין פוליטי או מוצר בשוק.
- יישום חיפוש מסמכים המחלץ ביטויי מפתח כדי לסייע בסיכום הנושא העיקרי של מסמכים בקטלוג.
- כלי לחילוץ פרטי מותג או שמות חברות ממסמכים או טקסט אחר למטרות זיהוי.
דוגמאות אלה הן רק דוגמה קטנה מהתחומים הרבים שבהם שירות השפה יכול לעזור בניתוח טקסט.
שירות השפה הוא חלק מהצעות השירותים הקוגניטיביים של Azure שיכולים לבצע עיבוד מתקדם של שפה טבעית על טקסט גולמי.
משאבי Azure עבור שירות השפה
כדי להשתמש בשירות השפה ביישום, עליך להקצות משאב מתאים במנוי Azure שלך. באפשרותך לבחור להקצות אחד מסוגי המשאבים הבאים:
- משאב שפה – בחר סוג משאב זה אם בכוונתך להשתמש רק בשירותי עיבוד שפה טבעית, או אם ברצונך לנהל את הגישה והחיוב עבור המשאב בנפרד משירותים אחרים.
- משאב שירותים קוגניטיביים – בחר סוג משאב זה אם בכוונתך להשתמש בשירות השפה בשילוב עם שירותים קוגניטיביים אחרים, וברצונך לנהל את הגישה והחיוב עבור שירותים אלה יחד.
זיהוי שפה
השתמש ביכולת זיהוי השפה של שירות השפה כדי לזהות את השפה שבה הטקסט נכתב. באפשרותך לשלוח מסמכים מרובים בו-זמנית לניתוח. עבור כל מסמך שיוגש לו, השירות יזהה:
- שם השפה (לדוגמה "אנגלית").
- קוד השפה ISO 6391 (לדוגמה, "en").
- ציון המציין רמת ביטחון בזיהוי השפה.
לדוגמה, שקול תרחיש שבו אתה הבעלים והמפעיל של מסעדה שבו לקוחות יכולים להשלים סקרים ולספק משוב על האוכל, השירות, הצוות וכן הלאה. נניח שקיבלת את הביקורות הבאות מלקוחות:
סקירה 1: "מקום פנטסטי לארוחת צהריים. המרק היה טעים. "
סקירה 2: "אוכל נהדר ושירות מעולה. "
סקירה 3: "קרוק מסייה avec frites היה נהדר. בתאבון! "
באפשרותך להשתמש ביכולות ניתוח הטקסט בשירות השפה כדי לזהות את השפה עבור כל אחת מביקורות אלה; והוא עשוי להגיב עם התוצאות הבאות:
מסמך | שם השפה | קוד ISO 6391 | הציון |
ביקורת 1 | אנגלית | ב | 1.0 |
חוות דעת 2 | ספרדית | הוא | 1.0 |
חוות דעת 3 | אנגלית | ב | 0.9 |
שים לב שהשפה שזוהתה עבור סקירה 3 היא אנגלית, למרות שהטקסט מכיל שילוב של אנגלית וצרפתית. שירות זיהוי השפה יתמקד בשפה השלטת בטקסט. השירות משתמש באלגוריתם כדי לקבוע את השפה השלטת, כגון אורך הביטויים או כמות הטקסט הכוללת עבור השפה בהשוואה לשפות אחרות בטקסט. השפה השלטת תהיה הערך המוחזר, יחד עם קוד השפה. ציון הביטחון עשוי להיות נמוך מ- 1 כתוצאה מהטקסט בשפה מעורבת.
תוכן דו-משמעי או בשפה מעורבת
ייתכן שיש טקסט שהוא דו-משמעי באופיו, או שיש בו תוכן בשפה מעורבת. מצבים אלה יכולים להוות אתגר לשירות. דוגמה לתוכן דו-משמעי תהיה מקרה שבו המסמך מכיל טקסט מוגבל, או רק סימני פיסוק. לדוגמה, שימוש בשירות כדי לנתח את הטקסט ":-)", גורם לערך של לא ידוע עבור שם השפה ומזהה השפה, וציון של NaN (המשמש לציון לא מספר).
ניתוח סנטימנטים
יכולות ניתוח הטקסט בשירות השפה יכולות להעריך טקסט ולהחזיר ציוני סנטימנט ותוויות עבור כל משפט. יכולת זו שימושית לזיהוי סנטימנטים חיוביים ושליליים במדיה החברתית, ביקורות של לקוחות, פורומים לדיונים ועוד.
באמצעות מודל הסיווג של למידת מכונה שנבנה מראש, השירות מעריך את הטקסט ומחזיר ציון סנטימנט בטווח של 0 עד 1, כאשר ערכים קרובים יותר ל-1 הם סנטימנט חיובי. ציונים הקרובים לאמצע הטווח (0.5) נחשבים ניטרליים או לא מוגדרים.
לדוגמה, ניתן לנתח את שתי ביקורות המסעדות הבאות לצורך סנטימנט:
"אכלנו אתמול בערב במסעדה הזאת והדבר הראשון ששמתי לב אליו היה כמה הצוות אדיב. קיבלו את פנינו בצורה ידידותית ונלקחנו מיד לשולחן שלנו. השולחן היה נקי, הכיסאות היו נוחים והאוכל היה מדהים. "
"חווית האוכל שלנו במסעדה הזו הייתה אחת הגרועות ביותר שהיו לי בחיים. השירות היה איטי, והאוכל היה נורא. לעולם לא אוכל שוב במפעל הזה. "
ציון הסנטימנט של הסקירה הראשונה עשוי להיות סביב 0.9, מה שמעיד על סנטימנט חיובי; בעוד שהציון של חוות הדעת השנייה עשוי להיות קרוב יותר ל-0.1, מה שמעיד על סנטימנט שלילי.
סנטימנט לא מוגדר
ציון של 0.5 עשוי להצביע על כך שהסנטימנט של הטקסט אינו מוגדר, ויכול לנבוע מטקסט שאין לו הקשר מספיק כדי להבחין ברגש או בניסוח לא מספיק. לדוגמה, רשימת מילים במשפט שאין לו מבנה, עלולה לגרום לציון לא מוגדר. דוגמה נוספת שבה ציון עשוי להיות 0.5 היא במקרה שבו נעשה שימוש בקוד שפה שגוי. קוד שפה (כגון "en" עבור אנגלית, או "fr" עבור צרפתית) משמש כדי ליידע את השירות באיזו שפה הטקסט נמצא. אם תעביר טקסט בצרפתית אך תגיד לשירות שקוד השפה הוא en לאנגלית, השירות יחזיר ציון של 0.5 בדיוק.
חילוץ ביטויי מפתח
חילוץ ביטויי מפתח הוא הרעיון של הערכת הטקסט של מסמך, או מסמכים, ולאחר מכן זיהוי נקודות השיחה העיקריות של המסמך(ים). שקול את תרחיש המסעדה שנדון קודם לכן. בהתאם לכמות הסקרים שאספת, זה יכול לקחת הרבה זמן לקרוא את הביקורות. במקום זאת, באפשרותך להשתמש ביכולות חילוץ ביטויי המפתח של שירות השפה כדי לסכם את הנקודות העיקריות.
ייתכן שתקבל חוות דעת כגון:
"אכלנו כאן ארוחת ערב לחגיגת יום הולדת והייתה לנו חוויה נהדרת. את פנינו קיבלה מארחת ידידותית ונלקחנו לשולחן שלנו מייד. האווירה הייתה רגועה, האוכל היה מדהים והשירות היה נהדר. אם אתם אוהבים אוכל נהדר ושירות קשוב, עליכם לנסות את המקום הזה. "
חילוץ ביטויי מפתח יכול לספק הקשר כלשהו לסקירה זו על-ידי חילוץ הביטויים הבאים:
- שירות קשוב
- אוכל נהדר
- חגיגת יום הולדת
- חוויה פנטסטית
- שולחן
- מארחת ידידותית
- ארוחת ערב
- אווירה
- מקום
לא רק שאתה יכול להשתמש בניתוח סנטימנט כדי לקבוע שסקירה זו חיובית, אתה יכול להשתמש בביטויי המפתח כדי לזהות אלמנטים חשובים של הסקירה.
הכרה בישות
באפשרותך לספק לשירות השפה טקסט לא מובנה והוא יחזיר רשימה של ישויות בטקסט שהוא מזהה. השירות יכול גם לספק קישורים למידע נוסף אודות ישות זו באינטרנט. ישות היא למעשה פריט מסוג מסוים או מקטגוריה מסוימת; ובמקרים מסוימים, תת-סוג, כגון אלה המוצגים בטבלה הבאה.
סוג | תת-סוג | דוגמה |
אדם | "ביל גייטס", "ג'ון" | |
מקום | "פריז", "ניו יורק" | |
ארגון | "מיקרוסופט" | |
כמות | מספר | "6" או "שש" |
כמות | אחוז | "25%" או "חמישים אחוז" |
כמות | סידוריים | "ראשון" או "ראשון" |
כמות | גיל | "בן 90 יום" או "בן 30" |
כמות | מטבע | "10.99" |
כמות | ממד | "10 מיילים", "40 ס"מ" |
כמות | טמפרטורה | "45 מעלות" |
תאריך שעה | "18:30 4 בפברואר 2012" | |
תאריך שעה | תמר | "2 במאי 2017" או "05/02/2017" |
תאריך שעה | זמן | "8 בבוקר" או "8:00" |
תאריך שעה | טווח תאריכים | "מה-2 במאי עד ה-5 במאי" |
תאריך שעה | טווח זמנים | "18:00 עד 19:00" |
תאריך שעה | משך | "דקה ו-45 שניות" |
תאריך שעה | הצית | "כל יום שלישי" |
כתובת URL | "https://www.bing.com" | |
דואר אלקטרוני | "support@microsoft.com" | |
מספר טלפון בארה"ב | "(312) 555-0176" | |
כתובת IP | "10.0.1.125" |
השירות תומך גם בקישור ישויות כדי לסייע בפירוק ישויות על-ידי קישור להפניה ספציפית. עבור ישויות מוכרות, השירות מחזיר כתובת URL עבור ערך רלוונטי בוויקיפדיה.
לדוגמה, נניח שאתה משתמש בשירות השפה כדי לזהות ישויות בתמצית ביקורת המסעדה הבאה:
"אכלתי במסעדה בסיאטל בשבוע שעבר. "
ישות | סוג | תת-סוג | כתובת האתר של ויקיפדיה |
סיאטל | מקום | https://en.wikipedia.org/wiki/Seattle | |
בשבוע שעבר | תאריך שעה | טווח תאריכים |
זיהוי דיבור
זיהוי דיבור עוסק בלקיחת המילה המדוברת והמרתה לנתונים שניתן לעבד – לעתים קרובות על ידי תמלול שלה לייצוג טקסט. המילים המדוברות יכולות להיות בצורה של קול מוקלט בקובץ שמע, או שמע חי ממיקרופון. דפוסי דיבור מנותחים בשמע כדי לקבוע דפוסים ניתנים לזיהוי הממופים למילים. כדי להשיג הישג זה, התוכנה משתמשת בדרך כלל במספר סוגים של מודלים, כולל:
- דגם אקוסטי הממיר את אות השמע לפונמות (ייצוגים של צלילים ספציפיים).
- מודל שפה הממפה פונמות למילים, בדרך כלל באמצעות אלגוריתם סטטיסטי המנבא את רצף המילים הסביר ביותר בהתבסס על הפונמות.
המילים המזוהות מומרות בדרך כלל לטקסט, שבו ניתן להשתמש למטרות שונות, כגון.
- מתן כתוביות מקודדות לכבדי שמיעה לסרטונים מוקלטים או חיים
- יצירת תמלול של שיחת טלפון או פגישה
- הכתבת הערות אוטומטית
- קביעת קלט משתמש מיועד לעיבוד נוסף
סינתזת דיבור
סינתזת דיבור היא במובנים רבים ההיפך מזיהוי דיבור. הוא עוסק בהשמעת נתונים, בדרך כלל על ידי המרת טקסט לדיבור. פתרון סינתזת דיבור דורש בדרך כלל את המידע הבא:
- הטקסט שייאמר.
- הקול שישמש להשמעת הנאום.
כדי לסנתז דיבור, המערכת בדרך כלל עושה טוקניזציה לטקסט כדי לפרק אותו למילים בודדות, ומקצה צלילים פונטיים לכל מילה. לאחר מכן הוא מפרק את התעתיק הפונטי ליחידות פרוזודיות (כגון משפטים, משפטים או משפטים) כדי ליצור פונמות שיומרו לפורמט שמע. פונמות אלה מסונתזות לאחר מכן כשמע על ידי החלת קול, אשר יקבע פרמטרים כגון גובה צליל וגוון; ויצירת צורת גל שמע שניתן להפיק לרמקול או לכתוב לקובץ.
באפשרותך להשתמש בפלט של סינתזת דיבור למטרות רבות, כולל:
- יצירת תגובות מדוברות לקלט המשתמש.
- יצירת תפריטים קוליים למערכות טלפון.
- קריאת דואר אלקטרוני או הודעות טקסט בקול רם בתרחישים של דיבורית.
- שידור תשדירים במקומות ציבוריים, כגון תחנות רכבת או שדות תעופה.
תרגום מילולי וסמנטי
ניסיונות מוקדמים לתרגום מכונה יישמו תרגומים מילוליים. תרגום מילולי הוא המקום שבו כל מילה מתורגמת למילה המתאימה בשפת היעד. גישה זו מציגה כמה סוגיות. במקרה אחד, ייתכן שלא תהיה מילה מקבילה בשפת היעד. מקרה נוסף הוא שבו תרגום מילולי יכול לשנות את משמעות הביטוי או לא לקבל את ההקשר הנכון.
לדוגמה, הביטוי הצרפתי "éteindre la lumière" יכול להיות מתורגם לאנגלית כמו "לכבות את האור". עם זאת, בצרפתית אתה יכול גם לומר "fermer la lumiere" כדי להתכוון לאותו דבר. הפועל הצרפתי fermer פירושו פשוטו כמשמעו "לסגור", ולכן תרגום מילולי המבוסס רק על המילים יציין, באנגלית, "לסגור את האור"; אשר עבור דובר אנגלית ממוצע, לא ממש הגיוני, אז כדי להיות שימושי, שירות תרגום צריך לקחת בחשבון את ההקשר הסמנטי ולהחזיר תרגום לאנגלית של "לכבות את האור".
מערכות בינה מלאכותית חייבות להיות מסוגלות להבין, לא רק את המילים, אלא גם את ההקשר הסמנטי שבו הן משמשות. בדרך זו, השירות יכול להחזיר תרגום מדויק יותר של ביטוי קלט או ביטויים. יש לקחת בחשבון את כללי הדקדוק, הפורמליים לעומת הבלתי פורמליים, ואת כללי הדיבור.
תרגום טקסט ודיבור
תרגום טקסט יכול לשמש לתרגום מסמכים משפה אחת לאחרת, לתרגום תכתובות דוא"ל המגיעות מממשלות זרות ואף לספק את היכולת לתרגם דפי אינטרנט באינטרנט. פעמים רבות תראה אפשרות תרגום עבור פוסטים באתרי מדיה חברתית, או שמנוע החיפוש של Bing יכול להציע לתרגם דפי אינטרנט שלמים המוחזרים בתוצאות החיפוש.
תרגום דיבור משמש לתרגום בין שפות מדוברות, לעתים באופן ישיר (תרגום דיבור לדיבור) ולעיתים על ידי תרגום לתבנית טקסט מתווכת (תרגום דיבור לטקסט).
תחילת העבודה עם תרגום ב- Azure
Microsoft Azure מספק שירותים קוגניטיביים התומכים בתרגום.
באופן ספציפי, באפשרותך להשתמש בשירותים הבאים:
- שירות ' מתרגם' , התומך בתרגום טקסט לטקסט.
- שירות הדיבור , המאפשר תרגום דיבור לטקסט ותרגום דיבור לדיבור.
משאבים של Azure עבור מתרגם ודיבור
לפני שתוכל להשתמש בשירותי המתרגם או הדיבור, עליך להקצות משאבים מתאימים במנוי Azure שלך.
ישנם סוגים ייעודיים של משאבי מתרגם ודיבור עבור שירותים אלה, שבהם באפשרותך להשתמש אם ברצונך לנהל את הגישה והחיוב עבור כל שירות בנפרד.
לחלופין, באפשרותך ליצור משאב שירותים קוגניטיביים המספק גישה לשני השירותים באמצעות משאב Azure יחיד, תוך איחוד חיובים ומתן אפשרות ליישומים לגשת לשני השירותים באמצעות נקודת קצה ומפתח אימות יחידים.
תרגום טקסט עם שירות המתרגם
קל לשלב את שירות המתרגם ביישומים, באתרי האינטרנט, בכלים ובפתרונות שלך. השירות משתמש במודל תרגום מכונה עצבי (NMT) לתרגום, המנתח את ההקשר הסמנטי של הטקסט ומעבד תרגום מדויק ומלא יותר כתוצאה מכך.
תמיכה בשפות שירות המתרגמים
שירות המתרגם תומך בתרגום טקסט לטקסט בין יותר מ-60 שפות. בעת השימוש בשירות, עליך לציין את השפה שממנה אתה מתרגם ואת השפה שאליה אתה מתרגם באמצעות קודי שפה ISO 639-1, כגון en עבור אנגלית, fr עבור צרפתית ו- zh עבור סינית. לחלופין, באפשרותך לציין גרסאות תרבותיות של שפות על-ידי הרחבת קוד השפה עם הקוד התרבותי המתאים 3166-1 – לדוגמה, en-US עבור אנגלית אמריקאית, en-GB עבור אנגלית בריטית, או fr-CA עבור צרפתית קנדית.
בעת שימוש בשירות 'מתרגם', באפשרותך לציין שפה אחת משפה עם שפות מרובות לשפות, מה שמאפשר לך לתרגם בו-זמנית מסמך מקור למספר שפות.
תצורות אופציונליות
ה-API של המתרגם מציע כמה תצורות אופציונליות שיעזרו לך לכוונן את התוצאות המוחזרות, כולל:
- סינון ניבולי פה. ללא כל תצורה, השירות יתרגם את טקסט הקלט, מבלי לסנן ניבולי פה. רמות ניבולי פה הן בדרך כלל ספציפיות לתרבות, אך ניתן לשלוט בתרגום גסויות על ידי סימון הטקסט המתורגם כגס או על ידי השמטתו בתוצאות.
- תרגום סלקטיבי. ניתן לתייג תוכן כך שלא יתורגם. לדוגמה, ייתכן שתרצה לתייג קוד, שם מותג או מילה/צירוף מילים שאינם הגיוניים כאשר הם מותאמים לשפות אחרות.
תרגום דיבור באמצעות שירות הדיבור
שירות הדיבור כולל את ממשקי תיכנות היישומים (API) הבאים:
- דיבור לטקסט – משמש לתמלול דיבור ממקור שמע לפורמט טקסט.
- טקסט לדיבור – משמש ליצירת שמע מדובר ממקור טקסט.
- תרגום דיבור – משמש לתרגום דיבור בשפה אחת לטקסט או דיבור בשפה אחרת.
באפשרותך להשתמש ב- API של תרגום דיבור כדי לתרגם שמע מדובר ממקור זרימה, כגון מיקרופון או קובץ שמע, ולהחזיר את התרגום כטקסט או כזרם שמע. הדבר מאפשר תרחישים כגון כתוביות מקודדות לכבדי שמיעה בזמן אמת עבור נאום או תרגום דו-כיווני סימולטני של שיחה מדוברת.
תמיכה בשפות של שירות דיבור
בדומה לשירות 'מתרגם', באפשרותך לציין שפת מקור אחת ושפת יעד אחת או יותר שאליהן יש לתרגם את המקור. ניתן לתרגם דיבור ליותר מ-60 שפות.
יש לציין את שפת המקור באמצעות תבנית קוד השפה והתרבות המורחבת, כגון es-US עבור ספרדית אמריקאית. דרישה זו מסייעת להבטיח שהמקור מובן כראוי, ומאפשרת הגייה מקומית וניבים לשוניים.
יש לציין את שפות היעד באמצעות קוד שפה בן שני תווים, כגון en עבור אנגלית או de עבור גרמנית.
אמירות
אמירה היא דוגמה למשהו שמשתמש עשוי לומר, ושהיישום שלך חייב לפרש. לדוגמה, בעת שימוש במערכת אוטומציה ביתית, משתמש עשוי להשתמש באמירות הבאות:
"הדליקו את המאוורר. "
"תדליק את האור. "
ישויות
ישות היא פריט שאליו מתייחסת אמירה. לדוגמה, מאוורר ואור באמירות הבאות:
"הדליקו את המאוורר. "
"תדליק את האור. "
ניתן לחשוב על ישויות המאוורר והאור כמופעים ספציפיים של ישות מכשיר כללית .
ניסיונות
כוונה מייצגת את המטרה, או המטרה, המובעת באמירת המשתמש. לדוגמה, עבור שתי האמירות שנחשבו בעבר, הכוונה היא להפעיל מכשיר; כך שביישום הבנת שפת השיחה שלך, תוכל להגדיר כוונת TurnOn הקשורה לאמירות אלה.
יישום הבנת שפה מגדיר מודל המורכב מכוונות וישויות. אמירות משמשות כדי לאמן את המודל לזהות את הכוונה הסבירה ביותר ואת הישויות שעליהן יש להחיל אותה על סמך קלט נתון. אפליקציית העוזרת הביתית ששקלנו עשויה לכלול כוונות מרובות, כמו הדוגמאות הבאות:
כוונה | אמירות קשורות | ישויות |
ברכה | "שלום" | |
"שם" | ||
"היי" | ||
"בוקר טוב" | ||
תפנית | "הפעל את המאוורר" | מאוורר (מכשיר) |
"להדליק את האור" | אור (מכשיר) | |
"להדליק את האור" | אור (מכשיר) | |
תפנית | "כבה את המאוורר" | מאוורר (מכשיר) |
"לכבות את האור" | אור (מכשיר) | |
"לכבות את האור" | אור (מכשיר) | |
בדוק מזג אוויר | "מה מזג האוויר להיום?" | היום (שעה) |
"תן לי את תחזית מזג האוויר" | ||
"מה התחזית לפריז?" | פריז (מיקום) | |
"איך יהיה מזג האוויר בסיאטל מחר?" | סיאטל (מיקום), מחר (datetime) | |
ללא | "מה משמעות החיים?" | |
"הדבר הזה דולק?" |
בטבלה זו ישנן אמירות רבות המשמשות לכל אחת מהתכוונות. הכוונה צריכה להיות דרך תמציתית לקבץ את משימות האמירה. מעניינת במיוחד היא כוונת "אף אחד". עליך לשקול תמיד להשתמש בכוונה 'ללא' כדי לסייע בטיפול באמירות שאינן ממפות אף אחת מהאמירות שהזנת. כוונת 'ללא' נחשבת לבסיס, ומשמשת בדרך כלל כדי לספק מענה כללי למשתמשים כאשר הבקשות שלהם אינן תואמות לשום כוונה אחרת.
לאחר הגדרת הישויות והכוונות באמצעות אמירות לדוגמה ביישום הבנת שפת השיחה שלך, באפשרותך לאמן מודל שפה לחזות כוונות וישויות מתוך קלט המשתמש – גם אם הוא אינו תואם בדיוק את אמירות הדגימה. לאחר מכן תוכל להשתמש במודל מיישום לקוח כדי לאחזר תחזיות ולהגיב בהתאם.
משאבי Azure להבנת שפות שיחה
עבור כל אחת ממשימות העריכה והחיזוי, דרוש לך משאב במנוי Azure שלך. באפשרותך להשתמש בסוגי המשאבים הבאים:
- שירות שפה: משאב המאפשר לך לבנות אאפליקציות עם יכולות מובילות בתעשייה להבנת שפה טבעית ללא מומחיות בלמידת מכונה.
- שירותים קוגניטיביים: משאב שירותים קוגניטיביים כללי הכולל הבנת שפת שיחה יחד עם שירותים קוגניטיביים רבים אחרים. באפשרותך להשתמש בסוג זה של משאב רק לחיזוי.
הפרדת המשאבים שימושית כאשר ברצונך לעקוב אחר ניצול משאבים לשימוש בשירות שפה בנפרד מיישומי לקוח המשתמשים בכל יישומי השירותים הקוגניטיביים.
כאשר יישום הלקוח שלך משתמש במשאב של Cognitive Services, באפשרותך לנהל את הגישה לכל השירותים הקוגניטיביים שבהם נעשה שימוש, כולל שירות השפה, באמצעות נקודת קצה ומפתח יחידים.
עריכה
לאחר שיצרת משאב עריכה, באפשרותך להשתמש בו כדי לחבר ולתרגל יישום של הבנת שפת שיחה על-ידי הגדרת הישויות והכוונות שהיישום שלך יחזה, כמו גם אמירות עבור כל כוונה שניתן להשתמש בה כדי לאמן את מודל החיזוי.
הבנת שפה מדוברת מספקת אוסף מקיף של תחומים שנבנו מראש הכוללים כוונות וישויות מוגדרות מראש עבור תרחישים נפוצים; שבו תוכל להשתמש כנקודת התחלה עבור המודל שלך. באפשרותך גם ליצור ישויות וכוונות משלך.
בעת יצירת ישויות וכוונות, באפשרותך לעשות זאת בכל סדר. באפשרותך ליצור כוונה, ולבחור מילים באמירות לדוגמה שתגדיר עבורה כדי ליצור עבורן ישויות; לחלופין, באפשרותך ליצור את הישויות מראש ולאחר מכן למפות אותן למילים באמירות בעת יצירת הכוונות.
באפשרותך לכתוב קוד כדי להגדיר את רכיבי המודל שלך, אך ברוב המקרים קל ביותר לחבר את המודל שלך באמצעות פורטל הבנת השפה – ממשק מבוסס אינטרנט ליצירה וניהול של יישומי הבנת שפה שיחה.
יצירת כוונות
הגדר כוונות בהתבסס על פעולות שמשתמש ירצה לבצע עם היישום שלך. עבור כל כוונה, עליך לכלול מגוון אמירות המספקות דוגמאות לאופן שבו משתמש עשוי להביע את הכוונה.
אם ניתן להחיל כוונה על ישויות מרובות, הקפד לכלול אמירות לדוגמה עבור כל ישות פוטנציאלית; ולוודא שכל ישות מזוהה באמירה.
יצירת ישויות
ישנם ארבעה סוגים של ישויות:
- נלמד על-ידי מכונה: ישויות שנלמדות על-ידי המודל שלך במהלך האימון מתוך ההקשר באמירות לדוגמה שאתה מספק.
- רשימה: ישויות המוגדרות כהירארכיה של רשימות ורשימות משנה. לדוגמה, רשימת התקנים עשויה לכלול רשימות משנה עבור אור ומאוורר. עבור כל ערך רשימה, באפשרותך לציין מילים נרדפות, כגון מנורה לאור.
- RegEx: ישויות המוגדרות כביטוי רגולרי המתאר תבנית – לדוגמה, ניתן להגדיר תבנית כגון [0-9]{3}-[0-9]{3}-[0-9]{4} עבור מספרי טלפון של הטופס 555-123-4567.
- Pattern.any: ישויות המשמשות עם תבניות להגדרת ישויות מורכבות שקשה לחלץ מאמירות לדוגמה.
אימון המודל
לאחר שהגדרת את הכוונות והישויות במודל שלך, וכללת קבוצה מתאימה של אמירות לדוגמה; השלב הבא הוא לאמן את המודל. הדרכה היא התהליך של שימוש באמירות לדוגמה שלך כדי ללמד את המודל שלך להתאים ביטויים בשפה טבעית שמשתמש עשוי לומר לכוונות ולישויות סבירות.
לאחר אימון המודל, תוכל לבחון אותו על ידי שליחת טקסט וסקירת הכוונות החזויות. הכשרה ובדיקה היא תהליך איטרטיבי. לאחר אימון המודל שלך, אתה בודק אותו עם אמירות לדוגמה כדי לראות אם הכוונות והישויות מזוהות כראוי. אם לא, בצע עדכונים, בצע אימון מחדש ובדוק שוב.
ניבוי
כאשר אתה מרוצה מתוצאות האימון והבדיקות, באפשרותך לפרסם את היישום 'הבנת שפת שיחה' במשאב חיזוי לצריכה.
יישומי לקוח יכולים להשתמש במודל על-ידי התחברות לנקודת הקצה של משאב החיזוי, תוך ציון מפתח האימות המתאים; ושלח קלט משתמש כדי לקבל כוונות וישויות חזויות. התחזיות מוחזרות ליישום הלקוח, אשר לאחר מכן יכול לנקוט פעולה מתאימה בהתבסס על הכוונה החזויה.
בינה מלאכותית לשיחות
בעוד שארגונים רבים מפרסמים מידע תמיכה ותשובות לשאלות נפוצות (שאלות נפוצות) שניתן לגשת אליהן באמצעות דפדפן אינטרנט או אפליקציה ייעודית. המורכבות של המערכות והשירותים שהם מציעים פירושה שקשה למצוא תשובות לשאלות ספציפיות. לעתים קרובות, ארגונים אלה מוצאים את אנשי התמיכה שלהם עמוסים בבקשות לעזרה באמצעות שיחות טלפון, דואר אלקטרוני, הודעות טקסט, מדיה חברתית וערוצים אחרים.
יותר ויותר ארגונים פונים לפתרונות בינה מלאכותית (AI) שעושים שימוש בסוכני AI, הידועים בכינוי bots כדי לספק קו ראשון של תמיכה אוטומטית דרך מגוון הערוצים שבהם אנו משתמשים כדי לתקשר. בוטים נועדו לקיים אינטראקציה עם משתמשים באופן שיחה, כפי שמוצג בדוגמה זו של ממשק צ'אט:
שיחות בדרך כלל לובשות צורה של הודעות שהוחלפו בתורן; ואחד הסוגים הנפוצים ביותר של חילופי שיחות הוא שאלה ואחריה תשובה. דפוס זה מהווה את הבסיס לבוטים רבים לתמיכה במשתמשים, ולעתים קרובות ניתן להתבסס עליו על תיעוד קיים של שאלות נפוצות. כדי ליישם פתרון מסוג זה, עליך:
- בסיס ידע של צמדי שאלות ותשובות – בדרך כלל עם מודל עיבוד שפה טבעית מובנה כדי לאפשר לשאלות שניתן לנסח במספר דרכים להיות מובנות באותה משמעות סמנטית.
- שירות בוט המספק ממשק למאגר הידע דרך ערוץ אחד או יותר.
תחילת העבודה עם שירות השפה ושירות הבוטים של Azure
באפשרותך ליצור בקלות פתרון Bot לתמיכה במשתמשים ב- Microsoft Azure באמצעות שילוב של שני שירותי ליבה:
- שירות שפה. שירות השפה כולל תכונת מענה על שאלות מותאמת אישית המאפשרת לך ליצור מאגר ידע של צמדי שאלות ותשובות שניתן לבצע עליהם שאילתות באמצעות קלט שפה טבעית.
הערה
יכולת התשובה לשאלה בשירות השפה היא גירסה חדשה יותר של שירות QnA Maker – שעדיין זמינה כשירות נפרד.
- Azure Bot service. שירות זה מספק מסגרת לפיתוח, פרסום וניהול של תוכניות Bot ב- Azure.
יצירת מאגר ידע מותאם אישית של שאלות העונות על מאגר הידע
האתגר הראשון ביצירת בוט לתמיכה במשתמשים הוא להשתמש בשירות השפה כדי ליצור מאגר ידע. באפשרותך להשתמש בתכונת התשובה המותאמת אישית של Language Studio כדי ליצור, להכשיר, לפרסם ולנהל בסיסי ידע.
הערה
באפשרותך לכתוב קוד כדי ליצור ולנהל מאגרי ידע באמצעות ה- API או ה- SDK של REST של שירות השפה. עם זאת, ברוב התרחישים קל יותר להשתמש בסטודיו השפה.
הקצאת משאב Azure של שירות שפה
כדי ליצור מאגר ידע, תחילה עליך להקצות משאב שירות שפה במנוי Azure שלך.
הגדרת שאלות ותשובות
לאחר הקצאת משאב שירות שפה, באפשרותך להשתמש בתכונה 'מענה על שאלות מותאמות אישית' של Language Studio כדי ליצור מאגר ידע המורכב מצמדי שאלות ותשובות. שאלות ותשובות אלה יכולות להיות:
- נוצר ממסמך שאלות נפוצות קיים או מדף אינטרנט.
- הוזן ונערך באופן ידני.
במקרים רבים, נוצר בסיס ידע באמצעות שילוב של כל הטכניקות הללו; החל ממערך נתונים בסיסי של שאלות ותשובות ממסמך שאלות נפוצות קיים והרחבת מאגר הידע עם ערכים ידניים נוספים.
ניתן להקצות לשאלות במאגר הידע ביטויים חלופיים כדי לסייע באיחוד שאלות בעלות אותה משמעות. לדוגמה, ייתכן שתכלול שאלה כגון:
מה מיקום המשרד הראשי שלך?
באפשרותך לצפות דרכים שונות שבהן ניתן לשאול שאלה זו על-ידי הוספת ביטוי חלופי כגון:
היכן ממוקם המשרד הראשי שלך?
בדוק את מאגר הידע
לאחר יצירת קבוצה של זוגות שאלות ותשובות, עליך לשמור אותה. תהליך זה מנתח את השאלות והתשובות המילוליות שלך ומיישם מודל מובנה לעיבוד שפה טבעית כדי להתאים לתשובות המתאימות לשאלות, גם כאשר הן אינן מנוסחות בדיוק כפי שצוין בהגדרות השאלות שלך. לאחר מכן תוכל להשתמש בממשק הבדיקה המוכלל בסטודיו השפה כדי לבדוק את מאגר הידע שלך על-ידי שליחת שאלות וסקירת התשובות המוחזרות.
שימוש במאגר הידע
כאשר אתה מרוצה ממאגר הידע שלך, פרוס אותו. אז אתה יכול להשתמש בו בממשק REST שלו. כדי לגשת למאגר הידע, יישומי לקוח דורשים:
- מזהה מאגר הידע
- נקודת הקצה של מאגר הידע
- מפתח ההרשאה של מאגר הידע
בניית תוכנית Bot באמצעות שירות הבוטים של Azure
לאחר שיצרת ופרסת מאגר ידע, תוכל לספק אותו למשתמשים באמצעות תוכנית Bot.
צור בוט עבור מאגר הידע שלך
באפשרותך ליצור בוט מותאם אישית באמצעות ה- SDK של Microsoft Bot Framework כדי לכתוב קוד השולט בזרימת השיחה ומשתלב עם מאגר הידע שלך. עם זאת, גישה קלה יותר היא להשתמש בפונקציונליות יצירת הבוט האוטומטית, המאפשרת לך ליצור בוט עבור מאגר הידע שנפרס ולפרסם אותו כיישום Azure Bot Service בלחיצות ספורות בלבד.
הרחבה וקביעת תצורה של תוכנית Bot
לאחר יצירת הבוט שלך, באפשרותך לנהל אותו בפורטל Azure, שבו תוכל:
- הרחב את הפונקציונליות של הבוט על-ידי הוספת קוד מותאם אישית.
- בדוק את הבוט בממשק בדיקה אינטראקטיבי.
- הגדר רישום, ניתוח ושילוב עם שירותים אחרים.
לקבלת עדכונים פשוטים, באפשרותך לערוך קוד בוט ישירות בפורטל Azure. עם זאת, להתאמה אישית מקיפה יותר, תוכל להוריד את קוד המקור ולערוך אותו באופן מקומי; פרסום מחדש של הבוט ישירות ל- Azure כשתהיה מוכן.
חיבור ערוצים
כאשר הבוט שלך מוכן למסירה למשתמשים, אתה יכול לחבר אותו למספר ערוצים; מה שמאפשר למשתמשים לקיים איתו אינטראקציה באמצעות צ'אט באינטרנט, דואר אלקטרוני, Microsoft Teams ואמצעי תקשורת נפוצים אחרים.
משתמשים יכולים לשלוח שאלות לבוט בכל אחד מהערוצים שלו, ולקבל תשובה מתאימה ממאגר הידע שעליו מבוסס הבוט.
שירות גלאי האנומליות של Azure
אנומליות הן ערכים הנמצאים מחוץ לערכים הצפויים או לטווח הערכים.
בגרפיקה המתארת את נתוני סידרת הזמן, יש אזור מוצלל בהיר המציין את הגבול, או טווח הרגישות. הקו הכחול המוצק משמש לציון הערכים שנמדדו. כאשר ערך נמדד נמצא מחוץ לגבול המוצלל, נקודה כתומה משמשת לציון הערך נחשב לאנומליה. גבול הרגישות הוא פרמטר שבאפשרותך לציין בעת התקשרות לשירות. זה מאפשר לך להתאים את הגדרות הגבול כדי לשנות את התוצאות.
זיהוי אנומליה נחשב לפעולה של זיהוי אירועים, או תצפיות, השונים באופן משמעותי משאר הנתונים המוערכים. זיהוי אנומליות מדויק מוביל לפתרון בעיות מהיר, המסייע למנוע אובדן הכנסות ולשמור על מוניטין המותג.
גלאי אנומליה הוא חלק מהקטגוריה שירותי החלטה בתוך השירותים הקוגניטיביים של Azure. זהו שירות מבוסס ענן המאפשר לך לנטר נתוני סדרות זמן, ולזהות חריגות בנתונים אלה. זה לא דורש ממך לדעת למידת מכונה. אתה יכול להשתמש ב- REST API כדי לשלב גלאי אנומליה ביישומים שלך בקלות יחסית. השירות משתמש במושג אסטרטגיה של "פרמטר אחד". הפרמטר העיקרי שאתה צריך להתאים אישית הוא "רגישות", אשר מ 1 עד 99 כדי להתאים את התוצאה כדי להתאים את התרחיש. השירות יכול לזהות אנומליות בנתוני סדרות זמן היסטוריות וגם בנתונים בזמן אמת כגון הזרמת קלט ממכשירי IoT, חיישנים או מקורות קלט זורמים אחרים.
שירות גלאי האנומליה מזהה אנומליות הקיימות מחוץ לתחום הגבול. הגבול נקבע באמצעות ערך רגישות. כברירת מחדל, הגבולות העליונים והתחתונים לזיהוי אנומליות מחושבים באמצעות מושגים הידועים כ- ExpectValue, UpperMargin ו- LowerMargin. הגבולות העליונים והתחתונים מחושבים באמצעות שלושת הערכים הללו. אם ערך חורג משני הגבולות, הוא יזוהה כאנומליה. באפשרותך להתאים את הגבולות על-ידי החלת marginScale על השוליים העליונים והתחתונים, כפי שמודגם על-ידי הנוסחה הבאה.
גבול עליון = צפויערך + (100 – שולייםScale) * upperMargin
תבנית נתונים
שירות גלאי האנומליה מקבל נתונים בפורמט JSON. באפשרותך להשתמש בכל הנתונים המספריים שהקלטת לאורך זמן. ההיבטים העיקריים של הנתונים הנשלחים כוללים את הפירוט, חותמת הזמן והערך
שנרשם עבור חותמת זמן זו. דוגמה לאובייקט JSON שאתה עשוי לשלוח ל- API מוצגת בדוגמת קוד זו. הגרעיניות מוגדרת לפי שעה ומשמשת לייצוג טמפרטורות במעלות צלזיוס שנרשמו בחותמות הזמן שצוינו.
{
"גרעיניות": "לפי שעה",
"סדרה": [
{
"חותמת זמן": "2021-03-02T01:00:00Z",
"ערך": -10.56
},
{
"חותמת זמן": "2021-03-02T02:00:00Z",
"ערך": -8.30
},
{
"חותמת זמן": "2021-03-02T03:00:00Z",
"ערך": -10.30
},
{
"חותמת זמן": "2021-03-02T04:00:00Z",
"ערך": 5.95
},
]
}
השירות יתמוך במקסימום של 8640 נקודות נתונים עם זאת, שליחת נקודות נתונים רבות כל כך באותו אובייקט JSON, עלולה לגרום להשהיה של התגובה. באפשרותך לשפר את התגובה על-ידי שבירת נקודות הנתונים שלך לגושים קטנים יותר (חלונות) ושליחתן ברצף.
אותה תבנית אובייקט JSON משמשת בתרחיש זרימה. ההבדל העיקרי הוא שתשלח ערך יחיד בכל בקשה. שיטת זיהוי הזרימה תשווה בין הערך הנוכחי שנשלח לבין הערך הקודם שנשלח.
המלצות לעקביות נתונים
אם ייתכן שהנתונים שלך כוללים ערכים חסרים ברצף, שקול את ההמלצות הבאות.
- הדגימה מתרחשת כל כמה דקות וחסרות בה פחות מ-10% ממספר הנקודות הצפוי. במקרה זה, ההשפעה צריכה להיות זניחה על תוצאות הזיהוי.
- אם חסרים לך יותר מ-10%, קיימות אפשרויות שיעזרו לך "למלא" את ערכת הנתונים. שקול להשתמש בשיטת אינטרפולציה ליניארית כדי למלא את הערכים החסרים ולהשלים את ערכת הנתונים. זה ימלא פערים עם ערכים מחולקים באופן שווה.
שירות גלאי האנומליה יספק את התוצאות הטובות ביותר אם נתוני סדרת הזמן שלך מפוזרים באופן שווה. אם הנתונים מפוזרים באופן אקראי יותר, באפשרותך להשתמש בשיטת צבירה כדי ליצור ערכת נתונים להפצה שווה יותר.
מתי להשתמש בגלאי אנומליה
שירות גלאי האנומליה תומך בעיבוד אצווה של נתוני סדרות זמן ובזיהוי אנומליה בנקודה האחרונה עבור נתונים בזמן אמת.
זיהוי אצווה
זיהוי אצווה כרוך בהחלת האלגוריתם על סדרת נתונים שלמה בו זמנית. הרעיון של נתוני סדרות זמן כרוך בהערכה של ערכת נתונים כאצווה. השתמש בסדרות הזמן שלך כדי לזהות חריגות שעשויות להתקיים בכל הנתונים שלך. פעולה זו יוצרת מודל המשתמש בכל נתוני סדרת הזמן שלך, כאשר כל נקודה מנותחת באמצעות אותו מודל.
זיהוי אצווה משמש בצורה הטובה ביותר כאשר הנתונים שלך מכילים:
- נתוני סדרות זמן מגמה שטוחות עם עליות חדות או ירידות מדי פעם
- נתוני סדרות זמן עונתיות עם חריגות מזדמנות
- עונתיות נחשבת לדפוס בנתונים שלך, המתרחש במרווחי זמן קבועים. דוגמאות לכך יהיו דפוסים שעתיים, יומיים או חודשיים. שימוש בנתונים עונתיים, וציון תקופה עבור דפוס זה, יכולים לסייע בהפחתת ההשהיה בזיהוי.
בעת שימוש במצב זיהוי אצווה, Anomaly Detector יוצר מודל סטטיסטי יחיד המבוסס על כל ערכת הנתונים שאתה מעביר לשירות. ממודל זה, כל נקודת נתונים במערך הנתונים מוערכת ומזוהות אנומליות.
דוגמה לזיהוי אצווה
חשבו על חברת תרופות שמאחסנת תרופות במתקני אחסון שבהם הטמפרטורה במתקנים צריכה להישאר בטווח מסוים. כדי להעריך אם התרופה נותרה מאוחסנת בטווח טמפרטורות בטוח בשלושת החודשים האחרונים עלינו לדעת:
- הטמפרטורה המרבית המותרת
- הטמפרטורה המינימלית המותרת
- משך הזמן המקובל לטמפרטורות להיות מחוץ לטווח הבטוח
אם אתה מעוניין להעריך תאימות על פני קריאות היסטוריות, אתה יכול לחלץ את נתוני סדרת הזמן הנדרשים, לארוז אותם לתוך אובייקט JSON, ולשלוח אותו לשירות גלאי אנומליה להערכה. לאחר מכן תהיה לך תצוגה היסטורית של קריאות הטמפרטורה לאורך זמן.
זיהוי בזמן אמת
זיהוי בזמן אמת משתמש בנתוני זרימה על-ידי השוואת נקודות נתונים שנראו בעבר לנקודת הנתונים האחרונה כדי לקבוע אם נקודת הנתונים האחרונה שלך היא אנומליה. פעולה זו יוצרת מודל באמצעות נקודות הנתונים שאתה שולח, וקובעת אם נקודת היעד (הנוכחית) היא אנומליה. על-ידי התקשרות לשירות עם כל נקודת נתונים חדשה שאתה יוצר, באפשרותך לנטר את הנתונים שלך בעת יצירתם.
דוגמה לזיהוי בזמן אמת
חשבו על תרחיש בתעשיית המשקאות המוגזים שבו זיהוי אנומליות בזמן אמת עשוי להיות שימושי. הפחמן הדו-חמצני שמתווסף למשקאות קלים במהלך תהליך הבקבוק או השימורים צריך להישאר בטווח טמפרטורות מסוים.
מערכות בקבוקים משתמשות במכשיר המכונה מצנן פחמימות כדי להשיג את הקירור של המוצר לתהליך זה. אם הטמפרטורה יורדת נמוך מדי, המוצר יקפא במקרר הקרבו. אם הטמפרטורה חמה מדי, הפחמן הדו-חמצני לא יידבק כראוי. כל אחד מהמצבים גורם לאצוות מוצר שלא ניתן למכור ללקוחות.
תרחיש זה של משקאות מוגזים הוא דוגמה למקום שבו ניתן להשתמש בזיהוי סטרימינג לקבלת החלטות בזמן אמת. זה יכול להיות קשור לתוך יישום השולט על ציוד קו בקבוק. אתה יכול להשתמש בו כדי להזין תצוגות המתארות את טמפרטורות המערכת עבור תחנת בקרת האיכות. טכנאי שירות עשוי גם להשתמש בו כדי לזהות פוטנציאל כשל בציוד וצרכי שירות.
אתה יכול להשתמש בשירות גלאי אנומליה כדי ליצור יישום ניטור המוגדר עם הקריטריונים לעיל לביצוע ניטור טמפרטורה בזמן אמת. ניתן לבצע זיהוי אנומליות באמצעות טכניקות הזרמה וזיהוי אצווה. זיהוי סטרימינג שימושי ביותר לניטור דרישות אחסון קריטיות שיש לפעול לפיהן באופן מיידי. חיישנים ינטרו את הטמפרטורה בתוך התא וישלחו קריאות אלה ליישום שלך או למרכז אירועים ב- Azure. גלאי אנומליה יעריך את נקודות הנתונים הזורמים ויקבע אם נקודה היא אנומליה.