About this course
This course covers methods and practices for implementing and managing enterprise-scale data analytics solutions using Microsoft Fabric. Students will build on existing analytics experience and will learn how to use Microsoft Fabric components, including lake houses, data warehouses, notebooks, dataflows, data pipelines, and semantic models, to create and deploy analytics assets.
This course is best suited for those who have the PL-300 certification or similar expertise in using Power BI for data transformation, modeling, visualization, and sharing. Also, learners should have prior experience in building and deploying data analytics solutions at the enterprise level.
Audience Profile
The primary audience for this course is data professionals with experience in data modeling, extraction, and analytics. DP-600 is designed for professionals who want to use Microsoft Fabric to create and deploy enterprise-scale data analytics solutions.
Course Outline
Module 1: Ingest Data with Dataflows Gen2 in Microsoft Fabric.
• Understand Dataflows Gen2 in Microsoft Fabric.
• Explore Dataflows Gen2 in Microsoft Fabric.
• Integrate Dataflows Gen2 and Pipelines in Microsoft Fabric.
• Exercise – Create and use a Dataflow Gen2 in Microsoft Fabric.
Module 2: Ingest data with Spark and Microsoft Fabric notebooks.
• Connect to data with Spark.
• Write data into a lakehouse.
• Consider uses for ingested data.
• Exercise – Ingest data with Spark and Microsoft Fabric notebooks.
Module 3: Use Data Factory pipelines in Microsoft Fabric.
• Understand pipelines.
• Use the Copy Data activity.
• Use pipeline templates.
• Run and monitor pipelines.
• Exercise – Ingest data with a pipeline.
Module 4: Get started with lakehouses in Microsoft Fabric.
• Explore the Microsoft Fabric Lakehouse.
• Work with Microsoft Fabric Lakehouses.
• Explore and transform data in a lakehouse.
• Exercise – Create and ingest data with a Microsoft Fabric Lakehouse.
Module 5: Organize a Fabric lakehouse using medallion architecture design.
• Describe medallion architecture.
• Implement a medallion architecture in Fabric.
• Query and report on data in your Fabric lakehouse.
• Considerations for managing your lakehouse.
• Exercise – Organize your Fabric lakehouse using a medallion architecture.
Module 6: Use Apache Spark in Microsoft Fabric.
• Prepare to use Apache Spark.
• Run Spark code.
• Work with data in a Spark dataframe.
• Work with data using Spark SQL.
• Visualize data in a Spark notebook.
• Exercise – Analyze data with Apache Spark.
Module 7: Work with Delta Lake tables in Microsoft Fabric.
• Understand Delta Lake.
• Create delta tables.
• Work with delta tables in Spark.
• Use delta tables with streaming data.
• Exercise – Use delta tables in Apache Spark.
Module 8: Get started with data warehouses in Microsoft Fabric.
• Understand data warehouse fundamentals.
• Understand data warehouses in Fabric.
• Query and transform data.
• Prepare data for analysis and reporting.
• Secure and monitor your data warehouse.
• Exercise – Analyze data in a data warehouse.
Module 9: Load data into a Microsoft Fabric data warehouse.
• Explore data load strategies.
• Use data pipelines to load a warehouse.
• Load data using T-SQL.
• Load and transform data with Dataflow Gen2.
• Exercise: Load data into a warehouse in Microsoft Fbric.
Module 10: Query a data warehouse in Microsoft Fabric.
• Use the SQL query editor.
• Explore the visual query editor.
• Use client tools to query a warehouse.
• Exercise: Query a data warehouse in Microsoft Fabric.
Module 11: Monitor a Microsoft Fabric data warehouse.
• Monitor capacity metrics.
• Monitor current activity.
• Monitor queries.
• Exercise – Monitor a data warehouse in Microsoft Fabric.
Module 12: Understand scalability in Power BI.
• Describe the significance of scalable models.
• Implement Power BI data modeling best practices.
• Configure large datasets.
• Exercise: Create a star schema model.
Module 13: Create Power BI model relationships.
• Understand model relationships.
• Set up relationships.
• Use DAX relationship functions.
• Understand relationship evaluation.
• Exercise: Work with model relationships.
Module 14: Use tools to optimize Power BI performance.
• Use Performance analyzer.
• Troubleshoot DAX performance by using DAX Studio.
• Optimize a data model by using Best Practice Analyzer.
• Exercise: Use tools to optimize Power BI performance.
Module 15: Enforce Power BI model security.
• Restrict access to Power BI model data.
• Restrict access to Power BI model objects.
• Apply good modeling practices.
• Exercise: Enforce model security.
אנו חיים בעידן של מידע (DATA), ומי שיודע לאסוף את המידע ולנתח אותו יכול להפיק מכך ערך רב.
לכל חברה יש את הדאטה שלה, הנובע מתוך הפעילות שלה ו/או רלוונטי עבורה אך מגיע ממקורות חיצוניים. ולכן ישנו ביקוש רב לאנשי DATA היודעים לעבוד עם מערכות Data Platform.
היתרונות של Data Platform
ל-Data Platform יתרונות רבים הכוללים:
ניהול משופר של מידע – המערכת מאפשרת לנהל כמויות של מידע בצורה מרוכזת, ומעניקה שליטה על המידע, איכות ועקביות המאפשרים לארגון לעשות שימוש טוב יותר בנכסי המידע.
שיפור קבלת ההחלטות – שילוב הכלים האנליטיים והפקת דוחות מאפשר לארגון לקבל החלטות המבוססות על מידע. כך הארגון יכול להגיב מהר יותר לשינויים בשוק והצרכים של הלקוחות.
שיפור היעילות – ארגונים משקיעים משאבים רבים בהתמודדות עם המידע. Data Platform מאפשרת לייעל את התהליך ולהישען על אוטומציה. זה חוסך בזמן עבודה ואף מקטין טעויות.
מידע בזמן אמת – היכולת לעבד מידע ולנתח אותו בזמן אמת מעניקה לארגון יתרון עצום, ומאפשרת להגיב ולפעול לפני המתחרים.
גמישות – לכל ארגון צרכים אחרים ושונים. ואחד היתרונות של המערכת הוא הגמישות הגדולה. Data Platform מעניקה כלים רבים, היכולים להתאים למגוון של צרכים.
סוגי Data Platform
ניתן לסווג את פלטפורמות הדאטה לכמה סוגים :
מחסני נתונים (Data warehouses) – מערכות שעיקר יעודן הוא אחסון נתונים מובנים בפורמט מאורגן המאפשר שאילתות מהירות.
אגמי נתונים (Data lakes) – פלטפורמות המאפשרות לאחסן נתונים גולמיים, מובנים או לא מובנים. אלו מתאימים עבור למידת מכונה.
פלטפורמות ענן (Cloud-based data platforms) – פלטפורמות היושבות על ענן, וכך יכולות להעניק לארגון מדרגיות (scalability), גמישות, יעילות ועלות משתלמת. למשל שירותי Microsoft Azure הם דוגמה לפלטפורמת דאטה בענן.
מערכות היברידיות (Hybrid data platforms) – פלטפורמות דאטה המשלבות סביבה מקומית סביבת הענן. בדרך כלל מערכות שכאלו נדרשות כאשר ישנן דרישות רגולטוריות לגבי המידע.
מערכות בזמן אמת – מערכות המעבדות מידע בזמן אמת ומגיבות. למשל בנקים וחברות אשראי זקוקות למערכות שכאלו על מנת למנוע הונאות ולאפשר פעולות בנקאיות.
אחסון ועיבוד מידע ב-Data Platform
אחסון ועיבוד מידע הוא עולם ומלואו של כלים העונים על צרכים שונים של הארגון והם כוללים: שליטה וניהול המידע, איכות המידע, אבטחה ופרטיות, המחשה, שיתוף ואוטומציה.
למשל שליטה על מחזור החיים של המידע עד למחיקתו. כלים לזיהוי טעויות ואבטחת דיוק במידע, כלים המאפשרים להמחיש את התובנות של המידע ועוד.
שאלות על Data Platform
מה זה Data Platform?
Data Platform היא מערכת מאוחדת המאפשרת לטפל ולנתח בצורה יעילה כמויות נתונים גדולים. זוהי מערכת רב רכיבית המאפשרת לטיפל בנתונים מובנים ולא מובנים, ולהפוך את המידע לנגיש עבור אפליקציות שונות.
איך לבחור קורס Data Platform?
מומלץ לבחור קורס המותאם אישית לצרכים הארגונים, ומועבר על ידי מרצים בעלי ניסיון מעשי בתחום.