Skip to main content

K-Means with BigQuery ML

About#

เรียนรู้การสร้าง k-means clustering ด้วย Google BigQuery ML กับข้อมูลจริงโดยใช้ SQL เหมาะสำหรับผู้ที่มีพื้นฐาน SQL มาแล้ว และต้องการต่อยอดการทำ Clustering ด้วย Algorithm พื้นฐานยอดนิยมอย่าง k-means clustering

  • รู้จัก Clustering และ Use case การนำ Clustering ไปประยุกต์ใช้ในธุรกิจจริง
  • เรียนรู้จากมุมมองของการปฏิบัติจริง เน้นผลลัพธ์จริง อัดแน่นไปด้วยทฤษฎีที่จำเป็นต้องรู้ เช่น
    • ขั้นตอนการทำ k-means
    • การตั้งโจทย์ทาง Data Science และกำหนด Features ที่จะใช้
    • หลักการและทฤษฏีที่เกี่ยวข้อง เช่น Euclidean distance, Feature standardization
    • Model evaluation และ Evaluation metrics พื้นฐาน
  • ผู้เรียนจะได้ลงมือสร้าง Model ด้วยข้อมูลจริงจาก BigQuery public data ตั้งแต่
    • การตั้งโจทย์ทางด้าน Data Science สำหรับ k-means clustering
    • การเตรียมข้อมูล Training dataset
    • การ Train model
    • ทำความเข้าใจผลลัพธ์ของ Model ที่ได้ และ Metrics พื้นฐานทั้งหมด
    • User case การลองใช้ผล Clustering ที่ได้ตัดสินใจทาง Business
  • เรียนรู้ Syntax โดยอ้างอิงจาก Documentation ในรูปแบบที่เข้าใจได้ง่าย เพียงพอต่อการนำไช้งานจริง
  • แทรก Tips & Tricks โดยผู้สอนที่มีประสบการณ์ทำงานจริง พร้อมแหล่งเรียนรู้เพื่อให้ผู้เรียนไปศึกษาเพิ่มเติมได้เอง
  • มี Quiz และ Challenge แทรกระหว่างบทเรียนเรื่อยๆ เพื่อเช็คความเข้าใจในเนื้อหาที่เรียน
  • เรียนออนไลน์ได้ไม่จำกัดเวลา มีข้อสงสัยสามารถพูดคุย/ถามผู้สอนได้ที่เพจ Noob Learning

Detail#

  • Level: Beginner
  • Chapters: 9
  • Hours: 2.5
  • Quizzes: 1
  • Clips: 15
  • Certification: ได้รับเมื่อเรียนจบทุกคอร์สในซีรีย์ Basic ML Crash Course
  • 100% online: เรียนบน Interactive learning platform

Prerequisites#

Instructor#

Manusaporn Treerungroj (Ying): แอดมินเพจ Noob Learning | Data Scientist @ FOXFOX

Syllabus#

  • Introduction (10 mins)
    • k-means clustering
    • Application: Customer segmentation
    • Application: Product groups
    • Application: Product recommendation
    • Case study: Youtube
      • Video recommendation
      • Data compressing
      • Privacy preservation
  • k-means clustering in a nutshell (20 mins)
    • Quiz​ 👇
    • ขั้นตอนการทำ k-means
    • Steps of Machine Learning
  • 🚲 London bicycle dataset (15 mins)
    • Recap dataset
    • Formulate โจทย์
  • เตรียมข้อมูลให้พร้อม (25 mins)
    • Mission
    • เฉลย SQL
  • Carrying out clustering (30 mins)
    • CREATE MODEL
    • Mission
    • Model understanding
      • Euclidean distance
      • Random initialization
      • Feature Standardization
  • Cluster understanding (20 mins)
    • Characterizing the clusters
  • Model evaluation (15 mins)
    • Cluster validation
    • Davies-Bouldin index (DBI)
    • Mean squared distance
  • Make a Decision (10 mins)
    • Use case 1
    • Use case 2
    • Use case 3
  • 🥳 Congratulations (5 mins)
    • Todo