K-Means with BigQuery ML
#
Aboutเรียนรู้การสร้าง k-means clustering ด้วย Google BigQuery ML กับข้อมูลจริงโดยใช้ SQL เหมาะสำหรับผู้ที่มีพื้นฐาน SQL มาแล้ว และต้องการต่อยอดการทำ Clustering ด้วย Algorithm พื้นฐานยอดนิยมอย่าง k-means clustering
- รู้จัก Clustering และ Use case การนำ Clustering ไปประยุกต์ใช้ในธุรกิจจริง
- เรียนรู้จากมุมมองของการปฏิบัติจริง เน้นผลลัพธ์จริง อัดแน่นไปด้วยทฤษฎีที่จำเป็นต้องรู้ เช่น
- ขั้นตอนการทำ k-means
- การตั้งโจทย์ทาง Data Science และกำหนด Features ที่จะใช้
- หลักการและทฤษฏีที่เกี่ยวข้อง เช่น Euclidean distance, Feature standardization
- Model evaluation และ Evaluation metrics พื้นฐาน
- ผู้เรียนจะได้ลงมือสร้าง Model ด้วยข้อมูลจริงจาก BigQuery public data ตั้งแต่
- การตั้งโจทย์ทางด้าน Data Science สำหรับ k-means clustering
- การเตรียมข้อมูล Training dataset
- การ Train model
- ทำความเข้าใจผลลัพธ์ของ Model ที่ได้ และ Metrics พื้นฐานทั้งหมด
- User case การลองใช้ผล Clustering ที่ได้ตัดสินใจทาง Business
- เรียนรู้ Syntax โดยอ้างอิงจาก Documentation ในรูปแบบที่เข้าใจได้ง่าย เพียงพอต่อการนำไช้งานจริง
- แทรก Tips & Tricks โดยผู้สอนที่มีประสบการณ์ทำงานจริง พร้อมแหล่งเรียนรู้เพื่อให้ผู้เรียนไปศึกษาเพิ่มเติมได้เอง
- มี Quiz และ Challenge แทรกระหว่างบทเรียนเรื่อยๆ เพื่อเช็คความเข้าใจในเนื้อหาที่เรียน
- เรียนออนไลน์ได้ไม่จำกัดเวลา มีข้อสงสัยสามารถพูดคุย/ถามผู้สอนได้ที่เพจ Noob Learning
#
Detail- Level: Beginner
- Chapters: 9
- Hours: 2.5
- Quizzes: 1
- Clips: 15
- Certification: ได้รับเมื่อเรียนจบทุกคอร์สในซีรีย์ Basic ML Crash Course
- 100% online: เรียนบน Interactive learning platform
#
Prerequisites#
InstructorManusaporn Treerungroj (Ying): แอดมินเพจ Noob Learning | Data Scientist @ FOXFOX
#
Syllabus- Introduction (10 mins)
- k-means clustering
- Application: Customer segmentation
- Application: Product groups
- Application: Product recommendation
- Case study: Youtube
- Video recommendation
- Data compressing
- Privacy preservation
- k-means clustering in a nutshell (20 mins)
- Quiz 👇
- ขั้นตอนการทำ k-means
- Steps of Machine Learning
- 🚲 London bicycle dataset (15 mins)
- Recap dataset
- Formulate โจทย์
- เตรียมข้อมูลให้พร้อม (25 mins)
- Mission
- เฉลย SQL
- Carrying out clustering (30 mins)
- CREATE MODEL
- Mission
- Model understanding
- Euclidean distance
- Random initialization
- Feature Standardization
- Cluster understanding (20 mins)
- Characterizing the clusters
- Model evaluation (15 mins)
- Cluster validation
- Davies-Bouldin index (DBI)
- Mean squared distance
- Make a Decision (10 mins)
- Use case 1
- Use case 2
- Use case 3
- 🥳 Congratulations (5 mins)
- Todo