Class 9 Data Management (Continue)
วันนี้อาจารย์ศรีสมรักเริ่มสอนจากเรื่อง Data Warehouse ต่อจากครั้งที่แล้ว โดยมีเนื้อหาดังนึ้
Data Warehouses จะเป็นการดึงข้อมูลมาจาก Data Base เฉพาะหัวข้อที่เกี่ยวข้อง เพื่อนำมาใช้ในการวิเคราะห์ข้อมูล โดยมีการนำเสนอในรูปแบบต่างๆ ตามลักษณะของการใช้บริหาร เช่น Drill Downs เป็นการให้ข้อมูลในภาพรวมก่อน แต่สามารถเข้าถึงข้อมูลเชิงลึกได้ หากสนใจในหัวข้อนั้นๆ
ลักษณะของ Data Warehouse
Organization กรองข้อมูลจากแหล่งข้อมูล (Data Base ) เข้าไปสู่ระบบเดียวกัน โดยแบ่งข้อมูลต่างๆ ตามหัวข้อ
Consistency คัดกรองข้อมูลให้มีรูปแบบและอัพเดตที่ตรงกัน ป้องกันไม่ให้มีข้อมูลซ้ำซ้อน หรือผิดพลาดส่งต่อไปยังส่วนงานอื่นๆ
Time Variant ระยะเวลาในการจัดเก็บข้อมูล 5 – 10 ปี ทำให้สามารถวิเคราะห์ข้อมูลเป้ฯแนวโน้ม (Trend) ที่อาจจะเกิดขึ้นในอนาคตได้
Major Benefits of Data Warehouses
1. ข้อมูลที่ได้เป็นระบบ รวดเร็วและทันต่อการใช้งาน
2. ข้อมูลถูกรวบรวมไว้ในที่เดียวกันทำให้ผู้ใช้งานสามารถเข้าถึงข้อมูลได้ง่ายขึ้น
Data Warehouse Processing
แบ่งเป็นขั้นตอนทั้งหมด 5 ขั้นตอน ดังนี้
1. รวบรวมข้อมูล – จัดเก็บข้อมูลทั้งหมดจากภายในองค์กรและ ภายนอกองค์กร
2. ทำ Meta Data- นำข้อมูลที่รวบรวมมาทั้งหมด มาสร้างเป็น Meta Data หรือ ข้อมูลของข้อมูลที่ใช้สำหรับอธิบายข้อมูลต่างๆ ที่อยู่ใน Warehouse ด้วยวิธีการ Extract
3. ทำ Data Staging - จัดระบบข้อมูล และสร้างเป็น Data Cube ซึ่งประกอบไปด้วยขั้นตอนการทำ 4 ขั้นตอน ได้แก่ Extract, Clean, Transform และ Load (ETL)
4. สร้าง Data Warehouse – นำข้อมูลมาทำ Data Warehouse โดยยึด Business Object เป็นหลัก
5. สร้าง Business View – การนำเสนอข้อมูลสำหรับผู้บริหาร ในรูปแบบของ Dash Board เพื่ออำนวยความสะดวกในการนำไปใช้ของผู้บริหาร
The Data Mart
เปรียบเสมือน Data Warehouse หน่วยย่อยของแต่ละแผนก เกิดจากการตัดแบ่งข้อมูลโดยการคัดลอกตามความต้องการของผู้ใช้ในแต่ละแผนกออกมาเป็นส่วนย่อยๆ เพื่อให้เป็น Data Mart ของแต่ละแผนกเองเหมาะสำหรับองค์กรขนาดใหญ่ที่มีแผนก หรือหน่วยงานย่อยจำนวนมาก แบ่งเป็น 2 ประเภท คือ
1. Replicated (dependent) data marts แต่ละส่วนงานก็มาแยกข้อมูลมาทำ mart เฉพาะส่วนของตนเองจาก Data warehouse ขององค์กร
2. Stand – alone data marts ใช้ในองค์กรซึ่งไม่พร้อมทำ Enterprise Data Warehouse จึงทำเฉพาะ marts ในส่วนงานพร้อมไปก่อน เมื่อแต่ละส่วนงานพร้อมแล้วค่อยเอามารวมเป็น Enterprise
Data Cube
คือ Multidimensional Databases เพื่อให้สามารถมองภาพของข้อมูลนั้นได้หลายมิติมากขึ้น โดยมีจุดเด่น คือ สามารถตัดข้อมูลเป็นแต่ละส่วนเพื่อเลือกส่วนของข้อมูลที่ต้องการวิเคราะห์ได้ ทำให้เห็นปัญหาที่ชัดเจนขึ้น หลายมิติ หลายมุมมองมากขึ้น ซึ่งสามารถ Slice และ Dice ออกมาได้
Business Intelligence
คือ การรวมกันของโครงสร้างระบบ เครื่องมือต่างๆ ระบบฐานข้อมูลและ Application ที่ช่วยในการวิเคราะห์ข้อมูลให้มีประสิทธิภาพมากยิ่งขึ้น ประกอบไปด้วย 3 องค์ประกอบ ดังนี้
1. Reporting and Analysis
ส่วนออกรายงานให้แก่ผู้ใช้ ซึ่งมีตัวอย่างรูปแบบของการออกรายงานต่างๆ เช่น
Enterprise Reporting System - จัดทำรายเป็นข้อมูลที่เตรียมให้สำหรับผู้บริหารนำไปใช้ในการวิเคราะห์ต่างๆ
งานทั้งในรูปแบบปกติ และรูปแบบที่สามารถปรับแก้เองได้
Dashboards การรายงานข้อมูล Visual Display โดยแบ่งออกเป็น 3 ระดับ ได้แก่ Operation Dashboard, Tactical Dashboard และ Strategic Dashboard
Scorecard เป็นรายงานสำหรับผู้บริหารในระดับ strategic ป็นกระบวนการสำหรับการตรวจสอบและควบคุม โดยนำหลักมาจาก Balance Scorecard มาใช้
หมายเหตุ Balance Scorecard (BSC) การวัดผลในมุมมองต่างๆ โดยมี KPI เสมอ ตัวอย่าง KPI เป็นตัววัดผล
2. Analytics
กระบวนการวิเคราะห์ข้อมูลที่ได้จากแหล่งต่างๆ เช่น Business Performance Management (BPM) Online Analytical Processing (OLTP)
3. Data Mining
การแยกข้อมูลเพื่อพยากรณ์แนวโน้มที่อาจจะเกิดขึ้น หรือการค้นหาข้อมูลที่เป็นประโยชน์ในอดีตในสิ่งที่เราไม่รู้ โดยทำกับบริษัทที่มี Database ขนาดใหญ่ ข้อมูลจำนวนมาก เพื่อให้เกิดประโยชน์ในการค้นหา
โดยกระบวนการของ Mining เริ่มต้นที่ การรวบรวมข้อมูลจากที่ต่างๆ ทั้ง Warehouse และแหล่งอื่น แล้วทำ ECTL (Extract, Clean, Transform, Load) แล้วจึงวิเคราะห์และประมวลผล จากนั้นจึงแปรผลข้อมูล เพื่อให้สามารถนำไปใช้ได้ง่ายยิ่งขึ้น
รูปแบบของ Data Mining
1. Clustering นำเสนอข้อมูลที่มีความสัมพันธ์กันเอง
2. Classification นำเสนอข้อมูลตามสมมติฐานรองรับ ทดสอบว่าสมมติฐานนั้นจริงหรือไม่
3. Association นำเสนอผล จากการวิเคราะห์
4. Sequence discovery นำเสนอผลที่เกิดมาตามหลัง
5. Prediction นำเสนอผลที่ใช้สำหรับการคาดการณ์ในอนาคต