วันพฤหัสบดีที่ 20 มกราคม พ.ศ. 2554

Class 9 Data Management (Continue) 19/1/54

Class 9 Data Management (Continue)

            วันนี้อาจารย์ศรีสมรักเริ่มสอนจากเรื่อง Data Warehouse ต่อจากครั้งที่แล้ว โดยมีเนื้อหาดังนึ้
           
            Data Warehouses  จะเป็นการดึงข้อมูลมาจาก Data Base เฉพาะหัวข้อที่เกี่ยวข้อง เพื่อนำมาใช้ในการวิเคราะห์ข้อมูล โดยมีการนำเสนอในรูปแบบต่างๆ ตามลักษณะของการใช้บริหาร เช่น Drill Downs เป็นการให้ข้อมูลในภาพรวมก่อน แต่สามารถเข้าถึงข้อมูลเชิงลึกได้ หากสนใจในหัวข้อนั้นๆ


ลักษณะของ Data Warehouse
                        Organization กรองข้อมูลจากแหล่งข้อมูล (Data Base ) เข้าไปสู่ระบบเดียวกัน โดยแบ่งข้อมูลต่างๆ ตามหัวข้อ
                        Consistency คัดกรองข้อมูลให้มีรูปแบบและอัพเดตที่ตรงกัน ป้องกันไม่ให้มีข้อมูลซ้ำซ้อน หรือผิดพลาดส่งต่อไปยังส่วนงานอื่นๆ
                        Time Variant ระยะเวลาในการจัดเก็บข้อมูล 5 – 10 ปี ทำให้สามารถวิเคราะห์ข้อมูลเป้ฯแนวโน้ม (Trend) ที่อาจจะเกิดขึ้นในอนาคตได้

Major Benefits of Data Warehouses
1. ข้อมูลที่ได้เป็นระบบ รวดเร็วและทันต่อการใช้งาน
2. ข้อมูลถูกรวบรวมไว้ในที่เดียวกันทำให้ผู้ใช้งานสามารถเข้าถึงข้อมูลได้ง่ายขึ้น

Data Warehouse Processing 
แบ่งเป็นขั้นตอนทั้งหมด 5 ขั้นตอน ดังนี้
1. รวบรวมข้อมูล – จัดเก็บข้อมูลทั้งหมดจากภายในองค์กรและ ภายนอกองค์กร
2. ทำ Meta Data- นำข้อมูลที่รวบรวมมาทั้งหมด มาสร้างเป็น Meta Data หรือ ข้อมูลของข้อมูลที่ใช้สำหรับอธิบายข้อมูลต่างๆ ที่อยู่ใน Warehouse ด้วยวิธีการ Extract
3. ทำ Data Staging - จัดระบบข้อมูล และสร้างเป็น Data Cube ซึ่งประกอบไปด้วยขั้นตอนการทำ 4 ขั้นตอน ได้แก่ Extract, Clean, Transform และ Load (ETL) 
4. สร้าง Data Warehouse นำข้อมูลมาทำ Data Warehouse โดยยึด Business Object เป็นหลัก
5. สร้าง Business View การนำเสนอข้อมูลสำหรับผู้บริหาร ในรูปแบบของ Dash Board  เพื่ออำนวยความสะดวกในการนำไปใช้ของผู้บริหาร
The Data Mart
เปรียบเสมือน Data Warehouse หน่วยย่อยของแต่ละแผนก เกิดจากการตัดแบ่งข้อมูลโดยการคัดลอกตามความต้องการของผู้ใช้ในแต่ละแผนกออกมาเป็นส่วนย่อยๆ เพื่อให้เป็น Data Mart ของแต่ละแผนกเองเหมาะสำหรับองค์กรขนาดใหญ่ที่มีแผนก หรือหน่วยงานย่อยจำนวนมาก แบ่งเป็น 2 ประเภท คือ

1. Replicated (dependent) data marts แต่ละส่วนงานก็มาแยกข้อมูลมาทำ mart เฉพาะส่วนของตนเองจาก Data warehouse ขององค์กร
2.  Stand – alone data marts ช้ในองค์กรซึ่งไม่พร้อมทำ Enterprise Data Warehouse จึงทำเฉพาะ marts ในส่วนงานพร้อมไปก่อน เมื่อแต่ละส่วนงานพร้อมแล้วค่อยเอามารวมเป็น Enterprise


Data Cube 
คือ Multidimensional Databases เพื่อให้สามารถมองภาพของข้อมูลนั้นได้หลายมิติมากขึ้น โดยมีจุดเด่น คือ สามารถตัดข้อมูลเป็นแต่ละส่วนเพื่อเลือกส่วนของข้อมูลที่ต้องการวิเคราะห์ได้ ทำให้เห็นปัญหาที่ชัดเจนขึ้น หลายมิติ หลายมุมมองมากขึ้น ซึ่งสามารถ Slice และ Dice ออกมาได้

Business Intelligence

คือ การรวมกันของโครงสร้างระบบ เครื่องมือต่างๆ ระบบฐานข้อมูลและ Application ที่ช่วยในการวิเคราะห์ข้อมูลให้มีประสิทธิภาพมากยิ่งขึ้น ประกอบไปด้วย 3 องค์ประกอบ ดังนี้
1.       Reporting and Analysis 
ส่วนออกรายงานให้แก่ผู้ใช้ ซึ่งมีตัวอย่างรูปแบบของการออกรายงานต่างๆ เช่น
Enterprise Reporting System - จัดทำรายเป็นข้อมูลที่เตรียมให้สำหรับผู้บริหารนำไปใช้ในการวิเคราะห์ต่างๆ
งานทั้งในรูปแบบปกติ และรูปแบบที่สามารถปรับแก้เองได้
Dashboards การรายงานข้อมูล Visual Display โดยแบ่งออกเป็น 3 ระดับ ได้แก่ Operation Dashboard, Tactical Dashboard และ Strategic Dashboard 
Scorecard  เป็นรายงานสำหรับผู้บริหารในระดับ strategic ป็นกระบวนการสำหรับการตรวจสอบและควบคุม โดยนำหลักมาจาก Balance Scorecard มาใช้
หมายเหตุ Balance Scorecard (BSC) การวัดผลในมุมมองต่างๆ โดยมี KPI เสมอ ตัวอย่าง KPI เป็นตัววัดผล
2.       Analytics
                กระบวนการวิเคราะห์ข้อมูลที่ได้จากแหล่งต่างๆ เช่น Business Performance Management (BPM) Online Analytical Processing (OLTP) 
3.       Data Mining
                การแยกข้อมูลเพื่อพยากรณ์แนวโน้มที่อาจจะเกิดขึ้น หรือการค้นหาข้อมูลที่เป็นประโยชน์ในอดีตในสิ่งที่เราไม่รู้ โดยทำกับบริษัทที่มี Database ขนาดใหญ่ ข้อมูลจำนวนมาก เพื่อให้เกิดประโยชน์ในการค้นหา
                โดยกระบวนการของ Mining เริ่มต้นที่ การรวบรวมข้อมูลจากที่ต่างๆ ทั้ง Warehouse และแหล่งอื่น แล้วทำ ECTL (Extract, Clean, Transform, Load) แล้วจึงวิเคราะห์และประมวลผล จากนั้นจึงแปรผลข้อมูล เพื่อให้สามารถนำไปใช้ได้ง่ายยิ่งขึ้น 

            รูปแบบของ Data Mining 
1. Clustering นำเสนอข้อมูลที่มีความสัมพันธ์กันเอง
2. Classification นำเสนอข้อมูลตามสมมติฐานรองรับ ทดสอบว่าสมมติฐานนั้นจริงหรือไม่
3. Association นำเสนอผล จากการวิเคราะห์
4. Sequence discovery นำเสนอผลที่เกิดมาตามหลัง
5. Prediction นำเสนอผลที่ใช้สำหรับการคาดการณ์ในอนาคต


วันพุธที่ 12 มกราคม พ.ศ. 2554

Class 8 อาจารย์ศรีสมรักษ์ ครั้งที่ 12/1/54

ระบบ (System) หมายถึง การนำ inputs ใส่เข้าไปใน process ทำให้เกิด output ที่มีหน้าตาตามวัตถุประสงค์ที่กำหนดไว้ตั้งแต่ต้น โดยวัตถุประสงค์ที่กำหนดจะเป็นตัวบอกว่าต้องใส่ input อะไรเข้าไปใน Process บ้าง นอกจากนี่ยังต้องมี Environment, Boundary, Control, Feedback และ Subsystem เป็นองค์ประกอบ
ระบบสารสนเทศ (Information System) หมายถึง ระบบที่ทำหน้าที่รวบรวมข้อมูลเพื่อนำมาประมวลผล วิเคราะห์ข้อมูลแล้วนำเสนอสารสนเทศให้กับผู้ที่ต้องการใช้งานรวมทั้งการจัดเก็บบันทึกข้อมูลที่นำเข้าสู่ระบบไว้เพื่อการใช้งานในอนาคต โดยระบบสารสนเทศมีลักษณะแตกต่างกันไปตามงานที่ทำเพื่อสร้างสารสนเทศสำหรับวัตถุประสงค์เฉพาะด้าน และผู้ใช้งาน เช่น AIS สำหรับงานบัญชี หรือ MKIS สำหรับการตลาด เป็นต้น  
ความแตกต่างระหว่าง Data กับ Infomation
                Data คือ ข้อเท็จจริงที่เราสนใจ
                Information คือข้อมูลที่ผ่านการวิเคราะห์ ประมวลผลแล้ว เพื่อให้อยู่ในรูปแบบที่เราต้องการ
โดยการพิจารณาว่าสิ่งที่ออกจากระบบสารสนเทศนั้นเป็น Data หรือ Information ให้ดูจากประโยชน์ที่ผู้รับได้รับ ถ้าผู้รับเห็นว่าสิ่งนั้นมีประโยชน์เราก็จะเรียกว่า output แต่ถ้าผู้รับไม่รู้สึกถึงประโยชน์ของสิ่งนั้นเราก็จะเรียกว่า Data
Data Management
 การบริหารแหล่งข้อมูลที่ถูกเก็บรวบรวมไว้ที่ศูนย์กลาง เพื่อเพิ่มประสิทธิภาพ ลดการซ้ำซ้อน และขัดแย้งกันของข้อมูลในองค์กร
ความยากของ  Data Management
-         ข้อมูลมีจำนวนมาก เพิ่มขึ้นตลอด
-         ข้อมูลกระจัดกระจายไม่ได้รวมอยู่ที่เดียวกัน
-         ข้อมูลมีความซับซ้อน
-         การจัดเก็บข้อมูลอยู่ในรูปแบบต่างกัน
-         ความปอลดภัย คุณภาพ และจริยธรรมในการใช้ข้อมูล
-         การเลือกเครื่องมือในการใช้ข้อมูล

                ขั้นตอนของ Data Management
1.       Data Profiling ข้อมูลเบื้องต้นของข้อมูลที่จัดเก็บ ได้แก่ ใครเป็นคนสร้าง ใครเป็นคนใช้ ข้อมูลเหล่านี้จัดเก็บอยู่ที่ไหน จัดเก็บอย่างไร  
2.       Data quality management  การปรับปรุงคุณภาพ พัฒนาประสิทธิภาพของข้อมูล
3.       Data integration การรวบรวมข้อมูลจากหลายแหล่งเข้าด้วยกัน
4.       Data augmentation การเพิ่มคุณค่าของข้อมูล

Data life cycle process     
                เพื่อการบริหารข้อมูลที่ดีขึ้นต้องดูการไหลเวียนของข้อมูลว่าไปที่ไหนอย่างไร
1.       New data collection จาก 3 แหล่งคือ Internal Data, External Data และ Personal Data ใส่ใน database
2.       Stored in a database เลือกข้อมูลมารวมกันที่ Data Warehouse
3.       Users access the database and take a copy of the needed data for analysis คัดลอกข้อมูลไปวิเคราะห์
4.       Use Data analysis tools or Data mining tools for analysis วิเคราะห์ข้อมูล เอาข้อมูลไปประยุกต์ใช้

ลักษณะของ Data warehouse
1.       organization มีการจดหมวดหมู่ของข้อมูลใหม่ ตามหัวข้อ
2.       consistency รูปแบบของข้อมูลสม่ำเสมอกัน
3.       time variant เก็บข้อมูลนาน 5-10 ปีเอามาวิเคราะห์แนวโน้ม
4.       non-volatile ไมมีการแก้ไขข้อมูลในอดีต
5.       relational ใช้ relational structure
6.       client/server ใช้ server ให้ผู้ใช้งานสามารถเข้าถึงข้อมูลได้ง่าย

องค์กรที่เหมาะกับData warehouse มีลักษณะดังนี้
-         มีข้อมูลจำนวนมาก
-         ข้อมูลเดียวกันถูกเก็บไว้ในหลาย format
-         ข้อมูลถูเก็บไว้ในหลายแหล่ง
-         มีลูกค้าหลากหลาย  
-         ข้อมูลเป็นปัจจัยสำคัญในการตัดสินใจทางธุรกิจ