ข้ามไปที่เนื้อหาหลัก

Big Data คืออะไร


Big Data คืออะไร

ถ้าถามว่า Big Data คงต้องบอกว่า คือ Data ทุกอย่างที่มีอยู่ในบริษัทของคุณ ไล่ตั้งแต่ข้อมูลบริษัท ที่ไม่ว่าจะเก็บอยู่ในรูปแบบไหน ไปจนถึง URLs ที่คุณ Bookmarks เอาไว้ นั้นก็ Big Data ถ้าจะบอกว่า Big Data is all around ก็คงไม่ผิดนัก เพราะมันไม่ได้จำแนกแจกจ่ายว่าต้องเป็นข้อมูลผ่านการวิเคราะห์มาแล้วหรือไม่ คือขอแค่เป็นข้อมูล ไม่ว่าจะอยู่ในรูปแบบไหน ประเภทอะไร ก็นับว่าเป็น Big Data ทั้งนั้น
ดังนั้นเราจึงกล่าวได้ว่า Big Data ก็คือข้อมูลทุกอย่างที่เรามีอยู่ในบริษัท ทั้งข้อมูลที่มีแหล่งที่มาจากภายในบริษัทเองและข้อมูลที่มาจากแหล่งที่มาภายนอกอย่าง Social medias ซึ่งทั้งหมดเป็นข้อมูลที่สามารถนำมาวิเคราะห์ได้หรือก็คือ ข้อมูลดิบ นั้นเอง ทั้งนี้ข้อมูลเหล่านี้สามารถนำมาวิเคราะห์ได้ด้วยวิธีการหลากหลายวิธีการ ขึ้นอยู่กับว่าคุณต้องการนำข้อมูลเหล่านั้นไปใช้งานด้านไหน ในปัจจุบันนิยมทำ Big Data Analysis เพื่อใช้ในการสำหรับการคาดการณ์เหตุการณ์ในอนาคต หรือ ก็คือเพื่อใช้ดูแนวโน้มสิ่งที่จะเกิดขึ้นนั้นเอง
ใหญ่แค่ไหนถึงเรียก Big Data
ถ้าจะพูดถึงขนาดของ Big Data ก็ต้องบอกว่า มันคือ Data ทุกอย่างรวมกัน –แต่ในแนวคิดปัจจุบันเห็นพ้องไปทางเดียวกัน Data ที่ถือเป็น Big Data จะไม่สามารถนำมาบริหารจัดการได้ด้วยโปรแกรมแบบเดิมๆที่เราคุ้นเคยกันอย่าง spreadsheets หรือ เครื่องมือทั่วๆไปที่มีอยู่ในระบบการจัดการฐานข้อมูล
โดยปกติแล้วนั้น การวิเคราะห์ Big Data มักจะมีการแยะข้อมูลออกเป็นหมวดหมู่เพื่อให้ข้อมูลที่มีความเกี่ยวข้องหรือเกี่ยวเนื่องอยู่รวมกัน ซึ่งนั้นหมายความว่าสำหรับ Big Data แล้วไม่จำเป็นจะต้องมีการสร้าง Sub-sets ย่อยๆของข้อมูลแต่อย่างใด เพราะมีเครื่องมือช่วยในเรื่องนี้อยู่แล้ว (สะดวกสบายไปอีกก)
คุณสมบัติของ Big data
ในขณะที่ Big data เองเกี่ยวข้องกับการรวบรวมข้อมูลขนาดใหญ่เข้าด้วยกัน เพื่อใช้ในการวิเคราะห์ข้อมูล จึงได้เกิด concept ของ Big data ขึ้นโดยใช้หลักการ 4 V คือ
1. Volume
จัดการเก็บรวบรวมข้อมูลจากหลากหลายที่ รวมถึง ข้อมูล transaction ของธรุกิจที่เกิดขึ้นทั้งหมด และ ข้อมูลใน social media ต่างๆ ซึ่งในอดีตเองการเก็บข้อมูลพวกนี้ย่อนมเป็นปัญหาใหญ่ แต่ด้วย techonology ปัจจุบันที่ชื่อ Hadoop ได้ลบข้อจำกัดนั้นทิ้งไป
2. Velocity
ด้วยชุดข้อมูลที่ส่งกันด้วยความเร็วสูง และด้วยข้อจำกัดด้านเวลา ที่ต้องรองรับการใช้งานของ user ที่ต้องการในลักษณะ near-real time
3. Variety
ความหลากหลายของข้อมูลหลายรูปแบบ ดังเช่น ตัวอักษร, ตัวเลข, email, video, audio, ข้อมูล ticker ของตลาดหุ้น และ ข้อมูลด้านการเงิน
4. Value
ข้อมูลที่เข้ามาต้องมีการตรวจสอบด้วยวิธีการบางอย่างเพื่อดึงเอาข้อมูลที่มีประโยชน์ เพื่อให้พื่นที่ที่ใช้เก็บข้อมูลสามารถใช้ได้อย่างคุ้มค่า เช่นการเก็บข้อมูลสถิติทั้งหมด กับการสุ่มเอาตัวอย่างข้อมูลเก็บไว้เท่านั้น


ความคิดเห็น

โพสต์ยอดนิยมจากบล็อกนี้

ศาสตร์เกี่ยวกับคอมพิวเตอร์

ศาสตร์เกี่ยวกับคอมพิวเตอร์ วิศวกรรมคอมพิวเตอร์ ( computer engineering) เป็นศาสตร์ที่เกี่ยวข้องกับการออกแบบและสร้างเครื่องหรือระบบคอมพิวเตอร์ และ ระบบที่ใช้คอมพิวเตอร์ ศาสตร์นี้เกี่ยวข้องกับการศึกษาทางด้านฮาร์ดแวร์ ซอฟต์แวร์ การสื่อสาร และความเกี่ยวเนื่องระหว่างเรื่องทั้งสาม หลักสูตรการเรียนมุ่งเน้นทางด้าน ทฤษฎี กฎ และ การฝึกฝนปฏิบัติของทางด้านวิศวกรรมไฟฟ้า และ คณิตศาสตร์ และวิทยาศาสตร์รวมถึงการประยุกต์เข้ากับปัญหาทางด้านการออกแบบคอมพิวเตอร์ และ อุปกรณ์ที่ใช้คอมพิวเตอร์ วิศวกรคอมพิวเตอร์ ศึกษาการออกแบบระบบฮาร์ดแวร์ดิจิทัล ซึ่งรวมถึงระบบการสื่อสาร องค์ประกอบของคอมพิวเตอร์ และอุปกรณ์ที่ประกอบด้วยคอมพิวเตอร์ วิศวกรคอมพิวเตอร์จะเรียนการพัฒนาซอฟต์แวร์ โดยมุ่งเน้นเกี่ยวกับซอฟต์แวร์สำหรับอุปกรณ์ดิจิทัล และ การสร้างส่วนต่อประสานระหว่างผู้ใช้งานซอฟต์แวร์ และ ระหว่างอุปกรณ์ต่าง ๆ รวมทั้งความรู้ทางด้านวิศวกรรมที่ดีด้วย ปัจจุบันสาขาวิชาที่สำคัญในด้านวิศวกรรมคอมพิวเตอร์คือ ระบบฝังตัว การพัฒนาอุปกรณ์ที่มีซอฟต์แวร์และฮาร์ดแวร์ฝังตัวภายใน เช่น อุปกรณ์สื่อสารอย่าง โทรศัพท์มือถือ เครื่องเล่

คุณลักษณะของระบบสารสนเทศ TPS, MIS, DSS, EIS

คุณลักษณะของระบบสารสนเทศ TPS, MIS, DSS, EIS 1. ระบบการประมวลผลทางธุรกิจ ( Transaction Processing System : TPS)      ระบบการประมวลผลทางธุรกิจ มักเป็นการประมวลผลต่อวัน เช่น การรับ – จ่ายบิล ระบบควบคุมสินค้าคงคลัง ระบบรายรับ – จ่ายสินค้า ระบบนี้เป็นระบบสารสนเทศลำดับแรกที่ได้รับ การพัฒนาให้ใช้กับเครื่องคอมพิวเตอร์ ลักษณะเด่นของระบบ TPS   การทำให้เครื่องคอมพิวเตอร์ทำงานง่าย ไม่ยุ่งยาก ซับซ้อน ซึ่งระบบนี้เกือบทั้งหมดใช้การประมวลผลแบบออนไลน์ และสิ่งที่องค์กรจะได้รับเมื่อใช้ระบบนี้ คือ      – ลดจำนวนพนักงาน      – องค์กรจะมีการบริการที่สะดวกรวดเร็ว      – ลูกค้ามีจำนวนเพิ่มมากขึ้น 2. ระบบสารสนเทศเพื่อการจัดการ ( Management Information System : MIS)      ระบบสารสนเทศเพื่อการจัดการ คือ ระบบที่เกี่ยวข้องกับผู้บริหารที่ต้องการ การประมวลผลของเครื่องคอมพิวเตอร์ที่ให้ประโยชน์มากกว่าการช่วยงานแบบต่อวัน MIS จึงมีความสามารถในการคำนวณเปรียบเทียบข้อมูล ซึ่งมีความหมายต่อการจัดการและบริหารงานเป็นอย่างมาก นอกจากนั้นระบบนี้ยังสามารถสร้างสารสนเทศที่ถูกต้องทันสมัย คุณสมบัติของระบบ MIS คือ

ระบบ SAP

       ระบบ  SAP                 SAP เป็นระบบขนาดใหญ่ที่ได้รวมเอาโซลูชั่นต่างๆ เข้ามารวมไว้ในระบบ โดยสามารถเขียนโปรแกรมให้ทำงานเฉพาะโซลูชั่นที่ต้องการได้ และหากมีหลายโซลูชั่นก็สามารถนำข้อมูลไปใช้ร่วมกันได้ จึงไม่น่าแปลกใจว่าทำไม ปัจจุบันนี้โปรแกรมเมอร์มากมายต่างหันมาสนใจ SAP กันมากขึ้น โซลูชั่นที่ SAP รองรับนั้นมีมากมาย อาทิ ระบบไฟแนนซ์ ระบบบริหารงานบุคคล ระบบลูกค้าสัมพันธ์ ระบบบัญชี ระบบสินค้าคงคลัง เป็นต้น นอกจากนี้ยังมีการนำไปประยุกต์ใช้กับระบบคนไข้ในโรงพยาบาลบางแห่ง โดยระบบงานต่างๆ ในแต่ละส่วนเหล่านี้เอง คือ ส่วนที่เรียกว่า "โมดูล" หากคุณจะเริ่มศึกษา SAP นั้นคุณจะต้องทราบก่อนว่าคุณจะศึกษาในส่วนใด และนำไปใช้กับงานลักษณะใด ซึ่ง SAP จะแบ่งระบบงานต่างๆ แยกย่อยเป็นโมดูล ซึ่งแต่ละโมดูลเป็นอิสระต่อกัน และสามารถนำเอาข้อมูลในแต่ละส่วนมาเชื่อมโยงกันได้                SAP ประกอบไปด้วยการทำงานมี 3 ลักษณะคือ Functional ,Basis ,Abap Programming จะแบ่งเป็น R3 และ Net Weaver Version - Functional คือ ลักษณะงานเป็นแบบ Consultant คือให้คำปรึกษา, วางรูปแบบการทำงาน จัดการ Process ต่า