ข้ามไปที่เนื้อหาหลัก

Big Data คืออะไร


Big Data คืออะไร

ถ้าถามว่า Big Data คงต้องบอกว่า คือ Data ทุกอย่างที่มีอยู่ในบริษัทของคุณ ไล่ตั้งแต่ข้อมูลบริษัท ที่ไม่ว่าจะเก็บอยู่ในรูปแบบไหน ไปจนถึง URLs ที่คุณ Bookmarks เอาไว้ นั้นก็ Big Data ถ้าจะบอกว่า Big Data is all around ก็คงไม่ผิดนัก เพราะมันไม่ได้จำแนกแจกจ่ายว่าต้องเป็นข้อมูลผ่านการวิเคราะห์มาแล้วหรือไม่ คือขอแค่เป็นข้อมูล ไม่ว่าจะอยู่ในรูปแบบไหน ประเภทอะไร ก็นับว่าเป็น Big Data ทั้งนั้น
ดังนั้นเราจึงกล่าวได้ว่า Big Data ก็คือข้อมูลทุกอย่างที่เรามีอยู่ในบริษัท ทั้งข้อมูลที่มีแหล่งที่มาจากภายในบริษัทเองและข้อมูลที่มาจากแหล่งที่มาภายนอกอย่าง Social medias ซึ่งทั้งหมดเป็นข้อมูลที่สามารถนำมาวิเคราะห์ได้หรือก็คือ ข้อมูลดิบ นั้นเอง ทั้งนี้ข้อมูลเหล่านี้สามารถนำมาวิเคราะห์ได้ด้วยวิธีการหลากหลายวิธีการ ขึ้นอยู่กับว่าคุณต้องการนำข้อมูลเหล่านั้นไปใช้งานด้านไหน ในปัจจุบันนิยมทำ Big Data Analysis เพื่อใช้ในการสำหรับการคาดการณ์เหตุการณ์ในอนาคต หรือ ก็คือเพื่อใช้ดูแนวโน้มสิ่งที่จะเกิดขึ้นนั้นเอง
ใหญ่แค่ไหนถึงเรียก Big Data
ถ้าจะพูดถึงขนาดของ Big Data ก็ต้องบอกว่า มันคือ Data ทุกอย่างรวมกัน –แต่ในแนวคิดปัจจุบันเห็นพ้องไปทางเดียวกัน Data ที่ถือเป็น Big Data จะไม่สามารถนำมาบริหารจัดการได้ด้วยโปรแกรมแบบเดิมๆที่เราคุ้นเคยกันอย่าง spreadsheets หรือ เครื่องมือทั่วๆไปที่มีอยู่ในระบบการจัดการฐานข้อมูล
โดยปกติแล้วนั้น การวิเคราะห์ Big Data มักจะมีการแยะข้อมูลออกเป็นหมวดหมู่เพื่อให้ข้อมูลที่มีความเกี่ยวข้องหรือเกี่ยวเนื่องอยู่รวมกัน ซึ่งนั้นหมายความว่าสำหรับ Big Data แล้วไม่จำเป็นจะต้องมีการสร้าง Sub-sets ย่อยๆของข้อมูลแต่อย่างใด เพราะมีเครื่องมือช่วยในเรื่องนี้อยู่แล้ว (สะดวกสบายไปอีกก)
คุณสมบัติของ Big data
ในขณะที่ Big data เองเกี่ยวข้องกับการรวบรวมข้อมูลขนาดใหญ่เข้าด้วยกัน เพื่อใช้ในการวิเคราะห์ข้อมูล จึงได้เกิด concept ของ Big data ขึ้นโดยใช้หลักการ 4 V คือ
1. Volume
จัดการเก็บรวบรวมข้อมูลจากหลากหลายที่ รวมถึง ข้อมูล transaction ของธรุกิจที่เกิดขึ้นทั้งหมด และ ข้อมูลใน social media ต่างๆ ซึ่งในอดีตเองการเก็บข้อมูลพวกนี้ย่อนมเป็นปัญหาใหญ่ แต่ด้วย techonology ปัจจุบันที่ชื่อ Hadoop ได้ลบข้อจำกัดนั้นทิ้งไป
2. Velocity
ด้วยชุดข้อมูลที่ส่งกันด้วยความเร็วสูง และด้วยข้อจำกัดด้านเวลา ที่ต้องรองรับการใช้งานของ user ที่ต้องการในลักษณะ near-real time
3. Variety
ความหลากหลายของข้อมูลหลายรูปแบบ ดังเช่น ตัวอักษร, ตัวเลข, email, video, audio, ข้อมูล ticker ของตลาดหุ้น และ ข้อมูลด้านการเงิน
4. Value
ข้อมูลที่เข้ามาต้องมีการตรวจสอบด้วยวิธีการบางอย่างเพื่อดึงเอาข้อมูลที่มีประโยชน์ เพื่อให้พื่นที่ที่ใช้เก็บข้อมูลสามารถใช้ได้อย่างคุ้มค่า เช่นการเก็บข้อมูลสถิติทั้งหมด กับการสุ่มเอาตัวอย่างข้อมูลเก็บไว้เท่านั้น


ความคิดเห็น

โพสต์ยอดนิยมจากบล็อกนี้

ศาสตร์เกี่ยวกับคอมพิวเตอร์

ศาสตร์เกี่ยวกับคอมพิวเตอร์ วิศวกรรมคอมพิวเตอร์ ( computer engineering) เป็นศาสตร์ที่เกี่ยวข้องกับการออกแบบและสร้างเครื่องหรือระบบคอมพิวเตอร์ และ ระบบที่ใช้คอมพิวเตอร์ ศาสตร์นี้เกี่ยวข้องกับการศึกษาทางด้านฮาร์ดแวร์ ซอฟต์แวร์ การสื่อสาร และความเกี่ยวเนื่องระหว่างเรื่องทั้งสาม หลักสูตรการเรียนมุ่งเน้นทางด้าน ทฤษฎี กฎ และ การฝึกฝนปฏิบัติของทางด้านวิศวกรรมไฟฟ้า และ คณิตศาสตร์ และวิทยาศาสตร์รวมถึงการประยุกต์เข้ากับปัญหาทางด้านการออกแบบคอมพิวเตอร์ และ อุปกรณ์ที่ใช้คอมพิวเตอร์ วิศวกรคอมพิวเตอร์ ศึกษาการออกแบบระบบฮาร์ดแวร์ดิจิทัล ซึ่งรวมถึงระบบการสื่อสาร องค์ประกอบของคอมพิวเตอร์ และอุปกรณ์ที่ประกอบด้วยคอมพิวเตอร์ วิศวกรคอมพิวเตอร์จะเรียนการพัฒนาซอฟต์แวร์ โดยมุ่งเน้นเกี่ยวกับซอฟต์แวร์สำหรับอุปกรณ์ดิจิทัล และ การสร้างส่วนต่อประสานระหว่างผู้ใช้งานซอฟต์แวร์ และ ระหว่างอุปกรณ์ต่าง ๆ รวมทั้งความรู้ทางด้านวิศวกรรมที่ดีด้วย ปัจจุบันสาขาวิชาที่สำคัญในด้านวิศวกรรมคอมพิวเตอร์คือ ระบบฝังตัว การพัฒนาอุปกรณ์ที่มีซอฟต์แวร์และฮาร์ดแวร์ฝังตัวภายใน เช่น อุปกรณ์สื่อสารอย่าง โทรศัพท์มือถือ เครื่องเล่...

คุณลักษณะของระบบสารสนเทศ TPS, MIS, DSS, EIS

คุณลักษณะของระบบสารสนเทศ TPS, MIS, DSS, EIS 1. ระบบการประมวลผลทางธุรกิจ ( Transaction Processing System : TPS)      ระบบการประมวลผลทางธุรกิจ มักเป็นการประมวลผลต่อวัน เช่น การรับ – จ่ายบิล ระบบควบคุมสินค้าคงคลัง ระบบรายรับ – จ่ายสินค้า ระบบนี้เป็นระบบสารสนเทศลำดับแรกที่ได้รับ การพัฒนาให้ใช้กับเครื่องคอมพิวเตอร์ ลักษณะเด่นของระบบ TPS   การทำให้เครื่องคอมพิวเตอร์ทำงานง่าย ไม่ยุ่งยาก ซับซ้อน ซึ่งระบบนี้เกือบทั้งหมดใช้การประมวลผลแบบออนไลน์ และสิ่งที่องค์กรจะได้รับเมื่อใช้ระบบนี้ คือ      – ลดจำนวนพนักงาน      – องค์กรจะมีการบริการที่สะดวกรวดเร็ว      – ลูกค้ามีจำนวนเพิ่มมากขึ้น 2. ระบบสารสนเทศเพื่อการจัดการ ( Management Information System : MIS)      ระบบสารสนเทศเพื่อการจัดการ คือ ระบบที่เกี่ยวข้องกับผู้บริหารที่ต้องการ การประมวลผลของเครื่องคอมพิวเตอร์ที่ให้ประโยชน์มากกว่าการช่วยงานแบบต่อวัน MIS จึงมีความสามารถในการคำนวณเปรียบเทียบข้อมูล ซึ่งมีความหมายต่อการจัดการและบ...

ISP คืออะไร

ISP ISP คืออะไร ทำหน้าที่อะไร จากที่ได้เกริ่นมาแล้วเบื้องต้นถึงหน้าที่บ้างส่วนของ ISP แล้ว หลายคนคงอยากรู้ว่า ISP คืออะไร ISP ย่อมาจากคำว่า Internet Service Provider ซึ่งเป็นหน่วยงานและองค์กรที่ให้บริการการเชื่อมต่อเครือข่ายอินเตอร์เน็ต อาทิเช่น เมื่อเราเรียกเปิดใช้งานเว็บไซต์หนึ่งเว็บไซต์ คำสั่งที่เราร้องขอจะผ่านเข้าไปยัง ISP เพื่อให้ ISP ช่วยเชื่อมต่อไปยังเว็บไซต์ที่เราต้องการ ข้อดีของการมีผู้ให้บริการอินเตอร์เน็ตหลาย ๆค่ายนั้นก็คือ จะสามารถทำให้ผู้ใช้งานอินเตอร์เน็ตในประเทศนั้นสามารถใช้อินเตอร์เน็ตได้เร็วขึ้น เพราะมีการแข่งขันด้านความเร็วนอกจากนั้นผู้ใช้งานยังสามารถใช้บริการอินเตอร์เน็ตความเร็วสูงที่ถูกลงด้วยเนื่องจากมีการแข่งขันด้านราคาและเทคโนโลยีอยู่เสมอ รูปแบบการให้บริการของ ISP เมื่อเทียบกับสมัยที่ประเทศไทยเริ่มมีอินเตอร์เน็ตใช้งานครั้งแรกเรามีเพียง ISP เพียงค่ายเดียวเท่านั้นก็คือ CAT บริษัท กสท โทรคมนาคม ซึ่งในเวลานั้นทั้งความเร็วที่มีระดับต่ำและไม่ค่อยเสถียร รวมถึงราคาในการใช้อินเตอร์เน็ตก็สูงด้วย แต่หลังจากเปิดเสรีมีบริษัทเอกชนเข้ามาแข่งขันกันทำให้ประสิทธิภาพกา...