นักวิทยาศาสตร์ข้อมูล (Data Scientist)
dsst-300x151

ทำไมเราต้องการ Data Science ทั้งๆที่มี Statistics อยู่แล้วนี่??

ตอนที่ 1: Data Science VS. Data Analysis

หลายคนยังคงสงสัยอยู่ว่า Data Science มันต่างจากศาสตร์อื่นๆอย่างไร ดูไปดูมา ก็ไม่ต่างจากศาสตร์เดิมๆที่มีอยู่แล้ว วันนี้ เลยเอาบทความจาก The Wall Street Journal (WSJ) มาเล่าให้ฟังกันว่า Data Science VS. Data Analysis มันต่างกันไง??

Data Science (ขอเรียกสั่นๆ ว่า DS) คือการศึกษาที่อย่างมีระบบเพื่อสกัดความรู้ที่สำคัญออกจากข้อมูล (Knowledge Extraction) แต่ Data Analysis (ขอเรียกสั่นๆ ว่า DA) คือการใช้สถิติ (Statistic) และวิธีการต่างๆกับข้อมูล

ความแตกต่างระหว่าง การอธิบาย (Explaination) และการทำนาย (Prediction)
โดยปกติ DA ถูกใช้เพื่ออธิบายเหตุการณ์ที่เกิดขึ้นโดยการสกัดรูปแบบที่น่าสนใจ (Pattern Extraction) จากชุดข้อมูลเดี่ยวๆ (Individual Data Set) ด้วยการดึงข้อมูล (Query) ที่กำหนดไว้อย่างดีแล้ว ในทางกลับกัน DS มีเป้าหมายเพื่อค้นหาและสกัดความรู้ที่ใช้ได้จริง (Actionable Knowledge) จากข้อมูล ที่สามารถนำมาใช้ในการตัดสินใจและทำนาย — ไม่ใช่เพียงแค่อธิบายว่าเกิดขึ้นได้ไง

ข้อมูลดิบสำหรับ DS ก็ไม่ใช่ชุดข้อมูลเดี่ยวเหมือนกับ DA DS สามารถดึงข้อมูลมาใช้ได้หมดไม่ว่าจะมีขนาดใหญ่ หรือ ความหลากหลายเท่าใด หรือแม้กระทั่งข้อมูลที่ไร้โครงสร้าง (Unstructured data set) เช่น ข้อความ (Text), รูปภาพ, วิดีโอ ยิ่งไปกว่านั้น Data Scientist จะไม่วิเคราะห์ข้อมูลอย่างง่ายๆ แต่พวกเขาจะมองข้อมูลเหล่านั้นด้วยหลากหลายมุมมอง เพื่อที่จะเข้าใจข้อมูลได้อย่างถ่องแท้

ปัญหาหนึ่งที่พบเจอบ่อยๆ ของการสกัดข้อมูลเชิงลึกแบบนี้ คือ ข้อมูลเหล่านั้นถูกเก็บแยกกระจัดกระจายไว้ในหลายๆส่วนขององค์กร DS จึงต้องสร้าง Data Platform และ Tool ต่างๆเพื่อเชื่อมโยงข้อมูลเหล่านั้น ให้ง่ายต่อการใช้งาน ต่างจากการดึงข้อมูลจากฐานข้อมูล (Database query) ของ DA ที่จะพยายามหาข้อมูลที่ตรงกับรูปแบบ (หรือ query) หรือ หารูปแบบที่เหมาะสมและตรงกับข้อมูลที่ต้องการเท่านั้นเอง

ในตอนต่อไปเราจะมาอธิบายต่อว่า แล้วทักษะอะไรบ้างล่ะที่ Data Scientist ต้องมี คอยติดตามกันนะคะ

Patanamon Thongtanunam

Patanamon Thongtanunam

I'm learning to be a data scientist.I have a knowledge of statistical analysis using R, data visualization using d3.js. I'm enthusiastically learning various techniques for data science and looking forward to meet and talk with the data science lovers.
Patanamon Thongtanunam
Loading Facebook Comments ...

Leave a Reply  • Xith says:

    ขอบคุณสำหรับข้อมูลดีดีครับ