comp:computer

2.3 ข้อมูล (Data)
- 2.3.1 ข้อมูลและ การประมวลผล
- การเข้ารหัสตัวเลข

2.3 ข้อมูล (Data)

ข้อมูลคือสิ่งที่ผู้ใช้สนใจ ซึ่งขึ้นอยูกับการประยุกต์ใช้งานคอมพิวเตอร์ ในธุรกิจการค้าข้อมูลการขายสินค้านับเป็นหัวใจหลัก เช่น จำนวนสินค้าที่ขายได้ในแต่ละครั้ง ราคาที่ขาย ในธุรกิจก่อสร้าง มีสิ่งสำคัญในการควบคุมงาน อาทิเช่น จำนวนคนงาน ปริมาณวัสดุที่ใช้ในแต่ละวัน รวมไปถึงแผนการทำงาน ในโรงงานอุตสาหกรรม ความต้องการรู้เกี่ยวกับกำลังการผลิต ปริมาณวัสดุที่ต้องใช้ และจำนวนของเสีย เป็นต้น ข้อมูลเหล่านี้จะต้องเก็บรวบรวมโดยขบวนการอัตโนมัติ หรือการจดบันทึก และข้อมูลจะถูกนำมาประมวลผล เช่น สรุปยอดรายวัน รายเดือน เป็นสารสนเทศ เพื่อประโยชน์ในการตัดสินใจในการทำงาน ทั้งนี้ ข้อมูลต้องมีความถูกต้อง ครบถ้วน จึงจะได้สารสนเทศที่มีประโยชน์ อีกทั้งต้องสรุปข้อมูลได้ภายในเวลาที่เหมาะสม ทั้งนี้ การประมวลผลข้อมูลอาจทำได้เองโดยผู้ใช้ข้อมูล แต่เมื่อปริมาณของข้อมูลมีจำนวนมากขึ้นการประมวลผลด้วยเครื่องมือทางอิเล็กทรอนิกส์ เช่น คอมพิวเตอร์ จะสามารถทำได้อย่างรวดเร็ว และถูกต้อง แม่นยำ

คอมพิวเตอร์ จะให้สารสนเทศจากการจำลองระบบ โดยผู้ใช้ต้องสร้างแบบจำลอง และทดลองเปลี่ยนข้อมูลต่างๆ เพื่อดูข้อมูล ผลของการจำลองระบบ เช่น การจำลองโครงสร้างอาคาร ทดลองเปลี่ยนโครงสร้าง และหาความสามารถในการรับน้ำหนักของโครงสร้าง การจำลองการทำงานของเครื่องยนต์ หาค่าความเค้นของชิ้นส่วนต่างๆ การจำลองวงจรไฟฟ้า เพื่อหาคุณลักษณะของสัญญาณไฟฟ้าที่จุดต่างๆในวงจร เป็นต้น

คอมพิวเตอร์ เป็นเครื่องมือในการบันทึกข้อมูล เช่นการใช้บันทึกเอกสาร เนื่องจากสามารถ แก้ไขได้โดยง่าย และสามารถทำสำเนาได้โดยแทบจะไม่มีค่าใช้จ่าย การสืบค้นข้อมูลที่จัดเก็บทำได้โดยสะดวก ชุดข้อมูลต่าง ๆ เหล่านี้ ยังถูกเผยแพร่โดยอาศัยระบบเครื่องข่ายคอมพิวเตอร์ เช่น ในระบบ Internet มีการสร้าง Web site จำนวนมาก เพื่อเผยแพร่ข้อมูลทั้งที่เป็นทางการ และไม่เป็นทางการ

2.3.1 ข้อมูลและ การประมวลผล

ความจริงแล้ว คอมพิวเตอร์ไม่สามารถเข้าใจสิ่งใดๆ ได้ด้วยตนเอง สิ่งที่ทำได้คือ ทำตามคำสั่งที่ได้ถูกโปรแกรมไว้ คอมพิวเตอร์ทำงานโดยอาศัยความแตกต่างของสถานะทางกายภาพ 2 สถานะ ที่เกิดจากกระแสไฟฟ้าขั้วแม่เหล็ก หรือการสะท้อนของแสงเท่านั้น อาจกล่าวได้ว่าสิ่งที่คอมพิวเตอร์เข้าใจได้ คือ สถานการณ์เปิด/ปิดของสวิทช์ เท่านั้น

ฉะนั้นคำว่าข้อมูล (Data) จึงหมายถึงสถานะเปิด/ปิด (0/1) ที่ได้ถูกจัดกลุ่ม คอมพิวเตอร์จะนำข้อมูลดังกล่าวมาจัดรูปแบบใหม่ให้ได้เป็นสิ่งที่เรียกว่า สารสนเทศ (Information) ซึ่งจะเป็นผลที่ได้จากการประมวลผลข้อมูลโดยโปรแกรม เพื่อให้สามารถสื่อสารความหมายบางอย่างได้ดีขึ้นมากกว่า ข้อมูลที่ยังไม่ได้ผ่านการประมวลผล เช่น ข้อมูลเป็นตัวอักษรบนหน้ากระดาษ แต่ถ้าได้ประมวลผลให้เป็นสารสนเทศ ในรูปของรายงาน ตาราง หรือกราฟ ก็จะสามารถสื่อสารความหมายบางอย่างได้ดีขึ้น (ดู รูปที่ 36) ทั้งนี้ขึ้นอยู่กับผู้ใช้

การแทนข้อมูลในคอมพิวเตอร์

สถานะของสวิทช์อิเล็กทรอนิกส์เล็กๆ ภายในคอมพิวเตอร์นั้นจะถูกแทนด้วยตัวเลข เนื่องจากสวิทช์มีแค่ 2 สถานะ คือ ปิดและเปิด ตัวเลขที่ใช้แทนสถานะของสวิทช์ก็จะมี 2 ตัว เช่นเดียวกัน คือ 0 และ 1 ระบบตัวเลขที่มีการใช้ตัวเลขเพียง 2 ตัวนี้ เรียกว่า Binary system ถ้าต้องการแทนตัวเลขที่มีค่ามากกว่า 1 ก็จะต้องใช้ตัวเลข 2 ตัว

ตัวเลขฐาน 10	ตัวเลขฐาน 2
0	0
1	1
2	10
3	11
4	100
5	101
6	110
7	111
8	1000
9	1001
10	1010

สำหรับข้อมูลประเภทอื่นๆ ไม่ว่าจะเป็น ข้อมูลตัวอักษร, ข้อมูลรูปภาพ หรือแม้กระทั่งคำสั่งในโปรแกรมคอมพิวเตอร์ ก็จะถูกแทนด้วยเลข 0 และ 1 นี้ เช่นเดียวกัน ตัวอักษรที่เราเห็นบนจอภาพคอมพิวเตอร์นั้นเป็นเพียงวิธีการที่คอมพิวเตอร์ใช้สัญลักษณ์แทนตัวเลขเท่านั้น

เมื่อพูดถึงข้อมูลคอมพิวเตอร์แล้ว สวิทช์แต่ละตัวที่ใช้แทนสถานะเปิด/ปิด 1 ตัวนั้นเรียกว่า บิต (bit) ดังนั้น bit จึงเป็นหน่วยที่เล็กที่สุดของข้อมูลในคอมพิวเตอร์หน่วยที่ใหญ่ขึ้นของบิต คือ กลุ่มของบิตจำนวน 8 บิต เรียกว่าไบต์ (byte) และด้วยจำนวน 8 บิตหรือ 1 ไบต์นี้เองที่ทำให้คอมพิวเตอร์สามารถแทนค่าของตัวเลขได้ 256 ค่าด้วยกัน คือ 0 ถึง 255 (ซึ่งก็คือ 0 ถึง 28 ) และตัวจำนวนบิตขนาด 8 บิตนี้สามารถใช้แทนตัวอักษรต่างๆ ที่ใช้ในชีวิตประจำวันได้ค่อนข้างครบถ้วน

การเข้ารหัสตัวเลข

ตัวเลขในคอมพิวเตอร์สามารถแทนได้หลายวิธี ขึ้นอยู่กับรูปแบบตัวเลขที่ต้องการใช้งาน ตัวเลขจำนวนเต็มสามารถแทนได้ด้วยเลขฐานสองโดยตรง โดยกำหนดจำนวนบิตที่ใช้ซึ่งปกติ CPU จะออกแบบ ให้มีจำนวนบิตในตัว CPU เป็น 8 บิต หรือ 16 บิต และออกแบบวงจรการคำนวณให้ใช้กับตัวเลขแบบ 8 บิต หรือ 16 บิต เนื่องจากจะสามารถคำนวณได้เร็ว สำหรับเลขจำนวนเต็มน้อยๆ ก็แทนด้วย เลข 8 บิต (0-256) ถ้ามากกว่านั้นก็ใช้เลข 16 บิต (0-65536) ในกรณีที่ต้องการตัวเลขลบ เช่น -1 วิธีหนึ่ง คือใช้บิตหน้า เป็น บิตเครื่องหมาย เช่น สำหรับ 8 บิต ให้บิตที่ 8 แทนเครื่องหมายโดยให้ 0 เป็นบวก และ 1 เป็นลบ ที่เหลือ 7 บิตจะได้เลข 0 – 127 (จะได้ เลข ศูนย์ 2 ตัว เป็น ศูนย์บวก และ ศูนย์ลบ ซึ่งเป็นเลขฐานสองที่ไม่เท่ากัน) ตัวเลขลบอาจจะใช้วิธีที่เรียกว่า two complement แทนก็ได้

ตัวเลขในระบบฐาน 10 อาจแทนด้วยเลขฐาน 2 ในแต่ละหลัก เช่น 12 แทนด้วยเลขฐาน 2 ขนาด 4 บิตสองตัวคือ 0001 0010 ก็ได้ วิธีการนี้ เรียก Binary Coded Decimal ที่ใช้ 4 บิตต่อ 1 ตัวเพราะต้องการแทนตัวเลข 0-9 ทั้งนี้ การบวก/ลบเลข ต้องใช้การคำนวณพิเศษกว่า บวก/ลบ เลขฐาน 2 โดยตรง เนื่องจากหลักการในการทดข้ามหลักไม่เหมือนกัน

ตัวเลขจุดทศนิยมมีการแทนค่าได้หลายวิธีเช่นกัน วิธีหนึ่งเรียกว่า IEEE floting point (IEEE754) เป็นมาตรฐานที่นิยมโดยจะอยู่ในรูปของเลขฐาน 2 จำนวน 32 บิต บิตที่ 31 เป็นเครื่องหมาย บิตที่ 30-23 (8 บิต) เป็นส่วน Exponent หรือส่วนของ 10 ยกกำลัง (โดยค่า 127 หมายถึง 0 ดังนั้น 8 บิตจะแทนค่าได้จาก -127 ถึง 128) ส่วนสุดท้าย บิตที่ 22 ถึงบิตที่ 0 เป็นส่วนของตัวเลข

รหัสตัวอักษร (Text Codes)

รหัสตัวอักษร คือ ค่าตัวเลขที่ใช้แทนอักขระต่างๆ มาตรฐานหลักๆ ที่ใช้ในปัจจุบัน คือ รหัส ASCII และ รหัส UNICODE

ASCII (American Standard Code for Information Interchange) เป็นรหัสที่ใช้ในคอมพิวเตอร์อย่างกว้างขวาง เป็นรหัสที่ใช้เลขฐานสองขนาด 7 บิตจึงแทนค่าตัวอักขระได้ 127 ตัว (27 ตัว)

จะเห็นว่า การเข้ารหัสแบบ ASCII จะใช้ได้เฉพาะตัวหนังสือภาษาอังกฤษเท่านั้น ต่อมาได้มีการออกแบบใช้รหัส 8 บิตในการเข้ารหัสตัวหนังสือโดยใช้ 127 ตัวแรกตรงกับ ASCII และส่วนที่เพิ่มขึ้นมา แทนตัวอักษรของภาษากลุ่มต่างๆ เช่น ภาษาไทย เป็นต้นสำหรับภาษาไทย ใช้รหัส สมอ 620 (สำนักงานมาตราฐานอุตสาหกรรม)หรือ ISO-8859-11, TIS-620, CP874, MacThai เป็นการใช้ตารางรหัส ASCII ในส่วนที่ไม่ได้กำหนด แต่ก็จะแสดงตัวอักษรได้ 2 ภาษาเท่านั้น

มาตรฐาน UNICODE หรือเรียกว่า Unicode Worldwide Character Standard ใช้ขนาดตัวเลขฐานสองขนาด 16 บิต จึงแทนอักขระได้ 216 ตัวหรือ 65536 ตัว ทำให้สามารถแทนตัวอักษรในภาษาอื่นๆ นอกจากตัวอักษรในภาษาอังกฤษ ซึ่งทำให้ระบบที่ใช้ UNICODE สามารถแสดงผลหลายภาษาพร้อมกันได้

ข้อมูลภาพ

ในคอมพิวเตอร์ จะมองเป็นชุดของตัวเลข โดยตัวเลขจะแทนค่าความสว่าง และ สี ณ.จุดหนึ่งๆ เช่น ภาพขนาด 10 x 10 จะประกอบด้วยจุด 100 จุด แต่ละจุดแทนด้วยตัวเลข 1 บิต ที่เป็นสีดำหรือสีขาว เป็นต้น(รูปที่ 37) สำหรับภาพสี 1 จุด อาจแทนด้วย 8 บิต 3 ตัว เพื่อแทนค่าความสว่างของชุดแม่สี แดง น้ำเงิน และเหลือง เป็นต้น แต่ทั้งนี้ การจัดเก็บข้อมูลชุดนี้ ต้องเก็บขนาดของภาพไว้กับข้อมูลตัวเลขจุดข้อมูลด้วย ได้มีการตั้งมาตรฐานในการจัดเก็บข้อมูลภาพหลายรูปแบบ เช่น gif, jpeg และ png บางรูปแบบจะมีการบีบอัดข้อมูลให้มีขนาดเล็กลงด้วย

ข้อมูลเสียง

ได้จากการเปลี่ยนเสียงให้เป็นสัญญาณไฟฟ้า โดย ไมค์โครโฟน และคอมพิวเตอร์จะเปลี่ยนให้กลายเป็น ค่าตัวเลข แทน ความแรงของสัญญาณเสียง (โวลต์) ณ.เวลาหนึ่งๆ ตามช่วงเวลาการสุ่มที่กำหนด โดยอุปกรณ์ที่เรียกว่า Analog to digital converter ค่าตัวเลขนี้ สามารถแปลงกลับให้เป็น สัญญาณไฟฟ้า ออกทาง Audio output โดย digital to analog converter ผ่านเครื่องขยายเสียงและ ลำโพงเป็นเสียงกลับมาได้ ในการจัดเก็บข้อมูลเสียงจะมีการบีบอัดข้อมูลเพื่อให้จำนวนข้อมูล น้อยลง และมีคุณภาพเสียงใกล้เคียงกับของเดิม โดยสามารถทำได้หลายวิธี วิธีหนึ่งที่แพร่หลายในปัจจุบัน ที่เรียกกันว่า แฟ้มข้อมูลแบบ MP3 ซึ่งเป็นการเข้ารหัสเสียง แบบ MPEG-1 Audio Layer 3 ทั้งนี้ การเข้ารหัสแบบนี้ข้อมูลบางส่วนจะสูญหายไป แต่คุณภาพของเสียงที่ได้จะมีความใกล้เคียงเสียงจริงที่สุด โดยที่ผู้ฟังแทบไม่รู้สึกถึงความแตกต่าง แต่ทั้งนี้ขนาดของข้อมูลที่ลดลงมีขนาดกว่า 10 เท่าของข้อมูลการสุ่มค่าตามปกติ

The Illusion Of Digital Audio

ภาพยนตร์

สามารถมองได้เป็นสองส่วน คือ ชุดของภาพและเสียง โดยการแสดงภาพทางจอภาพให้ได้มากกว่า 16 ภาพต่อวินาที ตาของมนุษย์จะมองเห็นเป็นภาพต่อเนื่องที่มีแสดงการเคลื่อนไหวได้โดย ไม่กระตุก การเก็บข้อมูลภาพยนตร์ในคอมพิวเตอร์ ใช้หลักการเดียวกันกับการเก็บภาพส่วนหนึ่งและเก็บเสียงอีกส่วนหนึ่ง การเก็บภาพแต่ละภาพใช้หลักการบีบอัดข้อมูลเช่นเดียวกัน และสามารถบีบอัดข้อมูลระหว่างภาพได้ด้วย กล่าวคือ โดยปกติภาพที่ต่อเนื่องกันในภาพยนตร์จะมีความเหมือนกัน ดังนั้น แทนที่จะเก็บภาพที่สอง ก็ใช้วิธีหาผลต่างระหว่างภาพที่หนึ่งและสอง แล้วเก็บผลต่างแทนวิธีนี้จะทำให้มีจำนวนข้อมูลที่ต้องเก็บน้อยลง การเก็บข้อมูลภาพยนตร์มีหลายรูปแบบ เช่น แบบ avi, wmv และ mpeg เป็นต้น

Table of Contents