คอลัมน์นี้ประกอบด้วยปริมาณไฟล์เสียงโดยประมาณ ทำงานกับระบบเสียงพีซี การคำนวณปริมาณข้อมูลของเสียงที่เข้ารหัส คำแนะนำสำหรับครูและนักเรียน

เป้า.ทำความเข้าใจกระบวนการแปลงข้อมูลเสียง ฝึกฝนแนวคิดที่จำเป็นในการคำนวณปริมาณข้อมูลเสียง เรียนรู้การแก้ปัญหาในหัวข้อ

แรงจูงใจเป้าหมายการเตรียมตัวสำหรับการสอบ Unified State

แผนการเรียน

1. ดูการนำเสนอในหัวข้อพร้อมข้อคิดเห็นจากอาจารย์ภาคผนวก 1

สื่อการนำเสนอ: การเข้ารหัสข้อมูลเสียง

ตั้งแต่ต้นทศวรรษที่ 90 คอมพิวเตอร์ส่วนบุคคลสามารถทำงานกับข้อมูลเสียงได้ คอมพิวเตอร์ทุกเครื่องที่มีการ์ดเสียง ไมโครโฟน และลำโพงสามารถบันทึก บันทึก และเล่นข้อมูลเสียงได้

กระบวนการแปลงคลื่นเสียงเป็นรหัสไบนารี่ในหน่วยความจำคอมพิวเตอร์:

กระบวนการสร้างข้อมูลเสียงที่เก็บไว้ในหน่วยความจำคอมพิวเตอร์:

เสียงเป็นคลื่นเสียงที่แอมพลิจูดและความถี่เปลี่ยนแปลงอย่างต่อเนื่อง ยิ่งแอมพลิจูดยิ่งดังสำหรับบุคคล ยิ่งความถี่ของสัญญาณสูงเท่าใด เสียงก็จะยิ่งสูงขึ้นเท่านั้น ขณะนี้ซอฟต์แวร์คอมพิวเตอร์อนุญาตให้แปลงสัญญาณเสียงต่อเนื่องเป็นลำดับของพัลส์ไฟฟ้าที่สามารถแสดงในรูปแบบไบนารี่ได้ ในกระบวนการเข้ารหัสสัญญาณเสียงแบบต่อเนื่องก็คือ การสุ่มตัวอย่างเวลา . คลื่นเสียงต่อเนื่องจะถูกแบ่งออกเป็นส่วนชั่วคราวเล็กๆ แยกจากกัน และค่าแอมพลิจูดที่แน่นอนจะถูกตั้งค่าสำหรับแต่ละส่วนดังกล่าว

ดังนั้นการพึ่งพาอย่างต่อเนื่องของความกว้างของสัญญาณตรงเวลา ที่)จะถูกแทนที่ด้วยลำดับระดับเสียงที่ไม่ต่อเนื่องกัน บนกราฟ ดูเหมือนว่าการแทนที่เส้นโค้งเรียบด้วยลำดับ "ขั้นตอน" แต่ละ "ขั้นตอน" จะถูกกำหนดค่าระดับเสียง รหัสของมัน (1, 2, 3 ฯลฯ

ไกลออกไป). ระดับเสียงถือได้ว่าเป็นชุดของสถานะที่เป็นไปได้ ดังนั้น ยิ่งระดับเสียงได้รับการจัดสรรในระหว่างกระบวนการเข้ารหัสมากเท่าใด ค่าของแต่ละระดับก็จะยิ่งมีข้อมูลมากขึ้น และเสียงก็จะยิ่งดีขึ้นเท่านั้น

อะแดปเตอร์เสียง (การ์ดเสียง) เป็นอุปกรณ์พิเศษที่เชื่อมต่อกับคอมพิวเตอร์ซึ่งออกแบบมาเพื่อแปลงการสั่นสะเทือนทางไฟฟ้าของความถี่เสียงเป็นรหัสไบนารี่ตัวเลขเมื่ออินพุตเสียงและสำหรับการแปลงย้อนกลับ (จากรหัสตัวเลขเป็นการสั่นสะเทือนทางไฟฟ้า) เมื่อเล่นเสียง

ในกระบวนการบันทึกเสียง อะแดปเตอร์เสียงจะวัดความกว้างของกระแสไฟฟ้าในช่วงเวลาหนึ่ง และป้อนรหัสไบนารี่ของค่าผลลัพธ์ลงในรีจิสเตอร์ จากนั้นรหัสผลลัพธ์จากการลงทะเบียนจะถูกเขียนใหม่ลงใน RAM ของคอมพิวเตอร์ คุณภาพของเสียงคอมพิวเตอร์ถูกกำหนดโดยคุณสมบัติของอะแดปเตอร์เสียง:

  • ความถี่ในการสุ่มตัวอย่าง
  • ความลึกของบิต (ความลึกของเสียง)

อัตราการสุ่มตัวอย่างเวลา

นี่คือจำนวนการวัดสัญญาณอินพุตใน 1 วินาที ความถี่วัดเป็นเฮิรตซ์ (Hz) การวัดหนึ่งครั้งต่อวินาทีสอดคล้องกับความถี่ 1 Hz การวัด 1,000 ครั้งใน 1 วินาที – 1 กิโลเฮิรตซ์ (kHz) อัตราการสุ่มตัวอย่างโดยทั่วไปของอะแดปเตอร์เสียง:

11 กิโลเฮิร์ตซ์, 22 กิโลเฮิร์ตซ์, 44.1 กิโลเฮิร์ตซ์ ฯลฯ

ความกว้างของรีจิสเตอร์ (ความลึกของเสียง) คือจำนวนบิตในรีจิสเตอร์ของอะแดปเตอร์เสียงที่ระบุจำนวนระดับเสียงที่เป็นไปได้

ความลึกของบิตจะกำหนดความแม่นยำของการวัดสัญญาณอินพุต ยิ่งความลึกของบิตมากเท่าใด ข้อผิดพลาดในการแปลงค่าสัญญาณไฟฟ้าเป็นตัวเลขและกลับก็จะยิ่งน้อยลงเท่านั้น หากความลึกบิตคือ 8 (16) ดังนั้นเมื่อทำการวัดสัญญาณอินพุต 2 8 = 256 (2 16 = 65536) สามารถรับค่าที่แตกต่างกันได้ แน่นอนว่าอะแดปเตอร์เสียง 16 บิตจะเข้ารหัสและสร้างเสียงได้แม่นยำกว่าอะแดปเตอร์ 8 บิต การ์ดเสียงสมัยใหม่มีความลึกในการเข้ารหัสเสียง 16 บิต จำนวนระดับสัญญาณต่างๆ (สถานะสำหรับการเข้ารหัสที่กำหนด) สามารถคำนวณได้โดยใช้สูตร:

N = 2 I = 2 16 = 65536 โดยที่ I คือความลึกของเสียง

ดังนั้นการ์ดเสียงสมัยใหม่จึงสามารถเข้ารหัสระดับสัญญาณได้ 65536 ระดับ ค่าแอมพลิจูดของสัญญาณเสียงแต่ละค่าจะถูกกำหนดรหัส 16 บิต เมื่อเข้ารหัสไบนารี่ของสัญญาณเสียงต่อเนื่อง นั้นจะถูกแทนที่ด้วยลำดับระดับสัญญาณแยกกัน คุณภาพของการเข้ารหัสขึ้นอยู่กับจำนวนการวัดระดับสัญญาณต่อหน่วยเวลา กล่าวคือ อัตราการสุ่มตัวอย่างยิ่งทำการวัดได้มากใน 1 วินาที (ยิ่งความถี่ในการสุ่มตัวอย่างสูงเท่าไร ขั้นตอนการเข้ารหัสไบนารี่ก็จะยิ่งแม่นยำมากขึ้นเท่านั้น

ไฟล์เสียง -ไฟล์ที่เก็บข้อมูลเสียงในรูปแบบไบนารีตัวเลข

2. ทำซ้ำหน่วยการวัดข้อมูล

1 ไบต์ = 8 บิต

1 KB = 2 10 ไบต์ = 1,024 ไบต์

1 เมกะไบต์ = 2 10 กิโลไบต์ = 1024 กิโลไบต์

1GB = 2 10MB = 1024MB

1 TB = 2 10 GB = 1,024 GB

1 PB = 2 10 TB = 1,024 TB

3. เสริมเนื้อหาที่เรียนโดยการดูการนำเสนอหรือหนังสือเรียน

4. การแก้ปัญหา

หนังสือเรียนแสดงวิธีแก้ปัญหาในการนำเสนอ

ภารกิจที่ 1กำหนดปริมาณข้อมูลของไฟล์เสียงสเตอริโอด้วยระยะเวลาเสียง 1 วินาทีด้วยคุณภาพเสียงสูง (16 บิต, 48 ​​kHz)

งาน (อิสระ)หนังสือเรียนแสดงวิธีแก้ปัญหาในการนำเสนอ
กำหนดปริมาณข้อมูลของไฟล์เสียงดิจิทัลด้วยระยะเวลาเสียง 10 วินาทีที่ความถี่สุ่มตัวอย่าง 22.05 kHz และความละเอียด 8 บิต

5. การรวมบัญชี การแก้ปัญหาที่บ้านอย่างอิสระในบทเรียนถัดไป

กำหนดจำนวนหน่วยความจำเพื่อจัดเก็บไฟล์เสียงดิจิทัลซึ่งมีเวลาเล่นสองนาทีที่ความถี่สุ่มตัวอย่าง 44.1 kHz และความละเอียด 16 บิต

ผู้ใช้มีความจุหน่วยความจำ 2.6 MB จำเป็นต้องบันทึกไฟล์เสียงดิจิทัลโดยมีความยาวเสียง 1 นาที ความถี่ในการสุ่มตัวอย่างและความลึกของบิตควรเป็นเท่าใด

จำนวนหน่วยความจำว่างบนดิสก์คือ 5.25 MB ความลึกบิตของการ์ดเสียงคือ 16 ระยะเวลาของเสียงของไฟล์เสียงดิจิทัลที่บันทึกด้วยความถี่สุ่มตัวอย่าง 22.05 kHz คือเท่าใด

หนึ่งนาทีในการบันทึกไฟล์เสียงดิจิทัลจะใช้พื้นที่ดิสก์ 1.3 MB และความจุบิตของการ์ดเสียงคือ 8 เสียงที่บันทึกที่อัตราการสุ่มตัวอย่างเท่าใด

ต้องใช้หน่วยความจำเท่าใดในการจัดเก็บไฟล์เสียงดิจิตอลคุณภาพสูงโดยใช้เวลาเล่น 3 นาที?

ไฟล์เสียงดิจิทัลมีการบันทึกเสียงคุณภาพต่ำ (เสียงมืดและอู้อี้) ไฟล์จะมีระยะเวลาเท่าใดหากมีขนาด 650 KB

การบันทึกไฟล์เสียงดิจิทัลสองนาทีจะใช้พื้นที่ดิสก์ 5.05 MB ความถี่ในการสุ่มตัวอย่าง - 22,050 เฮิรตซ์ ความลึกบิตของอะแดปเตอร์เสียงคือเท่าใด?

จำนวนหน่วยความจำว่างบนดิสก์คือ 0.1 GB ความลึกบิตของการ์ดเสียงคือ 16 ระยะเวลาของเสียงของไฟล์เสียงดิจิทัลที่บันทึกด้วยความถี่สุ่มตัวอย่าง 44,100 Hz คือเท่าใด

คำตอบ

หมายเลข 92 124.8 วินาที

หมายเลข 93. 22.05 กิโลเฮิรตซ์.

หมายเลข 94 คุณภาพเสียงสูงทำได้ด้วยความถี่สุ่มตัวอย่าง 44.1 kHz และความลึกบิตของอะแดปเตอร์เสียง 16 ขนาดหน่วยความจำที่ต้องการคือ 15.1 MB

ลำดับที่ 95 พารามิเตอร์ต่อไปนี้เป็นเรื่องปกติสำหรับเสียงที่มืดมนและอู้อี้: ความถี่ในการสุ่มตัวอย่าง - 11 kHz, ความลึกบิตของอะแดปเตอร์เสียง - 8 ระยะเวลาของเสียงคือ 60.5 วินาที

หมายเลข 96 16 บิต

น.97.20.3 นาที.

วรรณกรรม

1. หนังสือเรียน: วิทยาการคอมพิวเตอร์ หนังสือปัญหา-เวิร์คช็อป เล่ม 1 เรียบเรียงโดย I.G. Semakin, E.K. เฮนเนอร์)

2. เทศกาลแนวคิดการสอนเสียง “บทเรียนเปิด” การเข้ารหัสข้อมูลเสียงแบบไบนารี Supryagina Elena Aleksandrovna ครูสอนวิทยาศาสตร์คอมพิวเตอร์

3. เอ็น. อูกริโนวิช วิทยาการคอมพิวเตอร์และเทคโนโลยีสารสนเทศ เกรด 10-11 มอสโก ทวินาม ห้องปฏิบัติการความรู้ 2546

แนวคิดพื้นฐาน

ความถี่ในการสุ่มตัวอย่าง (f) กำหนดจำนวนตัวอย่างที่จัดเก็บใน 1 วินาที

1 เฮิร์ตซ์ (หนึ่งเฮิรตซ์) คือหนึ่งการนับต่อวินาที

และ 8 kHz คือ 8,000 ตัวอย่างต่อวินาที

ความลึกของการเข้ารหัส (b) คือจำนวนบิตที่ต้องใช้ในการเข้ารหัส 1 ระดับเสียง

เวลาเล่น (t)


ความจุหน่วยความจำสำหรับจัดเก็บข้อมูล 1 ช่อง (โมโน)

ฉัน=ฉ ข ต

(เพื่อเก็บข้อมูลเกี่ยวกับเสียงที่ยาวนาน t วินาที เข้ารหัสด้วยความถี่สุ่ม f Hz และความลึกของการเข้ารหัส b บิตจำเป็นต้องใช้ฉัน บิตหน่วยความจำ)

ที่ การบันทึกแบบสองช่องสัญญาณ (สเตอริโอ)จำนวนหน่วยความจำที่ต้องใช้ในการจัดเก็บข้อมูลสำหรับหนึ่งช่องสัญญาณจะคูณด้วย 2

ผม=ฉ ข เสื้อ 2

หน่วยฉัน - บิต, b - บิต, f - เฮิรตซ์, t - วินาที ความถี่สุ่มตัวอย่าง 44.1 kHz, 22.05 kHz, 11.025 kHz

การเข้ารหัสข้อมูลเสียง

หลักการทางทฤษฎีพื้นฐาน

การสุ่มตัวอย่างเสียงตามเวลาเพื่อให้คอมพิวเตอร์ประมวลผลเสียง สัญญาณเสียงต่อเนื่องจะต้องถูกแปลงเป็นรูปแบบดิจิทัลแยกส่วนโดยใช้การสุ่มตัวอย่างเวลา คลื่นเสียงต่อเนื่องจะถูกแบ่งออกเป็นส่วนชั่วคราวเล็กๆ แยกจากกัน และค่าความเข้มของเสียงที่แน่นอนจะถูกตั้งค่าสำหรับแต่ละส่วนดังกล่าว

ดังนั้นการพึ่งพาระดับเสียงต่อเวลา A(t) อย่างต่อเนื่องจึงถูกแทนที่ด้วยลำดับระดับเสียงที่แยกจากกัน บนกราฟ ดูเหมือนว่าการแทนที่เส้นโค้งเรียบด้วยลำดับ "ขั้นตอน"

ความถี่ในการสุ่มตัวอย่างไมโครโฟนที่เชื่อมต่อกับการ์ดเสียงใช้ในการบันทึกเสียงอะนาล็อกและแปลงเป็นรูปแบบดิจิทัล คุณภาพของเสียงดิจิทัลที่ได้จะขึ้นอยู่กับจำนวนการวัดระดับเสียงต่อหน่วยเวลา เช่น อัตราการสุ่มตัวอย่าง ยิ่งทำการวัดมากใน 1 วินาที (ความถี่ในการสุ่มตัวอย่างยิ่งสูง) “บันได” ของสัญญาณเสียงดิจิตอลจะเคลื่อนที่ตามเส้นโค้งของสัญญาณอะนาล็อกก็จะยิ่งแม่นยำมากขึ้นเท่านั้น

อัตราการสุ่มตัวอย่างเสียงคือจำนวนการวัดระดับเสียงในหนึ่งวินาที วัดเป็นเฮิรตซ์ (Hz) เรามาแสดงอัตราการสุ่มตัวอย่างด้วยตัวอักษร ฉ.

อัตราการสุ่มตัวอย่างเสียงสามารถอยู่ในช่วงตั้งแต่ 8,000 ถึง 48,000 การวัดระดับเสียงต่อวินาที สำหรับการเข้ารหัส ให้เลือกความถี่ใดความถี่หนึ่งจากสามความถี่: 44.1กิโลเฮิร์ตซ์, 22.05กิโลเฮิร์ตซ์, 11.025กิโลเฮิร์ตซ์.

ความลึกของการเข้ารหัสเสียงแต่ละ “ขั้นตอน” ถูกกำหนดระดับเสียงเฉพาะ ระดับความดังของเสียงถือได้ว่าเป็นชุดของสถานะที่เป็นไปได้ N ซึ่งต้องใช้ข้อมูลจำนวนหนึ่งเพื่อเข้ารหัสข ซึ่งเรียกว่าความลึกของการเข้ารหัสเสียง

ความลึกของการเข้ารหัสเสียงคือปริมาณข้อมูลที่จำเป็นในการเข้ารหัสระดับเสียงดิจิทัลแบบแยกส่วน

หากทราบความลึกของการเข้ารหัสจำนวนระดับเสียงดิจิทัลสามารถคำนวณได้โดยใช้สูตร N = 2 b ปล่อยให้ความลึกของการเข้ารหัสเสียงเป็น 16 บิต จากนั้นจำนวนระดับเสียงจะเท่ากับ:

ยังไม่มีข้อความ=2 ข = 2 16 = 65,536.

ในระหว่างขั้นตอนการเข้ารหัส แต่ละระดับเสียงจะได้รับการกำหนดรหัสไบนารี่ 16 บิตของตัวเอง ระดับเสียงต่ำสุดจะสอดคล้องกับรหัส 0000000000000000 และสูงสุด - 1111111111111111

คุณภาพเสียงแบบดิจิทัลยิ่งความถี่และความลึกของการสุ่มตัวอย่างเสียงสูงเท่าไร คุณภาพของเสียงดิจิทัลก็จะยิ่งสูงขึ้นเท่านั้น คุณภาพเสียงดิจิทัลต่ำสุดซึ่งสอดคล้องกับคุณภาพของการสื่อสารทางโทรศัพท์นั้นได้มาจากอัตราการสุ่มตัวอย่าง 8,000 ครั้งต่อวินาทีความลึกของการสุ่มตัวอย่าง 8 บิตและการบันทึกเสียงหนึ่งแทร็ก (โหมดโมโน) เสียงดิจิทัลคุณภาพสูงสุดซึ่งสอดคล้องกับคุณภาพซีดีเพลงทำได้ด้วยอัตราการสุ่มตัวอย่าง 48,000 ครั้งต่อวินาที ความลึกของการสุ่มตัวอย่าง 16 บิต และการบันทึกเสียงสองแทร็ก (โหมดสเตอริโอ)

ต้องจำไว้ว่ายิ่งคุณภาพของเสียงดิจิทัลสูงเท่าใด ปริมาณข้อมูลของไฟล์เสียงก็จะยิ่งมากขึ้นเท่านั้น

งานสำหรับการศึกษาด้วยตนเอง.

1. คำนวณระดับเสียงของไฟล์เสียงโมโนโฟนิก 10 วินาทีพร้อมการเข้ารหัส 16 บิตและอัตราการสุ่มตัวอย่าง 44.1 kHz (861 กิโลไบต์)

2. การบันทึกเสียงแบบสองช่องสัญญาณ (สเตอริโอ) ดำเนินการด้วยความถี่สุ่มตัวอย่าง 48 kHz และความละเอียด 24 บิต การบันทึกจะใช้เวลา 1 นาที ผลลัพธ์จะถูกเขียนลงในไฟล์ ไม่มีการบีบอัดข้อมูล ตัวเลขใดต่อไปนี้มีขนาดใกล้เคียงกับขนาดของไฟล์ผลลัพธ์มากที่สุด โดยแสดงเป็นเมกะไบต์

1)0,3 2) 4 3) 16 4) 132

3. การบันทึกเสียงช่องเดียว (โมโน) ทำด้วยความถี่สุ่มตัวอย่าง 11 kHz และความลึกของการเข้ารหัส 24 บิต การบันทึกใช้เวลา 7 นาที ผลลัพธ์จะถูกเขียนลงในไฟล์ ไม่มีการบีบอัดข้อมูล ตัวเลขใดต่อไปนี้มีขนาดใกล้เคียงกับขนาดของไฟล์ผลลัพธ์มากที่สุด โดยแสดงเป็นเมกะไบต์

1) 11 2) 13 3) 15 4) 22

4. การบันทึกเสียงแบบสองช่องสัญญาณ (สเตอริโอ) ทำด้วยความถี่สุ่มตัวอย่าง 11 kHz และความลึกของการเข้ารหัส 16 บิต การบันทึกใช้เวลา 6 นาที ผลลัพธ์จะถูกเขียนลงในไฟล์ ไม่มีการบีบอัดข้อมูล ตัวเลขใดต่อไปนี้มีขนาดใกล้เคียงกับขนาดของไฟล์ผลลัพธ์มากที่สุด โดยแสดงเป็นเมกะไบต์

1) 11 2) 12 3) 13 4) 15

แนวคิดพื้นฐาน

ความถี่ในการสุ่มตัวอย่าง (f) กำหนดจำนวนตัวอย่างที่จัดเก็บใน 1 วินาที

1 เฮิร์ตซ์ (หนึ่งเฮิรตซ์) คือหนึ่งการนับต่อวินาที

และ 8 kHz คือ 8,000 ตัวอย่างต่อวินาที

ความลึกของการเข้ารหัส (b) คือจำนวนบิตที่ต้องใช้ในการเข้ารหัส 1 ระดับเสียง

เวลาเล่น (t)


ความจุหน่วยความจำสำหรับจัดเก็บข้อมูล 1 ช่อง (โมโน)

ฉัน=ฉ ข ต

(เพื่อเก็บข้อมูลเกี่ยวกับเสียงที่ยาวนาน t วินาที เข้ารหัสด้วยความถี่สุ่ม f Hz และความลึกของการเข้ารหัส b บิตจำเป็นต้องใช้ฉัน บิตหน่วยความจำ)

ที่ การบันทึกแบบสองช่องสัญญาณ (สเตอริโอ)จำนวนหน่วยความจำที่ต้องใช้ในการจัดเก็บข้อมูลสำหรับหนึ่งช่องสัญญาณจะคูณด้วย 2

ผม=ฉ ข เสื้อ 2

หน่วยฉัน - บิต, b - บิต, f - เฮิรตซ์, t - วินาที ความถี่สุ่มตัวอย่าง 44.1 kHz, 22.05 kHz, 11.025 kHz

การเข้ารหัสข้อมูลเสียง

หลักการทางทฤษฎีพื้นฐาน

การสุ่มตัวอย่างเสียงตามเวลาเพื่อให้คอมพิวเตอร์ประมวลผลเสียง สัญญาณเสียงต่อเนื่องจะต้องถูกแปลงเป็นรูปแบบดิจิทัลแยกส่วนโดยใช้การสุ่มตัวอย่างเวลา คลื่นเสียงต่อเนื่องจะถูกแบ่งออกเป็นส่วนชั่วคราวเล็กๆ แยกจากกัน และค่าความเข้มของเสียงที่แน่นอนจะถูกตั้งค่าสำหรับแต่ละส่วนดังกล่าว

ดังนั้นการพึ่งพาระดับเสียงต่อเวลา A(t) อย่างต่อเนื่องจึงถูกแทนที่ด้วยลำดับระดับเสียงที่แยกจากกัน บนกราฟ ดูเหมือนว่าการแทนที่เส้นโค้งเรียบด้วยลำดับ "ขั้นตอน"

ความถี่ในการสุ่มตัวอย่างไมโครโฟนที่เชื่อมต่อกับการ์ดเสียงใช้ในการบันทึกเสียงอะนาล็อกและแปลงเป็นรูปแบบดิจิทัล คุณภาพของเสียงดิจิทัลที่ได้จะขึ้นอยู่กับจำนวนการวัดระดับเสียงต่อหน่วยเวลา เช่น อัตราการสุ่มตัวอย่าง ยิ่งทำการวัดมากใน 1 วินาที (ความถี่ในการสุ่มตัวอย่างยิ่งสูง) “บันได” ของสัญญาณเสียงดิจิตอลจะเคลื่อนที่ตามเส้นโค้งของสัญญาณอะนาล็อกก็จะยิ่งแม่นยำมากขึ้นเท่านั้น

อัตราการสุ่มตัวอย่างเสียงคือจำนวนการวัดระดับเสียงในหนึ่งวินาที วัดเป็นเฮิรตซ์ (Hz) เรามาแสดงอัตราการสุ่มตัวอย่างด้วยตัวอักษร ฉ.

อัตราการสุ่มตัวอย่างเสียงสามารถอยู่ในช่วงตั้งแต่ 8,000 ถึง 48,000 การวัดระดับเสียงต่อวินาที สำหรับการเข้ารหัส ให้เลือกความถี่ใดความถี่หนึ่งจากสามความถี่: 44.1กิโลเฮิร์ตซ์, 22.05กิโลเฮิร์ตซ์, 11.025กิโลเฮิร์ตซ์.

ความลึกของการเข้ารหัสเสียงแต่ละ “ขั้นตอน” ถูกกำหนดระดับเสียงเฉพาะ ระดับความดังของเสียงถือได้ว่าเป็นชุดของสถานะที่เป็นไปได้ N ซึ่งต้องใช้ข้อมูลจำนวนหนึ่งเพื่อเข้ารหัสข ซึ่งเรียกว่าความลึกของการเข้ารหัสเสียง

ความลึกของการเข้ารหัสเสียงคือปริมาณข้อมูลที่จำเป็นในการเข้ารหัสระดับเสียงดิจิทัลแบบแยกส่วน

หากทราบความลึกของการเข้ารหัสจำนวนระดับเสียงดิจิทัลสามารถคำนวณได้โดยใช้สูตร N = 2 b ปล่อยให้ความลึกของการเข้ารหัสเสียงเป็น 16 บิต จากนั้นจำนวนระดับเสียงจะเท่ากับ:

ยังไม่มีข้อความ=2 ข = 2 16 = 65,536.

ในระหว่างขั้นตอนการเข้ารหัส แต่ละระดับเสียงจะได้รับการกำหนดรหัสไบนารี่ 16 บิตของตัวเอง ระดับเสียงต่ำสุดจะสอดคล้องกับรหัส 0000000000000000 และสูงสุด - 1111111111111111

คุณภาพเสียงแบบดิจิทัลยิ่งความถี่และความลึกของการสุ่มตัวอย่างเสียงสูงเท่าไร คุณภาพของเสียงดิจิทัลก็จะยิ่งสูงขึ้นเท่านั้น คุณภาพเสียงดิจิทัลต่ำสุดซึ่งสอดคล้องกับคุณภาพของการสื่อสารทางโทรศัพท์นั้นได้มาจากอัตราการสุ่มตัวอย่าง 8,000 ครั้งต่อวินาทีความลึกของการสุ่มตัวอย่าง 8 บิตและการบันทึกเสียงหนึ่งแทร็ก (โหมดโมโน) เสียงดิจิทัลคุณภาพสูงสุดซึ่งสอดคล้องกับคุณภาพซีดีเพลงทำได้ด้วยอัตราการสุ่มตัวอย่าง 48,000 ครั้งต่อวินาที ความลึกของการสุ่มตัวอย่าง 16 บิต และการบันทึกเสียงสองแทร็ก (โหมดสเตอริโอ)

ต้องจำไว้ว่ายิ่งคุณภาพของเสียงดิจิทัลสูงเท่าใด ปริมาณข้อมูลของไฟล์เสียงก็จะยิ่งมากขึ้นเท่านั้น

งานสำหรับการศึกษาด้วยตนเอง.

1. คำนวณระดับเสียงของไฟล์เสียงโมโนโฟนิก 10 วินาทีพร้อมการเข้ารหัส 16 บิตและอัตราการสุ่มตัวอย่าง 44.1 kHz (861 กิโลไบต์)

2. การบันทึกเสียงแบบสองช่องสัญญาณ (สเตอริโอ) ดำเนินการด้วยความถี่สุ่มตัวอย่าง 48 kHz และความละเอียด 24 บิต การบันทึกจะใช้เวลา 1 นาที ผลลัพธ์จะถูกเขียนลงในไฟล์ ไม่มีการบีบอัดข้อมูล ตัวเลขใดต่อไปนี้มีขนาดใกล้เคียงกับขนาดของไฟล์ผลลัพธ์มากที่สุด โดยแสดงเป็นเมกะไบต์

1)0,3 2) 4 3) 16 4) 132

3. การบันทึกเสียงช่องเดียว (โมโน) ทำด้วยความถี่สุ่มตัวอย่าง 11 kHz และความลึกของการเข้ารหัส 24 บิต การบันทึกใช้เวลา 7 นาที ผลลัพธ์จะถูกเขียนลงในไฟล์ ไม่มีการบีบอัดข้อมูล ตัวเลขใดต่อไปนี้มีขนาดใกล้เคียงกับขนาดของไฟล์ผลลัพธ์มากที่สุด โดยแสดงเป็นเมกะไบต์

1) 11 2) 13 3) 15 4) 22

4. การบันทึกเสียงแบบสองช่องสัญญาณ (สเตอริโอ) ทำด้วยความถี่สุ่มตัวอย่าง 11 kHz และความลึกของการเข้ารหัส 16 บิต การบันทึกใช้เวลา 6 นาที ผลลัพธ์จะถูกเขียนลงในไฟล์ ไม่มีการบีบอัดข้อมูล ตัวเลขใดต่อไปนี้มีขนาดใกล้เคียงกับขนาดของไฟล์ผลลัพธ์มากที่สุด โดยแสดงเป็นเมกะไบต์

1) 11 2) 12 3) 13 4) 15

1. ข้อมูลทั่วไป

ความซับซ้อน: ขั้นพื้นฐาน.

เวลาแก้ปัญหาโดยประมาณ (สำหรับผู้ที่จะทำภาค 2) : 2 นาที

เรื่อง: การสร้างและประมวลผลข้อมูลกราฟิกและมัลติมีเดีย

หัวข้อย่อย: การบันทึกเสียงแบบดิจิตอล

มีการตรวจสอบอะไรบ้าง: ความสามารถในการประเมินลักษณะเชิงปริมาณของกระบวนการบันทึกเสียง

ข้อมูลทางทฤษฎีโดยย่อ: เนื่องจากงานประเภทนี้ถือเป็นงานใหม่ใน Unified State Exam KIM เราจึงนำเสนอแบบจำลองทางคณิตศาสตร์ของกระบวนการบันทึกเสียง (โดยไม่ต้องให้เหตุผลในตอนนี้ ให้เหตุผลด้านล่าง):

N=k*F*L* (1)

  • เอ็น– ขนาดไฟล์ (เป็นบิต) ที่มีการบันทึกเสียง
  • เค- จำนวนช่องบันทึก (เช่น 1 – โมโน, 2 – สเตอริโอ, 4 – รูปสี่เหลี่ยม ฯลฯ )
  • เอฟ– ความถี่สุ่มตัวอย่าง (เป็นเฮิรตซ์) เช่น จำนวนค่าแอมพลิจูดของเสียงที่บันทึกในหนึ่งวินาที
  • – ความละเอียด เช่น จำนวนบิตที่ใช้ในการจัดเก็บแต่ละค่าที่วัดได้
  • – ระยะเวลาของส่วนของเสียง (เป็นวินาที)

งานอาจมีลักษณะอย่างไร? ตัวอย่างเช่นเช่นนี้: ระบุค่าของพารามิเตอร์ที่จำเป็นทั้งหมดของกระบวนการบันทึกเสียงยกเว้นค่าเดียว คุณต้องประมาณค่าของพารามิเตอร์ที่เหลือ เช่น ขนาดไฟล์หรือระยะเวลาของส่วนของเสียง


เงื่อนไขตัวอย่าง:

คำตอบที่เป็นไปได้:

1) 0.2 ลบ

2. ตัวอย่างการมอบหมายงาน

2.1. งาน.

ปัญหา 2012-A8-1

การบันทึกเสียงแบบช่องสัญญาณเดียว (โมโน) ดำเนินการด้วยความถี่สุ่มตัวอย่าง 16 kHz และความละเอียด 24 บิต การบันทึกจะใช้เวลา 1 นาที ผลลัพธ์จะถูกเขียนลงในไฟล์ ไม่มีการบีบอัดข้อมูล ค่าใดต่อไปนี้ใกล้เคียงกับขนาดของไฟล์ผลลัพธ์มากที่สุด?

1) 0.2 ลบ. 2) 2 ลบ. 3) 3 ลบ. 4) 4 ลบ

2.2. สารละลาย.

เราลดข้อมูลเริ่มต้นเป็นมิติของบิต - วินาที - เฮิรตซ์และดำเนินการคำนวณโดยใช้สูตร (1):

ที่ให้ไว้:

เค= 1 เพราะว่า การบันทึกเสียงช่องเดียว (โมโน)

เอฟ= 16 กิโลเฮิรตซ์ = 16,000 เฮิรตซ์;

= 1 นาที = 60 วิ

หาเอ็น

แทนค่าของพารามิเตอร์ที่รู้จักลงในสูตร (1)

ยังไม่มีข้อความ=1*16000 *24*60 =(16 *1000) * (8*3) * (4*15)=

= 2 4 *(2 3 *125) *(2 3 *3)*) *(2 2 * 15) = 2 12 *5625 (บิต)=

= 2 12 *5625 บิต = (2 12 *5625)/2 3 ไบต์ = 2 9 *5625 ไบต์ =

= (2 9 *5625)/ 2 20 MB = 5625/2 11 MB = 5625/2048 MB

ตัวเลข 5625/2048 อยู่ระหว่างเลข 2 กับ 3 ยิ่งไปกว่านั้นมันอยู่ใกล้ 3 มากกว่า 2 เพราะว่า 3 * 2048 – 5625 < 1000; 5625 - 2 * 2048 > 1000.

คำตอบที่ถูกต้อง: หมายเลข 3 (3 MB)

ความคิดเห็น แนวคิดการแก้ปัญหาอื่นมีระบุไว้ในย่อหน้าที่ 3.3

3. ทิปสำหรับครูและนักเรียน

3.1 ผู้เรียนต้องมีความรู้/ทักษะ/ทักษะอะไรบ้างในการแก้ปัญหานี้?

1) ไม่ควร “ท่องจำ” สูตร (1) นักเรียนที่เป็นตัวแทนของแก่นแท้ของกระบวนการบันทึกเสียงดิจิทัลจะต้องสามารถกำหนดกระบวนการได้อย่างอิสระ

2) คุณต้องสามารถเขียนค่าพารามิเตอร์ในมิติที่ต้องการได้ตลอดจนทักษะทางคณิตศาสตร์ขั้นพื้นฐานรวมถึง ปฏิบัติการด้วยกำลังสอง

ก. นักเรียนที่เข้มแข็ง.

1. เป็นไปได้มากว่าพวกเขาจะแก้ไขปัญหานี้ต่อไป

2. คุณสามารถมอบหมายให้นักเรียนตรวจสอบสูตร (1) ในทางปฏิบัติได้โดยการบันทึกเสียงจากไมโครโฟนลงในไฟล์ โปรดทราบว่าสิ่งนี้ใช้ได้เฉพาะในกรณีที่ข้อมูลที่บันทึกไว้ไม่ได้ถูกบีบอัด (รูปแบบ WAV (PCM) ที่ไม่บีบอัด) หากใช้รูปแบบเสียงที่บีบอัด (WMA, MP3) ขนาดของไฟล์ผลลัพธ์จะน้อยกว่าขนาดที่คำนวณได้อย่างมากด้วยเหตุผลที่ชัดเจน หากต้องการทดลองใช้การบันทึกเสียงดิจิทัล คุณสามารถใช้โปรแกรมแก้ไขเสียง Audacity (http://audacity.sourceforge.net/) ได้ฟรี

3. ขอแนะนำให้เน้นย้ำถึงความเหมือนกันทางแนวคิดของการเป็นตัวแทนแรสเตอร์ของเสียงและภาพซึ่งเป็นกระบวนการเดียวกันในการแสดงสัญญาณต่อเนื่องโดยประมาณ - ลำดับของสัญญาณแยกสั้น ๆ เช่น การแปลงเป็นดิจิทัลตามการสุ่มตัวอย่าง ในกรณีของภาพแรสเตอร์ การแยกความสว่างในอวกาศแบบสองมิติจะดำเนินการ ในกรณีของเสียง การแยกส่วนตามเวลาแบบหนึ่งมิติจะดำเนินการ ในทั้งสองกรณี การเพิ่มอัตราการสุ่มตัวอย่าง (จำนวนพิกเซลหรือตัวอย่างเสียง) และ/หรือการเพิ่มจำนวนบิตเพื่อแสดงหนึ่งตัวอย่าง (ความลึกของบิตสีหรือเสียง) ส่งผลให้คุณภาพของการแปลงเป็นดิจิทัลเพิ่มขึ้น ขณะเดียวกันก็เพิ่มขนาด ของไฟล์ด้วยการนำเสนอแบบดิจิทัล จึงมีความจำเป็นในการบีบอัดข้อมูล

4. ขอแนะนำให้พูดถึงวิธีอื่นในการแปลงเสียงเป็นดิจิทัล - การบันทึก "ส่วน" ของเครื่องดนตรีในรูปแบบ MIDI นี่เป็นสิ่งที่เหมาะสมที่จะวาดความคล้ายคลึงกับการแสดงภาพแรสเตอร์และเวกเตอร์

ข. นักเรียนไม่เข้มแข็งนัก.

1. จำเป็นต้องให้แน่ใจว่าการดูดซึมของความสัมพันธ์ (1) ขอแนะนำให้กำหนดงานเช่น "ขนาดไฟล์จะเปลี่ยนไปอย่างไรหากเวลาในการบันทึกเสียงเพิ่มขึ้น/ลดลง พีครั้งหนึ่ง? -

“สามารถเพิ่ม/ลดระยะเวลาการบันทึกได้กี่ครั้ง หากขนาดไฟล์สูงสุดเพิ่มขึ้น/ลดลง พีครั้งหนึ่ง? , "ขนาดไฟล์จะเปลี่ยนไปอย่างไรหากจำนวนบิตสำหรับการบันทึกหนึ่งค่าเพิ่มขึ้น/ลดลง พีครั้งหนึ่ง?" ฯลฯ

2. จำเป็นต้องตรวจสอบให้แน่ใจว่านักเรียนมีความชำนาญในการใช้มิติข้อมูล มี 23 บิตในหน่วย MB เป็นต้น

3. จำเป็นต้องตรวจสอบให้แน่ใจว่านักเรียนมีความรู้ทางคณิตศาสตร์เพียงพอ และคล่องแคล่วในการคำนวณทางจิตด้วยกำลังสอง (การคูณ การหาร ตัวประกอบการแยกที่เป็นตัวแทนของ 2n)

4. คิดแนวทางของคุณเองแล้วลองทำดู

3.3. เคล็ดลับที่เป็นประโยชน์

พลังของทั้งสองมักเกิดขึ้นในปัญหาเช่นนี้ การคูณและหารกำลังนั้นง่ายกว่าตัวเลขตามอำเภอใจ การคูณและหารกำลังนั้นขึ้นอยู่กับการบวกและการลบเลขยกกำลัง

โปรดทราบว่าตัวเลข 1,000 และ 1,024 ต่างกันน้อยกว่า 3% ส่วนตัวเลข 60 และ 64 ต่างกันน้อยกว่า 7% ดังนั้นคุณสามารถทำเช่นนี้ได้ ดำเนินการคำนวณโดยแทนที่ 1,000 ด้วย 1,024 = 2 10 และ 60 ด้วย 64 = 2 6 โดยใช้ประโยชน์จากการดำเนินการที่มีอำนาจ คำตอบที่ใกล้เคียงกับผลลัพธ์มากที่สุดจะเป็นคำตอบที่คุณกำลังมองหา จากนั้นคุณสามารถตรวจสอบตัวเองอีกครั้งด้วยการคำนวณที่แม่นยำ แต่เราสามารถคำนึงได้ว่าข้อผิดพลาดในการคำนวณทั้งหมดในการประมาณของเราไม่เกิน 10% แน่นอน 60*1,000 = 60,000; 64*1024=65536;

60000 > 0.9 * 65536 = 58982.4

ดังนั้นผลลัพธ์ที่ถูกต้องของการคูณตามสูตร (1) จึงมากกว่า 90% ของผลลัพธ์โดยประมาณที่ได้เล็กน้อย หากคำนึงถึงข้อผิดพลาดแล้วผลลัพธ์ไม่เปลี่ยนแปลง คำตอบก็ไม่ต้องสงสัย

ตัวอย่าง. (ege.yandex.ru ตัวเลือก 1)

การบันทึกเสียงแบบสองช่องสัญญาณ (สเตอริโอ) ดำเนินการด้วยความถี่สุ่มตัวอย่าง 16 kHz และความละเอียด 32 บิต การบันทึกใช้เวลา 12 นาที ผลลัพธ์จะถูกเขียนลงในไฟล์ ไม่มีการบีบอัดข้อมูล ค่าใดต่อไปนี้ใกล้เคียงกับขนาดของไฟล์ผลลัพธ์มากที่สุด?

1) 30 ลบ. 2) 60 ลบ. 3) 75 ลบ. 4) 90 ลบ.

สารละลาย. ขนาดบันทึกเป็นบิตคือ

2*16*1000*32*12*60

เมื่อคำนึงถึงการแทนที่ 1,000 ด้วย 1,024=2 10 และ 60 ด้วย 64=2 6 เราได้รับ:

2 1 *2 4 *2 10 *2 5 *3*2 2 *2 6 =3*2 28

อย่างที่คุณทราบ 1 MB = 2 20 ไบต์ = 2 23 บิต ดังนั้น 3*2 28 บิต = 3*32 = 96 MB ลดจำนวนนี้ลง 10% เราจะได้ 86.4 MB ในทั้งสองกรณี ค่าที่ใกล้เคียงที่สุดคือ 90 MB

คำตอบที่ถูกต้อง: 4

1. อ่านคำชี้แจงปัญหา แสดงพารามิเตอร์ที่ไม่รู้จักในแง่ของค่าที่รู้จัก ให้ความสนใจเป็นพิเศษกับขนาดของพารามิเตอร์ที่ทราบ ควรเป็นบิต-วินาที-เฮิรตซ์ (จำได้ว่า 1 Hz = s -1) หากจำเป็นให้ลดค่าพารามิเตอร์ลงในมิติที่ต้องการเช่นเดียวกับที่ทำในปัญหาทางฟิสิกส์

2. ทำการคำนวณโดยพยายามระบุกำลังของทั้งสอง

3. โปรดทราบว่าเงื่อนไขนี้กำหนดให้คุณต้องเลือกคำตอบที่เหมาะสมที่สุด ดังนั้นจึงไม่จำเป็นต้องคำนวณตำแหน่งทศนิยมที่มีความแม่นยำสูง ทันทีที่ชัดเจนว่าตัวเลือกคำตอบใดใกล้เคียงกับค่าที่คำนวณได้มากที่สุด การคำนวณควรหยุดลง หากความคลาดเคลื่อนของตัวเลือกคำตอบทั้งหมดมีขนาดใหญ่มาก (หลายเท่าหรือตามลำดับความสำคัญ) การคำนวณจะต้องได้รับการตรวจสอบอีกครั้ง

4. ปัญหาสำหรับการแก้ปัญหาอย่างอิสระ

4.1. โคลนของปัญหา 2012-A8-1

ด้านล่างนี้คือสี่ตัวเลือกเพิ่มเติมสำหรับงาน 2012-A8-1

A) การบันทึกเสียงแบบช่องเดียว (โมโน) ดำเนินการด้วยความถี่สุ่มตัวอย่าง 32 kHz และความละเอียด 24 บิต การบันทึกจะใช้เวลา 15 วินาที ผลลัพธ์จะถูกเขียนลงในไฟล์ และไม่มีการบีบอัดข้อมูล ค่าใดต่อไปนี้ใกล้เคียงกับขนาดของไฟล์ผลลัพธ์มากที่สุด?

B) การบันทึกเสียงแบบสองช่องสัญญาณ (สเตอริโอ) ดำเนินการด้วยความถี่สุ่มตัวอย่าง 32 kHz และความละเอียด 24 บิต การบันทึกจะใช้เวลา 30 วินาที ผลลัพธ์จะถูกเขียนลงในไฟล์ และไม่มีการบีบอัดข้อมูล ค่าใดต่อไปนี้ใกล้เคียงกับขนาดของไฟล์ผลลัพธ์มากที่สุด?

1) 1.5 ลบ. 2) 3 ลบ. 3) 6 ลบ. 4) 12 ลบ

C) การบันทึกเสียงช่องเดียว (โมโน) ดำเนินการด้วยความถี่สุ่มตัวอย่าง 16 kHz และความละเอียด 32 บิต การบันทึกใช้เวลา 2 นาที ผลลัพธ์จะถูกเขียนลงในไฟล์ ไม่มีการบีบอัดข้อมูล ค่าใดต่อไปนี้ใกล้เคียงกับขนาดของไฟล์ผลลัพธ์มากที่สุด?

D) การบันทึกเสียงแบบช่องเดียว (โมโน) ดำเนินการด้วยความถี่สุ่มตัวอย่าง 16 kHz และความละเอียด 32 บิต การบันทึกใช้เวลา 4 นาที ผลลัพธ์จะถูกเขียนลงในไฟล์ ไม่มีการบีบอัดข้อมูล ค่าใดต่อไปนี้ใกล้เคียงกับขนาดของไฟล์ผลลัพธ์มากที่สุด?

1) 2 เมกะไบต์ 2) 4 เมกะไบต์ 3) 8 เมกะไบต์ 4) 16 เมกะไบต์

คำตอบที่ถูกต้อง:

ก:1; ข:3; ที่ 3; ช:4.

4.2. ปัญหา 2012-A8-2 (ย้อนกลับไปยังปัญหาก่อนหน้า)

A) การบันทึกเสียงแบบช่องสัญญาณเดียว (โมโน) ดำเนินการด้วยความถี่สุ่มตัวอย่าง 16 kHz และความละเอียด 24 บิต ผลลัพธ์จะถูกเขียนลงในไฟล์ที่มีขนาดไม่เกิน 8 MB; ไม่มีการบีบอัดข้อมูล ค่าใดต่อไปนี้ใกล้เคียงกับระยะเวลาสูงสุดที่เป็นไปได้ของส่วนของเสียงที่บันทึกไว้มากที่สุด

B) การบันทึกเสียงแบบสองช่องสัญญาณ (สเตอริโอ) ทำด้วยความถี่สุ่มตัวอย่าง 16 kHz และความละเอียด 24 บิต ผลลัพธ์จะถูกเขียนลงในไฟล์ที่มีขนาดไม่เกิน 8 MB; ไม่มีการบีบอัดข้อมูล ค่าใดต่อไปนี้ใกล้เคียงกับระยะเวลาสูงสุดที่เป็นไปได้ของส่วนของเสียงที่บันทึกไว้มากที่สุด

1) 1 นาที 2) 30 วินาที 3) 3 นาที 4) 90 วินาที

C) การบันทึกเสียงช่องเดียว (โมโน) ดำเนินการด้วยความถี่สุ่มตัวอย่าง 48 kHz และความละเอียด 8 บิต ผลลัพธ์จะถูกเขียนลงในไฟล์ที่มีขนาดไม่เกิน 2.5 MB ข้อมูลจะไม่ถูกบีบอัด ค่าใดต่อไปนี้ใกล้เคียงกับระยะเวลาสูงสุดที่เป็นไปได้ของส่วนของเสียงที่บันทึกไว้มากที่สุด

1) 1 นาที 2) 30 วินาที 3) 3 นาที 4) 90 วินาที

D) การบันทึกเสียงแบบช่องเดียว (โมโน) ดำเนินการด้วยความถี่สุ่มตัวอย่าง 48 kHz และความละเอียด 16 บิต ผลลัพธ์จะถูกเขียนลงในไฟล์ที่มีขนาดไม่เกิน 5 MB ไม่ได้ทำการบีบอัดข้อมูล ค่าใดต่อไปนี้ใกล้เคียงกับระยะเวลาสูงสุดที่เป็นไปได้ของส่วนของเสียงที่บันทึกไว้มากที่สุด

1) 1 นาที 2) 30 วินาที 3) 3 นาที 4) 90 วินาที

คำตอบที่ถูกต้อง:

ก:3; ข: 4 ; ใน 1; ก:1.

5.ส่วนที่เพิ่มเข้าไป. ข้อมูลบางอย่างเกี่ยวกับการบันทึกเสียงดิจิตอล

การแพร่กระจายของเสียงในอากาศถือได้ว่าเป็นการแพร่กระจายของความผันผวนของความดัน ไมโครโฟนจะแปลงความผันผวนของแรงดันให้เป็นความผันผวนของกระแสไฟฟ้า นี่คือสัญญาณต่อเนื่องแบบอะนาล็อก การ์ดเสียงจะสุ่มตัวอย่างสัญญาณอินพุตจากไมโครโฟน ทำได้ดังนี้: สัญญาณต่อเนื่องจะถูกแทนที่ด้วยลำดับของค่าที่วัดด้วยความแม่นยำบางอย่าง

กราฟสัญญาณอะนาล็อก:

การแสดงสัญญาณเดียวกันแบบไม่ต่อเนื่อง (ค่าที่วัดได้ 41 ค่า):

การแสดงสัญญาณเดียวกันแยกกัน (ค่าที่วัดได้ 161 ค่า อัตราการสุ่มตัวอย่างที่สูงกว่า):

จะเห็นได้ว่ายิ่งความถี่ในการสุ่มตัวอย่างสูง คุณภาพของสัญญาณโดยประมาณ (แยกส่วน) ก็จะยิ่งสูงขึ้นตามไปด้วย นอกเหนือจากความถี่ในการสุ่มตัวอย่างแล้ว คุณภาพของสัญญาณดิจิทัลยังได้รับผลกระทบจากจำนวนบิตไบนารี่ที่จัดสรรเพื่อบันทึกค่าสัญญาณแต่ละค่า ยิ่งมีการจัดสรรบิตสำหรับแต่ละค่ามากเท่าไร สัญญาณก็จะสามารถแปลงเป็นดิจิทัลได้แม่นยำมากขึ้นเท่านั้น

ตัวอย่างของการแสดงสัญญาณเดียวกันแบบ 2 บิต (เพียง 4 ระดับขนาดสัญญาณที่เป็นไปได้เท่านั้นที่สามารถกำหนดหมายเลขด้วยสองบิต):

ตอนนี้คุณสามารถเขียนการขึ้นต่อกันสำหรับขนาดของไฟล์ด้วยเสียงดิจิทัลได้แล้ว

file_size = (number_of_values_captured_per_1_second)*

*(number_of_binary_bits_for_recording_one_value)*

*(number_วินาที_ของ_การบันทึก)

เมื่อคำนึงถึงความเป็นไปได้ของการบันทึกเสียงจากไมโครโฟนหลายตัวพร้อมกัน (สเตอริโอ การบันทึกแบบ Quad ฯลฯ) ซึ่งทำเพื่อเพิ่มความสมจริงระหว่างการเล่น เราได้รับสูตร (1)

เมื่อเล่นเสียง ค่าดิจิตอลจะถูกแปลงเป็นอนาล็อก การสั่นสะเทือนทางไฟฟ้าที่ส่งไปยังลำโพงจะถูกแปลงเป็นความผันผวนของแรงดันอากาศอีกครั้ง

การแก้ปัญหาในการเข้ารหัสข้อมูลเสียง.

  1. ส่วนทางทฤษฎี

เมื่อแก้ไขปัญหา นักเรียนจะต้องอาศัยแนวคิดต่อไปนี้:

การสุ่มตัวอย่างเวลา- กระบวนการที่ในระหว่างการเข้ารหัสสัญญาณเสียงต่อเนื่อง คลื่นเสียงจะถูกแบ่งออกเป็นส่วนเวลาเล็ก ๆ ที่แยกจากกัน และสำหรับแต่ละส่วนดังกล่าวจะมีการตั้งค่าแอมพลิจูดที่แน่นอน ยิ่งความกว้างของสัญญาณมากเท่าไร เสียงก็จะยิ่งดังมากขึ้นเท่านั้น

ความลึกของเสียง (ความลึกของการเข้ารหัส) - จำนวนบิตต่อการเข้ารหัสเสียง

จำนวนระดับเสียงที่แตกต่างกันคำนวณโดยใช้สูตร N= 2ฉัน โดยที่ฉันคือความลึกของเสียง

ความถี่ในการสุ่มตัวอย่าง– จำนวนการวัดระดับสัญญาณอินพุตต่อหน่วยเวลา (ต่อ 1 วินาที) ยิ่งอัตราการสุ่มตัวอย่างสูงเท่าไร ขั้นตอนการเข้ารหัสไบนารี่ก็ยิ่งมีความแม่นยำมากขึ้นเท่านั้น ความถี่วัดเป็นเฮิรตซ์ (Hz)

คุณภาพของการเข้ารหัสไบนารี่คือค่าที่กำหนดโดยความลึกของการเข้ารหัสและความถี่ในการสุ่มตัวอย่าง

ลงทะเบียนความกว้าง- จำนวนบิตในรีจิสเตอร์อะแดปเตอร์เสียง ยิ่งความจุหลักมากขึ้น ข้อผิดพลาดในการแปลงขนาดของกระแสไฟฟ้าเป็นตัวเลขแต่ละครั้งก็จะน้อยลงและในทางกลับกัน หากความลึกของบิตเท่ากับ I สามารถรับสัญญาณอินพุต 2 ได้เมื่อทำการวัดฉัน =N ค่าที่แตกต่างกัน

  1. ส่วนการปฏิบัติ การวิเคราะห์และแก้ไขปัญหา

ปัญหาที่ 1 - ประมาณปริมาณข้อมูลของไฟล์เสียงสเตอริโอดิจิทัลที่ยาวนาน 20 วินาทีด้วยความลึกของการเข้ารหัส 16 บิตและความถี่สุ่มตัวอย่าง 10,000 Hz? นำเสนอผลลัพธ์เป็น KB โดยปัดเศษให้เป็นทศนิยมที่ใกล้ที่สุด

เมื่อแก้ไขปัญหาดังกล่าว เราต้องจำสิ่งต่อไปนี้:

โมโน 1 แชนเนล สเตอริโอ 2 แชนเนล

ปัญหาที่ 2 - กำหนดขนาด (เป็นไบต์) ของไฟล์เสียงดิจิทัลที่มีเวลาในการเล่น 10 วินาทีที่อัตราการสุ่มตัวอย่าง 22.05 kHz และความละเอียด 8 บิต

ที่ให้ไว้:

I = 8 บิต = 1 ไบต์

เสื้อ = 10 วินาที

η = 22.05 กิโลเฮิรตซ์ = 22.05 * 1,000 เฮิรตซ์ = 22050 เฮิรตซ์

I - ความลึกบิตของการ์ดเสียง

t - เวลาเล่นไฟล์เสียง

η - ความถี่ในการสุ่มตัวอย่าง

สารละลาย:

V(แจ้ง) = I · η ·t

V(แจ้ง) = 22050 *10 *1 = 220500 ไบต์

ตอบ V(Inform.) = 220500 ไบต์

หา: V(ปริมาณข้อมูล)-?