Sprachcodierung Analog zu Digital: Unterschied zwischen den Versionen

Aus Xinux Wiki
Zur Navigation springen Zur Suche springen
Zeile 54: Zeile 54:
 
{{#drawio:analog-digital-7}}
 
{{#drawio:analog-digital-7}}
 
=Quantifizierung des Signals=
 
=Quantifizierung des Signals=
 +
*Bei der Quantisierung wird die Y-Achse in 256 Schritte aufgeteilt, um die kontinuierlichen Werte diskret darzustellen.
 +
*Die Abtastwerte werden auf den nächstgelegenen Schritt gerundet, da die diskrete Darstellung nur eine begrenzte Anzahl von Werten zulässt.
 +
*Dieses Runden führt jedoch zu einer Ungenauigkeit der Abtastwerte, da die kontinuierlichen Werte auf diskrete Werte abgebildet werden und somit eine gewisse Abweichung entsteht.
 
{{#drawio:analog-digital-8}}
 
{{#drawio:analog-digital-8}}

Version vom 18. Juni 2023, 10:39 Uhr

Prinzip

  • Ein Mensch spricht in ein Analog Telefon.
  • Die Wellen werden in analoge elektrische Wellen umgewandelt
  • Diese werden vom Analog-Digital-Wandler in ein binäres Format umgewandelt.

Analoges Telfon an einer VoIP Anlage

IP Telfon an einer VoIP Anlage

Konversion

Abtastung (Sampling)
  • Das kontinuierliche Signal wird in diskrete Abtastwerte umgewandelt, die zu bestimmten Zeitpunkten gemessen werden.
Quantisierung
  • Die diskreten Abtastwerte werden auf eine begrenzte Anzahl von diskreten Werten abgebildet, um die Auflösung des digitalen Signals zu bestimmen.
Codierung
  • Die quantisierten Werte werden in eine geeignete digitale Darstellungsform codiert, normalerweise durch die Verwendung des binären Zahlensystems.
Kompression
  • Optional kann eine Datenkompression angewendet werden, um die Größe der digitalen Daten weiter zu reduzieren.
  • Hierbei werden verschiedene Kompressionsalgorithmen verwendet, um redundante oder nicht wesentliche Informationen zu entfernen.

Encoding

Dekompression
  • Wenn die Daten zuvor komprimiert wurden, muss der erste Schritt bei der Encodierung die Dekompression sein.
  • Hierbei werden die komprimierten Daten wiederhergestellt und in ihre ursprüngliche Form gebracht, um alle entfernten Informationen zurückzugewinnen.
Decodierung
  • Nach der Dekompression werden die codierten Daten in die ursprünglichen quantisierten Werte umgewandelt.
  • Dieser Schritt erfolgt durch die Umkehrung des Codierungsschritts, bei dem die binären Codes in diskrete Werte zurückübersetzt werden.
Invers-Quantisierung
  • Nach der Decodierung werden die quantisierten Werte in ihre ursprünglichen kontinuierlichen Werte zurückgewandelt.
  • Dieser Schritt beinhaltet die Zuordnung der quantisierten Werte zu den entsprechenden Wertebereichen und die Wiederherstellung der Feinheit der ursprünglichen Abtastwerte.
Rekonstruktion
  • Schließlich wird das kontinuierliche Signal durch die Zusammenfügung der invers-quantisierten Werte wiederhergestellt.
  • Hierbei werden die diskreten Werte zu ihren ursprünglichen Zeitpunkten zusammengefügt, um das rekonstruierte kontinuierliche Signal zu erhalten.

Sampling des Signals

  • Das analoge Signal wird bei jedem T-Signal abgetastet
  • Die Qualität wird durch die Rate der Abtastung bestimmt.
  • Gemäs Nyquist Theorem sollt die Abtastrate das doppelte der höchsten Frequenz sein.

Auswirkung der Samplingrate auf das Signal

Festlegen der Samplerate

  • Die menschliche Sprache hat eine typische Frequenz von 9000 Hz.
  • Um gemäß dem Nyquist-Shannon-Abtasttheorem zu arbeiten, sollten wir die Abtastrate verdoppeln.
  • Die würdezu einer Abtastfrequenz von 18000 Samples pro Sekunde führen.
  • Jedoch würde dies ein zu hohen Bandbreitenbedarf pro Anruf bedeuten.
  • Aufgrund der technischen Beschränkungen der damaligen Telefonie konnte die Übertragung nur Frequenzen im Bereich von 300 Hz bis 3400 Hz wiedergeben.
  • Aus diesem Grund hat Nyquist den Wert für das Sampling auf 4000 Hz oder 8000 Samples pro Sekunde festgelegt.
  • Durch diese Begrenzung wurde sichergestellt, dass die relevanten Frequenzkomponenten der menschlichen Sprache erfasst und übertragen werden konnten, ohne unnötigen Bandbreitenbedarf zu verursachen.

Frequenzen

  • Menschliche Sprache: 200 – 9000 Hz
  • Menschliches Gehöre: 20 – 20.000 Hz
  • Traditionen Telefonie: 300 – 3400 Hz
  • Nyquist: 4000 Hz und eine Sampling Rate von 8000 per Sekunde.

Quantifizierung des Signals

  • Bei der Quantisierung wird die Y-Achse in 256 Schritte aufgeteilt, um die kontinuierlichen Werte diskret darzustellen.
  • Die Abtastwerte werden auf den nächstgelegenen Schritt gerundet, da die diskrete Darstellung nur eine begrenzte Anzahl von Werten zulässt.
  • Dieses Runden führt jedoch zu einer Ungenauigkeit der Abtastwerte, da die kontinuierlichen Werte auf diskrete Werte abgebildet werden und somit eine gewisse Abweichung entsteht.