Datenkomprimierung

Heutzutage steigt die Leistung der Prozessoren schneller als die Speicherkapazität und viel schneller als die Bandbreite der Netze, da dies enorme Veränderungen in den Infrastrukturen der Telekommunikation erfordert. Um diesem Mangel entgegenzuwirken, ist es üblich, die Größe der Daten zu reduzieren. So wird die Leistung der Prozessoren ausgenutzt, ohne dass eine Steigerung der Speicher- und Datenübertragungskapazitäten erforderlich ist.

Was ist Datenkomprimierung?

Datenkomprimierung (oder auch Datenkomppression) besteht darin, die phyische Größe der Informationsblöcke zu reduzieren. Ein Komprimierer benutzt einen Algorithmus, der dazu dient, die Daten zu optimieren, zu verdichten und dadurch den nötigen Speicherplatz zu reduzieren. Um die ursprünglichen Daten zurückzuholen, ist ein Dekomprimierer erforderlich mit dem umgekehrten Algorithmus im Vergleich zu dem, der für die Komprimierung benutzt wird.

Dabei ist die Komprimierungsmethode abhängig von der Art der zu komprimierenden Daten: ein Bild wird nicht auf dieselbe Art und Weise komprimiert wie zum Beispiel eine Audiodatei.

Charakterisierung der Komprimierung

Die Komprimierung kann durch den Kompressionsquotienten bestimmt werden, das bedeutet der Quotient aus der Anzahl der Bits im komprimierten Bild und der Anzahl der Bits im ursprünglichen Bild.

Die häufig benutzte Kompressionsrate ist das Gegenteil des Kompressionsquotienten, sie wird gewöhnlich in Prozent ausgedrückt.

Arten und Methoden der Komprimierung

Physische und logische Komprimierung

Die physische Komprimierung wirkt direkt auf die Daten ein, es geht also darum, die redundanten Daten von einem Bitstrom zum anderen zu betrachten. Die logische Komprimierung hingegen erfolgt über einen logischen Gedankengang, indem eine Information durch eine gleichwertige Information ersetzt wird.

Symmetrische und assymmetrische Komprimierung

Bei einer symmetrischen Komprimierung wird dieselbe Methode angewandt, um die Information zu komprimieren und dekomprimieren. Derselbe Arbeitsaufwand ist also für jeden dieser Vorgänge erforderlich. Diese Art der Komprimierung wird generell bei Datenübertragungen benutzt.


Die asymmetrische Komprimierung erfordert mehr Arbeitsaufwand für einen der beiden Vorgänge. Man sucht häufig nach Algorithmen, bei der die Komprimierung langsamer erfolgt als die Dekomprimierung. Algorithmen, die bei der Komprimierung schneller sind als bei der Dekomprimierung, können notwendig sein, wenn Daten, auf die man selten zugreift (aus Sicherheitsgründen zum Beispiel), archiviert werden, da dies Kompaktdateien erstellt.

Verlustbehaftete Komprimierung

Die verlustbehaftete Komprimierung (lossy compression) - im Gegensatz zur Komprimierung ohne Verluste (lossless compression) - kann zur Löschung einiger Informationen führen, um eine bestmögliche Komprimierungsrate zu erhalten. Dabei soll ein Ergebnis erhalten werden, das den ursprünglichen Daten so nah wie möglich kommt. Dies ist zum Beispiel der Fall bei bestimmten Bild- oder Tonkomprimierungen wie MP3.

Da diese Komprimierungsart Informationen löscht, die in den zu komprimierenden Daten enthalten sind, spricht man generell von irreversiblen Komprimierungsmethoden.

Ausführbare Dateien können zum Beispiel nicht nach dieser Methode komprimiert werden, da insbesondere ihre Unversehrtheit erforderlich ist, damit sie funktionieren. Es ist in der Tat nicht vorstellbar, ein Programm annähernd neu aufzubauen, indem Bits vergessen oder hinzugefügt werden.

Dafür können Multimediadaten (Audio, Video) ein bestimmtes Verschlechterungsniveau tolerieren, ohne dass die Sensoren (Auge, Trommelfell usw.) eine bedeutende Verschlechterung erkennen.

Adaptive, semi-adaptive und nicht adaptive Kodierung

Bestimmte Komprimierungsalgorithmen basieren auf spezifischen Wörterbüchern mit einer Datenart: Es handelt sich um nicht adaptive Kodierer. Das Vorkommen von Buchstaben in einer Textdatei zum Beispiel hängt von der Sprache ab, in der sie geschrieben ist.

Ein adaptiver Kodierer richtet sich nach den Daten, die er zu komprimieren hat. Er stützt sich nicht auf ein, für einen Datentyp bereits vorbereitetes Wörterbuch.

Ein semi-adaptiver Kodierer konstruiert ein Wörterbuch je nach den zu komprimierenden Daten, indem er die Datei durchläuft und sie dann komprimiert.

Foto: © donets - 123RF.com

Unsere Inhalte werden in Zusammenarbeit mit IT-Experten erstellt, unter der Leitung von Jean-François Pillou, Gründer von CCM.net. CCM ist eine führende internationale Technologie-Webseite und in elf Sprachen verfügbar.
Lesen Sie auch
Das Dokument mit dem Titel « Datenkomprimierung » wird auf CCM (de.ccm.net) unter den Bedingungen der Creative Commons-Lizenz zur Verfügung gestellt. Unter Berücksichtigung der Lizenzvereinbarungen dürfen Sie das Dokument verwenden, verändern und kopieren, wenn Sie dabei CCM deutlich als Urheber kennzeichnen.
Treten Sie der Community bei