Komprese dat

From Necyklopedie
Jump to navigation Jump to search
Měřič komprese.

Komprese dat (také komprimace dat, stlačení dat a shňácání dat) je metoda hodně podobná stlačování stlačitelných látek – plynů, gumy a spousty jiných věcí. Protože jsou ale data velmi těžce stlačitelná, běžné kompresory a dmychadla na jejich stlačení nestačí.

Historie[edit | edit source]

První komprese dat se začaly objevovat s rozšířením počítačů, ale k jejich masivnímu využití došlo až s příchodem internetu. Zpočátků byla na starých počítačích komprese dat velmi pomalá a procesory se velmi rychle zahřívaly. Toho se hojně využívalo k topení v kancelářích po celém světě. Šlo o relativně levný způsob výroby tepla, stačil k tomu jakýkoliv levný počítač podporující první verze Windows s nainstalovanou dnes již zapomenutou aplikací MS Office Heating. Program byl velmi jednoduchý, stále dokola spouštěl kompresi dat v nekonečné smyčce.

Později výrobci přišli na trh se speciálně upravenými verzemi svých procesorů. Jednalo se například o legendární Intel Pentium II Turbo (přídavek turbo v názvu napovídá, že je procesor optimalizovaný pro rychlý běh komprese dat). Dnes už je TURBO komprese dat běžná na všech moderních procesorech.

Teorie komprese[edit | edit source]

Visual data compression scheme.
Názorné schéma komprese dat. Z angličtiny přeložil Google translator.

Princip komprese si můžeme vysvětlit na několika jednoduchých příkladech:

Bezeztrátová komprese[edit | edit source]

  • Žák o přestávce před hodinou narychlo od spolužáka opisuje domácí úkol. Času je málo, proto vynechává nepodstatné údaje a opíše jen ty důležité.
  • Výhody:
    • Rychlé opsání
    • Zkrácení textu
  • Nevýhody:
    • Úkol není napsán krasopisně (ale to se nevyžaduje)
    • Chybí některá přídavná jména a citoslovce.

Ztrátová komprese[edit | edit source]

  • Žák o přestávce opisuje domácí úkol. Do zvonění zbývá poslední minuta, rozhodne se proto opsat jen každý druhý řádek.
  • Výhody:
    • Velmi rychlé opsání
    • Podstatné zkrácení textu
  • Nevýhody:
    • Úkol jde přečíst jen s obtížemi nebo vůbec
    • Chybí polovina textu, takže zbytek většinou nedává smysl
    • Není možná jakákoli dekomprese (zpětná rekonstrukce stlačených dat)
    • Žák dostane přinejlepším čtyřku (jestli se to bude známkovat)

Vícestupňová komprese[edit | edit source]

  • Další žák si opíše už jednou opsaný úkol od předchozího spolužáka a vypustí další informace. Za předpokladu, že si tímto způsobem domácí úkol opíše celá třída, vznikne z původního textu na formátu A4 písmem Arial 12 pouze jedna čí dvě věty, které budou naprosto vytržené z kontextu a pravděpodobně spolu nebudou vůbec souviset.

Proto se určuje takzvaný kompresní poměr. Ve školním přirovnání jde o známku, jakou žák dostane. Vypočítá se podle vzorce počáteční velikost / výsledná velikost. Má-li tedy mít úkol deset stran a žák jej zkomprimuje na pouhé dvě strany, dostane 10 / 2 = 5.

Praktické použití v běžném životě[edit | edit source]

  • Programátor volá do knihovny:

"Prosím Vás, je tam Pavla?" "Je v archivu." "Prosím, rozzipujte ji, velmi nutně s ní potřebuji mluvit."

Zkomprimuj taky[edit | edit source]

Počítače
Ělěktronika 666

Počítače: AbakusAcerAppleBarbie PCCMEUDellDetektor lžiElektronika 666HPIntelKlapkobřinkostrojLenovoNový JeruzalémRačunik-RTuringův strojUral 2
Hardware: Caps LockCD-RWDěrná páskaF13iPrdKompresorPaměť ROOMScroll lockŠkoda 1000MBŠkvorPaměť WOM
Software: BSODBIOSEmacsKVGRESETЛинуксMicrosoft WordMooreův zákonPoznámkový blokPřekladSvatý TučňákVálka s švábyWindowsVistaRay Tracing
Programování: BrainfuckC SharpC++DebuggerJavaLispnOTHINGOpenOSTRAJavaPočítačová lingvistikaProgramátor obecnýVánočková architektura
Aplikace: AhE-mailEndInternetKomprese datRodné čísloTrabant AussichtDOSBoxDvě minuty nenávisti