A compressão de dados é um processo em que o tamanho de um ficheiro é reduzido ao recodificar os dados do ficheiro para utilizar menos bits de armazenamento do que o ficheiro original. Um componente fundamental da compressão de dados é que o ficheiro original pode ser transferido ou armazenado, recriado, e depois utilizado mais tarde (com um processo chamado descompressão).
Um breve histórico de compressão de dados
À medida que a Internet foi surgindo nos anos 70, a relação entre o tamanho do ficheiro e a velocidade de transferência tornou-se muito mais aparente. Os matemáticos de todo o mundo abordaram o problema durante anos, mas só quando os algoritmos universais de compressão sem perdas Lempel-Ziv-Welch (LZW) entraram em cena em meados da década de 1980 é que os benefícios reais se concretizaram. A compressão LZW foi o primeiro método de compressão de dados amplamente utilizado implementado em computadores e ainda hoje é utilizado (em várias iterações): um grande ficheiro de texto em inglês pode tipicamente ser comprimido até cerca de metade do seu tamanho original com LZW.
Código de endosso, inventado em 1838, é a primeira instância de compressão de dados na medida em que as letras mais comuns na língua inglesa, tais como “e” e “t” recebem códigos Morse mais curtos.
Algoritmos comuns de compressão de dados incluem:
- Zip
- bzip2
- 7-zip
- jpeg
- mpeg
Tipos de compressão de dados
Hoje em dia, existem muitos tipos diferentes de algoritmos e implementações que permitem ao utilizador quotidiano comprimir ficheiros, mas alguns são mais adequados para certas aplicações. Para compreender melhor a compressão de dados em geral, é mais fácil dividir o processo em dois grupos principais: compressão com perdas e compressão sem perdas.
Compressão com perdas
Compressão com perdas reduz o tamanho do ficheiro ao remover pedaços desnecessários de informação. Este tipo de compressão é mais comumente utilizado em ficheiros de imagem, vídeo e áudio, onde não é necessária uma representação perfeita do suporte de origem.
Por exemplo, um ficheiro de áudio MP3 não contém toda a informação de áudio da gravação original. Em vez disso, a compressão perdida do MP3 remove sons que os humanos não conseguem ouvir. Uma vez que o ouvido humano médio não notaria esta diferença, o resultado é um ficheiro mais pequeno com um impacto mínimo para o utilizador.
O lado negativo? Quanto mais pesado é um ficheiro comprimido com compressão com perda, mais perceptível se torna a redução da qualidade. Além disso, a compressão com perdas não funciona bem com ficheiros onde todos os dados são cruciais (por exemplo, comprimir uma folha de cálculo produziria resultados inutilizáveis).
Compressão sem perdas
Compressão sem perdas reduz o tamanho do ficheiro sem remover quaisquer pedaços de informação. Em vez disso, este formato funciona através da remoção de redundâncias nos dados para reduzir o tamanho global do ficheiro. Com a compressão sem perdas, é possível reconstruir perfeitamente o ficheiro original.
Por exemplo, o formato de compressão sem perdas (ZIP) mais comum é frequentemente utilizado para ficheiros de programas no Windows, uma vez que preserva toda a informação original. A descompressão do ficheiro (descompressão) produz um programa executável que de outra forma seria inútil com lossy.
Os formatos comuns sem perdas incluem PNG para imagens, FLAC para áudio, e ZIP. Os formatos sem perdas para vídeo são raros, pois os ficheiros fonte ocupariam enormes quantidades de espaço.
Limitações de compressão de dados
É importante notar que a compressão não é infinita. A compressão de um ficheiro num ZIP pode reduzir o seu tamanho, mas é impossível continuar a comprimir mais o ficheiro e reduzir o tamanho a nada.
Também é importante compreender a relação entre os dois grupos de compressão de dados:
- Sim: Converter ficheiros sem perdas em ficheiros com perdas
- Sim: Converter um formato sem perdas para outro formato sem perdas é bom
- Não: Conversão de ficheiros sem perdas em ficheiros sem perdas (formatos sem perdas deitam fora os dados; é impossível recuperar esses dados)
- Não: Conversão de um formato sem perdas para outro formato sem perdas
Uma palavra final sobre compressão de dados
Como funciona a compressão de dados de um ponto de vista técnico? Bem, os algoritmos reais que decidem que dados são deitados fora (em métodos com perdas) e como melhor armazenar dados redundantes (em compressão sem perdas) são extremamente complicados. Esta visão geral da compressão de dados destina-se a servir como uma visão geral de alto nível dos conceitos básicos e fornecer contexto para a aplicação destas práticas em situações do mundo real.
Continuar a Leitura
- SASE. O que é. O que não é.
li>Li>Os profissionais de TI da empresa continuam a concentrar-se em resultados empresariais tangíveis em 2021li>Top 5 posts do blog NetMotion de 2020li>451 Pesquisa sobre SASE, VPN, confiança zero e o futuro da segurança das redesli>Voices of NetMotion: o que a diversidade significa para nós