top of page

VÍDEO

A codificação vídeo pode ser definida como a representação eficaz de uma sequência de imagens relacionadas, satisfazendo requisitos de qualidade, sendo que estes requisitos variam em função do serviço/aplicação.

Em televisão digital, a captação da luminância e das crominâncias não são feitas continuamente, passando-se a amostrar estas grandezas em pontos e a quantificar esses valores.

Cada imagem é dividida em blocos de 8x8 (cada bloco é uma sample/amostra).

Isto significa que cada imagem pode ser vista como uma matriz de pontos, sendo que cada ponto é representado por um valor de luminância e dois de crominância.

Existem diferentes formatos de subamostragem da cor:

  • 4:4:4 -   Luminância e crominância com o mesmo número de samples. Este formato é usado quando se pretende uma qualidade bastante alta (aplicações profissionais, …).

  • 4:2:2 -   Luminância com o dobro do número de samples de cada crominância, sendo que a crominância tem o mesmo número de linhas mas metade das samples por linha. É também vocacionada para qualidades altas (HDTV por exemplo).

  • 4:2:0 -   Luminância com 4 vezes o número de samples de cada crominância. As crominâncias têm metade das linhas e metade das samples por linha. É direcionado para situações em que não seja necessária uma qualidade alta (televisão digital, streaming em dispositivos móveis, …).

Podemos dizer que o codificador vai obter a compressão de um conteúdo vídeo explorando o conceito de redundância e irrelevância, logo, a manipulação destes conceitos é crucial:

  1. Redundância espacial -     explora as semelhanças, relações e previsibilidade das amostras dos dados da imagem, ou seja, aproveita a redundância que é esperada entre pixéis vizinhos. O sinal é representado segundo a matriz DCT (Discrete Cosine Transform). Temos como exemplo o JPEG Standard, que é baseado nesta codificação. Através do DCT, as imagens passam a ser representadas em função de uma matriz de blocos 8x8, sendo que cada bloco é uma variação sinusoidal de luminosidade

DCT

  1. Redundância temporal -considerando um vídeo, é habitualmente percetível a similaridade entre duas imagens sucessivas, sendo esta correlação entre imagens aproveitada. Este aproveitamento é feito através de previsões de movimento, utilizando vetores de movimento.

  2. Irrelevância - está relacionada com as partes da informação que são impercetíveis para a visão humana, tornando-se por isso desnecessárias para a nossa observação do conteúdo visual.

Geralmente os codificadores usam três tipos de tramas para codificar sequências de vídeo:

  1. Trama I -            Intra frames, não exploram redundância temporal. Têm fatores de compressão mais baixos que os restantes. São essenciais para garantir random access ao conteúdo (começar a ver em qualquer parte do vídeo e poder andar para a frente ou para trás no mesmo).

  2. Trama P -           Predicted frames, exploram redundância temporal, fazem previsão com base em imagens anteriores do tipo P e I.

  3. Trama B - Bidirectionally predicted frames, fazem previsões com base tanto em imagens anteriores como posteriores de imagens do tipo I e P. Oferecem os fatores de compressão mais elevadas.

O Group of Pictures agrupa as tramas I e os seus dependentes P e B:

 

 

 

 

 Vamos então agora abordar as técnicas de compressão a nível do áudio, em relação às normas MPEG-2 e MPEG-4. Tal como observámos na codificação vídeo, a compressão áudio continua a explorar a redundância e a irrelevância dos dados, sendo que nesta componente, a irrelevância tem muito mais importância.

 

O MPEG-2 e o MPEG-4 utilizam o formato de compressão AAC (Advanced Audio Coding), que é definida na parte 7 do MPEG-2 e na parte 3 do MPEG-4.

Na Parte 3 (ISO/IEC 13818-3), o MPEG-2 já trazia inúmeras vantagens sobre o MPEG-1: codificação de áudio em mais de 2 canais (5 canais mais um de baixa frequência) e compatível com MPEG-1. Apresentava os seguintes ritmos de amostragem: 16, 22.05 e 24 kHz (cerca de metade dos do MPEG-1).

Na Parte 7 (ISO/IEC 13818-7), quando foi implementado o  AAC, apresentava um maior ritmo de distorção, obtendo uma qualidade mais elevada para o mesmo ritmo. Suporta até 48 canais áudio com banda completa, com ritmos de amostragem entre 8 e 96 kHz, além de 16 canais de baixa frequência.

14.png

Os primeiros sistemas IPTV utilizavam o padrão de codificação MPEG-2. Apresenta uma qualidade bastante aceitável, apesar de pequenas perdas (é uma compressão lossy, ou seja, o conteúdo codificado não preserva toda a informação inicial, o que resulta em ténues diferenças entre a imagem original e aquela depois de comprimir, apesar destas diferenças serem pouco notórias). Tem um débito de.transmissão entre 3 e 6 Mbit/s para SDTV e  entre 16 e 19 Mbit/s para HDTV.

Esta norma é ainda muito usada como formato dos sinais digitais televisivos, tanto em sinais terrestres tradicionais, tal como por cabo ou satélite, assim como é usado em DVD ou Blu-Ray. Ainda hoje, é a norma de codificação e compressão de vídeo mais utilizada [dissertação Arquitectura SIP IPTV para Redes Heterogéneas https://fenix.tecnico.ulisboa.pt/downloadFile/395138343707/dissertacao.pdf].

[1]  MPEG-2

Em 1998, surge o MPEG-4, de forma a responder às crescentes exigências dos utilizadores. Esta norma veio introduzir melhor codificação de vídeo e melhores níveis de compressão.

O MPEG-4 Parte 10 (H.264/AVC), introduzido em 2003, é atualmente o codec mais utilizado pelas empresas de fornecimento de serviço IPTV. Utiliza o codificador de vídeo AVC (Advanced Video Coding), que apresenta elevados fatores de compressão. O H.264 foi pensado para assegurar funcionalidades similares às normas anteriores mas com ganhos de compressão superiores e eficiência elevada, sem afetar a qualidade. Esta versão tem uma qualidade semelhante à do MPEG-2, mas com sensivelmente metade do custo de transmissão (metade do bitrate). Por estas razões, o H.264 acaba por ser muito utilizado em streaming de vídeo. Apesar de ser usado principalmente em compressão lossy, também é possível criar regiões lossless, ou seja, que preservem a informação toda sem perda de dados entre as imagens codificadas.

Tem um débito de.transmissão entre 1.5 e 2 Mbit/s para SDTV e  entre 6 e 8 Mbit/s para HDTV (taxas de transmissão aproximadamente metade do MPEG-2).

16.png

[2]  MPEG-4

WhatsApp Image 2019-05-23 at 02.44.50.jp

[3]  Comparação débito binário entre MPEG-2 e MPEG-4/H.264

15.jpg

[4] Diferença de qualidade entre MPEG-2 e MPEG-4

bottom of page