O conceito básico da funcionalidade do MPEG-4 baseada no conteudo para
aplicações de vídeo é ilustrada nas seguintes figuras:
Figura 2 - Cena Original
Figura 3 - Cena decodificada e manipulada
A cena contém um certo número de objetos de vídeo. A
sequência é decodificada de maneira que permite ao usuário separar
decodificação e reconstrução dos objetos. É possível
interagir com o objeto na cena. Uma possível lista de
manipulações do objeto pode ser: mudança da posição,
mudança da escala do objeto, rotação do objeto, mudança da
velocidade na qual o objeto se move na tela, inclusão de um objeto na cena
e exclusão de um objeto.
Um fluxo de bits (bitstream) dos objetos em camadas fornecem estas
funcionalidades. Cada objeto é codificado em uma camada bitstream
do objeto. A forma e a transparência do objeto, bem como coordenadas
espaciais e parâmetros adicionais descrevendo escalas e
localização, tais como zoom, rotação e translação do
objeto estão incluindo no fluxo de bits. O usuário reconstrói a
sequência pela decodificação das camadas de objetos.
O padrão MPEG-4 consiste de três camadas: Sistema, Áudio e
Vídeo, nas seções seguintes serão descritas estas camadas.