Next: Considerações Finais Up: Evolução do Padrão MPEG Previous: Camada de Áudio

MPEG-7

Uma grande quantidade de informação áudio-visual está disponível na forma digital, em vários lugares no mundo e muitas pessoas estão querendo usá-las. Antes de ser usada, a informação precisa ser localizada. Atualmente existem soluções que permitem a busca de informação textual. Muitas máquinas de busca são baseadas em texto e estão disponíveis na World Wide Web, e estão na maioria dos sites visitados indicando uma grande demanda. Em geral, não é possivel buscar eficientemente na Web um vídeo, informando somente a imagem da motocicleta usada pelo Exterminador do Futuro. Em casos específicos, soluções existem. As Bases de Dados Multimídias no comércio de hoje permitem a busca de imagens usando características como cor, textura e informação sobre a forma dos objetos em uma determinada figura.

Objetivos

Em 1996, MPEG iniciou um novo trabalho para fornecer uma solução para questões descritas acima. O novo membro da família MPEG chamado de Interface de Descrição do Contéudo Multimídia [4], extenderá as limitadas capacidades das soluções proprietárias na identificação do conteúdo que existem hoje, notavelmente pela inclusão de mais tipos de dados. Em outras palavras: MPEG-7 especificará um conjunto padrão de descritores que podem ser usados para descrever vários tipos de informações multimídias. MPEG-7 padronizará modos de definir outros descritores bem como as estruturas (Esquemas de Descrição) para descritores e seus relacionamentos. Esta descrição estará associada com o conteúdo, para permitir uma busca rápida e eficiente do material de interesse do usuário.

Uma funcionalidade do MPEG-7 é fornecer referências à objetos de outros padrões (PCM, MPEG-1/2/4, ...). Por exemplo, talvez um descritor usado no MPEG-4 é útil no contexto do MPEG-7. Os descritores do MPEG-4, entretanto não dependem nos modos que o conteúdo descrito é codificado ou armazenado. É possível ligar uma descrição MPEG-7 a um filme ou uma imagem que está imprimida em papel.

Ainda que a descrição MPEG-7 não dependa representação codificada do material, o padrão de certo modo está fundamentado no MPEG-4, na qual fornece o significado para codificar o material áudio-visual como objetos tendo certas relações no tempo (sincronização) e espaço. Usando a codificação MPEG-4, será possivel ligar descrições para elementos (objetos) com a cena, tal como objetos audio-visuais. MPEG-7 permitirá diferentes granularidades na sua descrição, oferecendo a possibilidade de ter diferentes níveis de discriminação.

Por isso as características descritivas deve ter um significado no contexto da aplicação, elas serão diferentes para diferentes domínios do usuário e diferentes aplicações.

Isto implica que o mesmo material pode ser descrito usando diferentes tipos de características, ligadas na área da aplicação. Para tomar um exemplo do material visual: um nível de abstração baixo seria uma descrição da forma, tamanho ,cor , movimento e posição. E para o áudio: tecla,tempo, mudanças do tempo, posição no espaço do som. Uma abstração de mais alto nivel daria uma informação semântica: Está é uma cena com um cachorro latindo na esquerda e uma bola azul rolando para a direita, com o som dos carros passando no fundo. Todas estas descrições seriam codificadas de uma maneira eficiente para pesquisa dos usuários.

O nível de abstração está relacionado com a maneira em que as características podem ser extraídas: características de baixo nível podem ser extraídas de forma automática, enquanto as de alto nível necessitam mais da interação humana.

Escopo do Padrão

MPEG-7 atenderá as aplicações que podem estar armazenadas ou fluindo (na rede) e que podem operar em ambientes de tempo real ou não. Um ambiente de tempo real significa que a informação está associada com o conteúdo enquanto está sendo capturada.

O esquema abaixo altamente abstrato, mostra uma possível cadeia de processamento do MPEG-7, incluido aqui o escopo do padrão (descrição).

EXTRAÇÃO DAS CARACTERÍSTICAS ====> DESCRIÇÃO DO PADRÃO ====> MÁQUINA DE BUSCA

Esta cadeia inclue características de extração (análise), a própria descrição, e a máquina de busca (aplicação). Para explorar as possibilidades da descrição MPEG-7, a extração automática dos descritores será extremamente útil. Esta claro que a extração automática não é sempre possivel. Como notado acima, um nível de abstração mais alto, é mais difícil de extrair automaticamente, e ferramentas de extração interativa serão de bom uso. Entretanto algoritmos de extração automática ou semi-automática estão fora do escopo do padrão, bem como as máquinas de pesquisa.

Aplicações

Existem muitas aplicações e domínios de aplicações que serão beneficiadas com o padrão MPEG-7. Abaixo temos alguns exemplos [6]:

A maneira que a informação MPEG-7 será usado para responder as consultas esta fora do escopo do padrão. Em princípio, algum tipo de material áudio-visual será recuperado pelo significado de algum tipo de consulta. Isto significa, por exemplo, que o material de vídeo sera consultado usando vídeo, música, voz, etc. Isto é para a máquina de busca combinar o dado da consulta com a decrição áudio-visual MPEG-7. Abaixo temos alguns exemplos de consultas [5]:

1. Músicas - tocar uma notas no teclado e ter como retorno uma lista de partes musicais, relacionadas com as notas;

2. Gráficos - desenhar algumas linhas na tela e ter o retorno de um conjunto de imagens contendo gr'aficos ou desenhos simlares;

3. Imagens - definir objetos, incluindo cores e texturas e ter como respostas imagens que contenham os objetos que foram definidos;

4. Cenário - descrever ações e buscar uma lista de cenários onde ações similares acontecem;

5. Voz - usando um extrator da voz de Pavarotti, e ter como resposta uma lista de gravações de Pavarotti.

Método e Plano de Trabalho

O metodo de desenvolvimento é comparável a padrões MPEG anteriores. Após definir os requisitos (este proçesso já iniciou), uma Chamada para proposta será lançada. A chamada solicitará por tecnologias relevantes ajustando os requisitos, e após uma avaliação da tecnologia que foi recebida, uma escolha sera feita e o desenvolvimento continuara com mais submissões. Durante o desenvolvimento do padrão, chamadas adicionais pode ser lançadas, quando a tecnologia não não os requisitos [7].

Como este novo trabalho MPEG necessitará de tecnologia disponível em áreas ainda não suficientemente representadas na comunidade MPEG, seria necessário buscar a colaboração de novos especialistas em áreas importantes como bando de dados e inteligência artificial.

O plano preliminar de trabalho MPEG-7 é o seguinte:

- Chamada para Propostas - Novembro 1998;

- Working draft - Julho 1999;

- Commit Draft - Março 2000;

- Draft International Standard - Julho 2000;

- International Standard - Novembro 2000.


Next: Considerações Finais Up: Evolução do Padrão MPEG Previous: Camada de Áudio

Paulo Cesar Salgado Vidal
Tue Dec 23 09:44:25 EDT 1997