| Anterior | Seguinte | Índice | Actas do 8º EPCG | Fundo |

3. Processo de Síntese de Som 3D

Por síntese de Som 3D, entende-se um método computacional para criar o som escutado por um espectador num determinado ambiente virtual contendo diversos objectos emitindo sons.

A ideia base consiste em tratar os sons como objectos unidimensionais (dimensão temporal) associados a objectos geométricos num mundo tridimensional. Cada som é um sinal dependente do tempo, e tal como uma textura gráfica, está localizado num determinado objecto geométrico.

O processo de síntese de som tem semelhanças ao processo de síntese de imagem, dado que a natureza física tanto do som como da luz são semelhantes.

O processo de síntese de som 3D pode ser decomposto em quatro fases distintas [Tak92], como se pode observar na figura 2. Seguidamente apresentam-se detalhes acerca da implementação de cada uma das fases referidas.

Fig. 2 - Processo de síntese de Som 3D.

3.1. Criação de Fontes Sonoras

Neste processo, as fontes sonoras são em geral separadas dos objectos que emitem os sons, sendo modeladas individualmente, e numa fase posterior, instanciadas aos objectos. As fontes sonoras são tratadas como uma entidade que reproduz um som monofónico variável no tempo; são consideradas omnidireccionais, ou seja, o som é escutado com a mesma intensidade a partir de qualquer direcção de "observação".

Os sons produzidos pelos objectos são gravados e posteriormente digitalizados segundo um processo de amostragem, de forma semelhante à criação de determinadas texturas a partir da digitalização de fotografias. A amostragem de som é um dos processos mais utilizados para a síntese de som dado que, sendo um processo semelhante à gravação, permite obter resultados de elevada qualidade sem grande carga computacional.

3.2. Instanciação dos Sons aos Objectos

Após a definição das fontes sonoras é necessário instanciá-las aos objectos que geram os sons respectivos. Desta forma, os sons produzidos pelas fontes sonoras instanciadas adquirem as propriedades tridimensionais dos objectos, nomeadamente a sua posição e velocidade. Como analogia ao processo gráfico podemos dizer que esta fase é semelhante à aplicação de texturas às faces dos objectos.

Deve ser também possível modular as fontes sonoras baseando-se em outro tipo de parâmetros de simulação relativos ao objecto. Por exemplo, no caso da modelação de um automóvel, o som produzido pelo motor deve poder ser modulado dinamicamente por determinados parâmetros tais como o regime de rotação e o binário.

3.3. Propagação do Som

Nesta fase do processo de síntese de som, procede-se à avaliação das transformações necessárias para determinar como o som produzido pelas fontes sonoras, que agora se encontram instanciadas num espaço tridimensional, é recebido pelo observador da cena. Mais uma vez, reportando-nos a uma analogia com a síntese de imagem, esta fase é semelhante ao mapeamento de texturas dos objectos geométricos para o plano da imagem.

3.3.1. Microfone Virtual

Nesta fase surge uma nova entidade que é o microfone virtual (análogo à câmara na síntese de imagem), e que representa basicamente uma posição e orientação no espaço tridimensional onde é escutada a sonorização de toda a cena.

No caso de um sistema de síntese de Som 3D, existem em geral vários microfones virtuais, coincidentes com os canais do sistema de som. Assim, em sistemas de campo aberto é conveniente a utilização de um microfone por cada coluna de som.

Fig. 3 - Função de sensibilidade dos microfones.

O efeito de posicionamento dos eventos auditórios é implementado através da função de sensibilidade dos microfones. Quando um determinado evento auditório se encontra numa orientação mais próxima de um microfone do que de outro, a função de sensibilidade produz um valor superior no primeiro caso. Após experimentar outras fórmulas ([ Tak92] e [ Ing] ), obtiveram-se melhores resultados com a seguinte função harmónica esférica (figura 3),

(1)

em que a representa o ângulo de orientação da fonte sonora em relação ao eixo principal de microfone, j o ângulo de abertura deste, e k uma constante que permite configurar a sua direccionalidade.

A função de sensibilidade S(a ) retorna assim valores no intervalo [0,1], obtendo-se 1 para o caso de um ângulo de orientação de 0º (direcção frontal do microfone) e 0 para o ângulo de abertura do microfones. A abertura do microfone permite definir o ângulo máximo de captação de som. Tipicamente, este valor deverá ser escolhido com base na diferença angular entre o microfone e os microfones seguintes.

A utilização do produto de duas funções de sensibilidade (uma horizontal e outra vertical) permite a síntese sonora de pistas de elevação:

(2)

em que a representa o ângulo de orientação horizontal da fonte sonora em relação ao eixo principal de microfone, e o ângulo de elevação desta em relação ao plano horizontal do microfone, j h e j v os ângulo de abertura horizontal e vertical deste, e kh e kv constantes que permitem configurar a sua direccionalidade. Neste caso deve ser utilizado um número superior de colunas de som posicionadas numa esfera à volta do observador.

Para o caso de sistemas de campo fechado, nos quais são utilizados auscultadores para a reprodução do som, a configuração ideal será a de dois microfones situados na mesma posição e com orientações opostas (ou ligeiramente para a frente) e perpendiculares à direcção de orientação do observador, simulando os dois ouvidos de um ser humano. Neste caso não é possível sintetizar sons produzidos acima ou abaixo do utilizador.

3.3.2. Efeitos devidos às Características Geométricas

Certos efeitos acústicos são apenas dependentes das características geométricas dos objectos aos quais está instanciada a fonte sonora, pelo que para o seu cálculo se deduziram algumas expressões simples.

O efeito da distância da fonte sonora ao observador origina uma atenuação de 6 dB no nível de intensidade sonora por cada duplicação da distância [Bla83]. Na implementação, utilizou-se a seguinte aproximação:

(3)

em que NIS(d) representa o nível de intensidade sonora a uma distância d, e NISbase o nível de intensidade sonora a uma distância base a que foi gravado o som da fonte sonora.

Adicionalmente, existe um outro efeito de atenuação dependente da frequência, em resultado da absorção ao longo do trajecto desde a fonte sonora até ao microfone. Este efeito, denominado dispersão atmosférica, funciona como um filtro passa-baixo cuja frequência de corte decresce proporcionalmente com a distância entre ambos [Bla83]. Este efeito verifica-se usualmente apenas para distâncias superiores a 15 m, e pode ser avaliado:

(4)

em que Fcorte é a frequência de corte do filtro, Fmax a frequência de corte máxima e D f a variação na frequência de corte por metro.

Por outro lado, devido à velocidade de propagação do som (343 m/s para o caso da atmosfera a uma temperatura de 20ºC) o sinal gerado por uma fonte sonora é atrasado. Este atraso é implementado através da seguinte fórmula:

(5)

em que t (d) é o atraso a uma determinada distância (d) e c é a velocidade do som.

Quando um determinado objecto se desloca com uma velocidade diferente dos microfones, as ondas sonoras recebidas pelo microfone vão sofrer contracção ou expansão consoante a velocidade relativa. Este fenómeno designado por efeito Doppler [ Par89] , é implementado a partir da velocidade do objecto ao qual está instanciada a fonte sonora, em relação ao microfone, pela seguinte expressão:

(6)

em que fr é a frequência do sinal recebido, fe a frequência do sinal emitido, v a velocidade relativa da fonte sonora em relação ao observador e c a velocidade do som.

3.4. Composição dos Sinais Sonoros

Nesta última fase do processo de síntese de Som 3D, calculam-se as transformações finais a aplicar a cada uma das fontes sonoras e, para cada microfone, misturam-se as contribuições de todas. Este é um processo análogo ao mapeamento de texturas para o espaço imagem em que a sequência de transformações é concatenada de forma a produzir uma única matriz de transformação que é então aplicada à textura. Só nesta fase e após calcular a transformação final é que o sinal sonoro associado é processado.

Uma vez que os sinais de som são aditivos, todos os sinais transformados são adicionados (misturados) para cada um dos microfones, produzindo assim o sinal da cena completa que vai ser reproduzido pela coluna de som (ou auscultador) associado.


| Anterior | Seguinte | Índice | Actas do 8º EPCG | Topo |