imprimir
Audio Digital









As placas de som são a orelha e a boca do computador. Por ela é que entra e sai o som da máquina, sendo ela a responsável pela conversão do som analógico em digital (gravação), e de digital para analógico (reprodução).

Isto significa que, no processo de gravação, a placa de som transforma as informações elétricas enviadas pela mesa de som em dados digitais, e realiza o processo inverso quando for tocar algum arquivo, transformando este arquivo de dados digitais em impulsos elétricos reconhecíveis pelas caixas de som.

Esse processo, como um todo, pode ser visto como um processo de transferência de energia.

Por exemplo:

A energia eletromagnética de um microfone, recebendo as variações do som no ar, transforma estas variações em variações de corrente elétrica, que podem, por aumento de potência, ser transformadas em um movimento semelhante de pressão no ar recebido por um alto-falante. Em todo este processo o que ocorre é apenas transformação de energia mecânica em energia eletromagnética e elétrica. (Pressão --> Tensão Elétrica --> Pressão)

O processo de conversão digital, por sua vez, absorve essas variações na tensão elétrica e guarda estas informações em formatos de arquivo de áudio, como pcm, wav, aiff, ogg e mp3, entre outros. A forma pela qual estes dados são armazenados, ou seja, a qualidade da gravação de uma placa de som, se dá de acordo com dois parâmetros.

Para entender melhor como o som comporta-se dentro do computador estamos acostumados a diversas analogias, algumas delas já muito bem representadas nas interfaces gráficas como as "ondas" e os "gráficos de equalizadores". Por outro lado estes conceitos ainda permanecem bastante abstratos em nossa cultura, e é comum no ínicio do aprendizado da produção sonora buscar-se por maneiras mais intuitivas de trabalhar com estas interfaces.

Pensemos então em algum provável caminho que um usuário iniciante irá fazer "fuçando" nestas interfaces e no hardware disponível para captura e reprodução de aúdio. Durante esta simulação, podemos tentar aos poucos ir aprofundando o conhecimento do processo físico por trás dos procedimentos.

O primeiro fato a ser considerado é que o computador estará funcionando como um "conversor". Mas com que tipos de entradas e saídas este conversor vai trabalhar? Antes de tudo devemos pensar que para transformar a energia elétrica fornecida por um microfone ou instrumento musical e para novamente transformar dados processados em tensão elétrica reconhecível por auto-falantes, o computador "traduz" em uma linguagem compreensível ao seu sistema operacional com um periférico chamado placa de som.

Estas conversões são chamadas Digital-Analógico? e Analógico-Digital?.


Conversões e Medidas



Aqui começamos o trabalho de conceitos importantes. Considere estes processos como processos de "transformação de energia". A diferença entre estas transformações pode ser pensada da seguinte maneira:

Análogico:

Pode ser visto como um processo onde existe uma relação direta com as medidas transformadas, incluindo aí medidas fracionárias infinitesimais. O importante a se pensar é que existe uma "analogia" direta de uma energia com a outra por escalas equivalentes. Por exemplo: A energia eletromagnética de um microfone, recebendo as variações do som no ar, transforma estas variações em variações de corrente elétrica, que podem diretamente por aumento de potência serem tranformadas em um movimento semelhante de pressão no ar recebido por um alto-falante. Em todo este processo o que ocorre é apenas tranformação de energia mecânica em energia eletromagnética e elétrica feita por meio de equivalencias de "escalas" de medida (Pressão --> Tensão Eletrica --> Pressão).



se você ligar um microfone num multimêtro, vai perceber que ele produz voltagens prontas para serem convertidas em outras formas de energia. Escalas analógicas são absolutas e podem ser representadas diretamente pelo conjunto de números que chamamos de "reais".


Digital:

Este processo guarda estas "escalas" de medida em um protocolo que tem uma raiz comum - uso da linguagem binária computacional. Para sermos mais diretos podemos pensar como linguagens deste tipo os formatos de arquivo de áudio que seu sistema operacional pode coomprender como pcm, wav, aiff, ogg, mp3 e outros. Estes padrões serão gerados a partir da tal conversão " Análogico--> Digital" que é feita pelo periférico "placa de som" e mapeado para a memória temporaria de seu computador ( memória RAM ) e/ou gravado no seu disco Rígido (HD) e logo em seguida (ou depois no caso de um gravação) convertido pelo processo "Digital-->Analógico" para a tensão eletrica de seus alto-falantes.



Sua placa de Som faz a conversão de Análogico para uma linguagem Binária, que seu computador pode lidar.

Pensando na maneira como ocorre esta "captura" e este processamento podemos entender melhor o que querem dizer algumas medidas que constantemente são encontradas em especificações técnicas de um placa de som e na configuração de softwares que reproduzem ou gravam este processamento.

Antes de procurarmos por isto nas interfaces dos softwares e em alguns procedimentos que isto implica, vamos analisar dois conceitos básicos para a compreensão da digitalização do aúdio:

Bitrate e Samplerate.




Bitrate:

Esta é a medida da definição da amostra. Se você ja olhou imagens fotográficas no computador de perto ja viu pequenos quadradinhos de cor chamados "pixels". Esta é uma boa analogia com o som digital. Quanto mais "pixels" você usa para uma imagem, mais definição ela vai ter na impressão gráfica. Pense em um gráfico que diz o quanto seu alto-falante vai mover-se em função do tempo. Quanto mais pontos tiver neste gráfico entre um número e outro, mais "suave" ou "arredondada" será a transição. Portanto o bitrate da "amostra" (conceito tratado abaixo) pode ser considerado como a definição em bits (pequenas unidades de informação mínima na lógica do computador) de transições entre os parâmetros do som a ser reproduzido ou gravado.





Samplerate:

Esta medida está relacionada diretamente com a "velocidade" da captura de uma "amostra" de determinada "definição"( bitrate) em uma medida de tempo. Esta medida é dada em hz(hertz), onde cada unidade equivale a 1 ciclo por segundo. Portanto, Se estamos trabalhando com
44100 hz de Samplerate e 24 bits de Bitrate, isto quer dizer que a cada segundo estamos capturando 44100 amostras de 24 bits.

Algumas idéias sobre estas medidas:


  • Apesar de alguns aparelhos de som digitais trabalharem com bitrate de 32 bits e também o DVD, ainda temos um grande empecilho que torna este uso bastante reservado aos aparelhos de alta fidelidade: A mídia CD, quando gravada para aparelhos comum de áudio só pode gravar e reproduzir sons no formato .cda, que trabalha com 16 bits. Por isto existe um processo muito usado e que requer bastante cuidado nas masterizações chamado "dither", palavra usada em algoritmos de computação para processos onde existe uma redução de numero de bits em uma amostra, o que torna necessário este "filtro", para "arredondar" o caminho entre dois pontos ( onde antes haviam mais - portanto maior precisão).

  • A audição humana é capaz de perceber freqüencias que vão de 20hz(grave) até 20.000hz(agudo). Isto quer dizer que o som grave, equivale a uma vibração "lenta" no ar (20 vibrações por segundo) e a aguda seria uma vibração "rápida". A maneira com que percebemos a complexidade destes sons criando a idéia subjetiva de "timbre" ou "textura sonora" está diretamente relacionado com a percepção destas "sobreposições" de vibrações no ar.

  • É curioso portanto perguntar-se: Se só ouvimos até 20.000hz por que precisamos de placas de som e softwares que trabalham com sample rate maiores que a maior frequência audível como o padrão 44.000 hz e hoje em dia já 46.000,96.000 e até 192.000 hz ? A resposta está em um fenômeno físico chamado "foldover". Com o uso de captadores e microfones cada vez mais sensíveis, podem ocorrer captações de frequencias que estão acima da audição humana, mas são incapazes de serem mapeados pelo samplerate (pois são "mais rápidas que a placa de som"). Estas frequencias entrariam na gravação como ruído, que em alguns casos pode prejudicar timbres da gravação. Obviamente se você estiver usando microfones não tão sensíveis, ou não estiver preocupado com uma "estética da perfeição" o sample rate acima de 96.000 hz passa ser apenas um luxo que no caso de máquinas com menos processamento pode fazer bastante diferença na performance. Vale a pena experimentar e testar resultados na prática.

  • Podemos pensar nestes fatores como determinantes na performance de seu computador com áudio. Existe um termo que você vai ouvir muito em produção sonora: Latência.

Latência pode ser vista como o intervalo de tempo entre o pedido que é feito para interface de executar ou gravar um som e a execução do comando de fato. Pense por exemplo no uso do computador como um módulo de timbres para um teclado MIDI.
Você não pode ter um atraso perceptível ao ouvido humano no tempo em que voce pressiona uma nota dó do teclado e o tempo que o computador executa esta nota no autofalante. Por isso, quando trabalhando com um equipamento que não tem um " super processador", sempre é bom estar preocupado com as configurações de paramêtros de captura.


Configurações do Jack e uso da placa de som com módulos ALSA


Para colocar em prática estes conhecimentos, recomendo que você também de uma olhada nos tutoriais sobre o servidor de transporte de áudio JACK e sobre o suporte a placas de som com os módulos ALSA.

Última alteração: 30/10/2006 às 19:50, por: glerm