(A) :: Porque é que não gostamos de ouvir a nossa própria voz gravada? Uma pista: é mesmo diferente

Porque é que não gostamos de ouvir a nossa própria voz gravada? Uma pista: é mesmo diferente

Diferente e estranha. É assim que parece a nossa voz, quando a ouvimos depois. Não é só uma perceção: o que ouvimos gravado não é igual ao que ouvimos quando falamos.

Sofia Teixeira

text

Inês Correia

illustration

Quando as mensagens de voz do WhatsApp começaram a massificar-se, há uns anos, muita gente confrontou-se com uma estranheza nova: ouvir a própria voz gravada. E a reação inicial de quem não está habituado a ouvir-se de fora — em gravações — foi quase universal: “É assim que a minha voz soa para os outros? Não é isto que eu ouço.”

Não é apenas uma perceção: a voz que ouvimos numa gravação — e que os outros ouvem — é mesmo diferente da voz que ouvimos quando falamos. A explicação é física. Quando falamos, ouvimos a nossa voz de duas formas: através do som que se propaga pelo ar (e é esse som que uma gravação capta) e através das vibrações que provoca nos ossos do crânio e nos tecidos, que também chegam ao ouvido interno.

“A transmissão pelo ar é menos eficaz a transportar sons de baixa frequência por comparação com a condução óssea, ou seja, a transmissão do som através do corpo, dos tecidos e dos ossos”, explica a neurocientista cognitiva Sophie Scott, diretora do Instituto de Neurociência Cognitiva da University College London (UCL), que lidera o grupo de investigação em Comunicação e Fala, onde investiga como o cérebro processa e produz a fala, as vozes e o riso.

Isto significa, explica a investigadora, que, quando falamos, com a ajuda da condução óssea, “ouvimos a nossa voz com um tom mais grave, mais cheio e mais quente”.

Numa gravação, porém, essa componente desaparece. O microfone capta apenas o som que viaja pelo ar e é essa mesma versão que depois ouvimos quando carregamos no PLAY. Como o ar transmite pior as frequências mais graves, a voz gravada perde parte desse “corpo”, soando mais aguda, mais fina ou até um pouco esganiçada, o que não corresponde exatamente à voz que ouvimos dentro da nossa própria cabeça.

“A transmissão pelo ar é menos eficaz a transportar sons de baixa frequência, quando comprada com a condução através dos tecidos e ossos do corpo”, explica a neurocientista Sophie Scott, diretora do Instituto de Neurociência Cognitiva da University College London, onde investiga como o cérebro processa e produz a fala, as vozes e o riso. Isto significa que, quando falamos, com a ajuda da condução óssea, “ouvimos a nossa voz com um tom mais grave, mais cheio e mais quente”. Mais agradável e familiar para o nosso próprio ouvido.

Além desta diferença concreta, sensorial, há outras. Desde logo, no próprio ouvido. “Assim que começamos a falar, os nossos ouvidos passam a responder ao som de forma diferente. Há uma espécie de diminuição — uma supressão — da capacidade do ouvido para transmitir o som quando estamos a falar, provavelmente porque a nossa própria voz já é bastante forte e está muito perto do ouvido”, refere Sophie Scott.

Também as áreas cerebrais que normalmente usamos para processar a voz das outras pessoas reduzem a sua atividade quando somos nós a falar. “Há uma espécie de inibição dessas áreas. Isto parece fazer parte de um mecanismo mais amplo que ajuda o cérebro a distinguir aquilo que vem de nós próprios daquilo que vem do exterior. Por exemplo, quando nos tocamos a nós próprios, a resposta nas áreas sensoriais do cérebro é menor do que se outra pessoa nos tocasse exatamente no mesmo sítio.” Por isso, na prática, nunca ouvimos a nossa própria voz da mesma forma que ouvimos a voz das outras pessoas — tanto por causa das características físicas do som que produzimos, como pela maneira como o nosso cérebro responde a ele.

O desagrado que sentimos ao ouvir a nossa voz gravada vem sobretudo do desencontro entre aquilo que esperamos ouvir e aquilo que realmente ouvimos. Mas quando colocamos essas expectativas de parte, curiosamente, o cenário muda. Foi feito um estudo em que se pedia aos participantes para avaliarem vozes — ou seja, tinham de dizer o quanto gostavam ou não da voz que estavam a ouvir. Entre essas gravações, eram incluídos exemplos da própria voz da pessoa. “O ponto crucial era que os participantes não podiam perceber que era a sua voz. E o que se verificou foi que, quando não a reconheciam, as pessoas avaliavam a própria voz como agradável.”

Com a exposição ao som da própria voz do lado de fora — ou seja, ouvindo-a gravada — a estranheza diminui: em vez de haver só uma familiaridade com o que se ouve do lado de dentro, passa também a tornar-se mais natural o que se ouve do lado de fora.