jueves, 3 de octubre de 2013

Conceptos Técnico: Diseño de Sistemas de Sonido

- Potencia Admisible:
Las potencias que sean capaces de soportar los diferentes componentes del gabinete deben mantener una relación equilibrada, por lo que es necesario aumentarla a medida que disminuye el rango de frecuencias de los transductores. El resultado del conjunto debe hallarse en concordancia con las necesidades de la instalación, tamaño de la audiencia, tipo de programa,
etc.

Normalmente, se intercala en el sistema un procesador que permita la compresión del rango dinámico. En general, desde el punto de vista del gabinete, la compresión de los niveles de presión sonora moderadamente altos no representan un problema, mientras que la destrucción de sus componentes por un exceso de potencia, no permitirá reproducir señal alguna.


Sensibilidad y Eficiencia


La decisión entre el uso de un parlante grande o uno chico dependerá de la potencia y del nivel de presión sonora necesarios para una correcta audición. Los parlantes grandes son eficientes, es decir, capaces de producir de 95 a 100 dB a 1 m. de distancia para 1 W eléctrico aplicado. Los pequeños, menos eficientes, en el mismo ancho de banda producirán entre 82 y 90 dB / 1 m. / 1 W. En resumen, los primeros presentan 10 dB o más de sensibilidad que los segundos.

A fin de poder seleccionar correctamente las sensibilidades necesarias para los niveles deseables de un sistema, debemos tener presente que:

A) El nivel SPL para una potencia PX (W) se calcula como:
SPLX = SPL1m + 10 log (PX/1W)

B) El nivel SPL a x metros de la fuente, para 1 W eléctrico, se calcula como:
SPLX = SPL1m + 10 log (1 m /x)2


Ejemplo de cálculo:
En un control de estudio es común tener valores que superan los 100 dB de nivel promedio. Teniendo en cuenta que en una cinta master o en una grabación digital, los valores picos se encuentran entre 15 y 20 dB sobre el promedio y aplicando las ecuaciones dadas, podemos plantear dos casos:

Caso 1: Sensibilidad de los parlantes: 85 dB/ W/ m.
• Para este valor de sensibilidad, a 3 metros del gabinete tendremos alrededor de 75 dB para 1 W eléctrico, por lo que para llevar el nivel a 90dB, necesitaremos + 15 dB o 32 W promedio y para asegurar los picos de +20 dB adicionales, 3200 W, es decir un valor inadmisible.

Caso 2: Sensibilidad de los parlantes: 98 dB/ W/ m.
• A 3m. tendremos 88 dB y +2dB o 1,6 W para llegar al valor propuesto de 90 dB.
• El valor pico de +20 dB requerirá 160 W, valor éste mucho más accesible.
• La conclusión final es que la ilusión de una audición de alta fidelidad requiere al menos de dos factores: buena respuesta y capacidad de rango dinámico, lo que incluye una buena respuesta a los picos con baja distorsión.
• Este comportamiento no se logra fácilmente con parlantes chicos por lo que los grandes resultarán la mejor elección.
Divisores pasivos


Un divisor pasivo es aquél que no requiere alimentación externa, siendo su proposito ordenar el funcionamiento de los distintos radiadores que integran un sistema. Cada transductor, sea dinámico, electrostático, magnético o piezo, es capaz de producir solo un limitado rango de frecuencias, por lo que su utilización fuera de éste, deteriorara el rendimiento, la potencia y la respuesta.

Esto es la razón por la que un sistema de parlantes se construya utilizando múltiples transductores optimizados para un rango específico de frecuencias, de tal manera que el conjunto cubra el espectro completo. Los divisores (Crossovers) direccionan la potencia entrante hacia el
transductor apropiado, de acuerdo a sus características de respuesta en frecuencia.

Debido a su naturaleza, está formado por un conjunto de filtros eléctricos.
• Su otra función es la de proteger los transductores.
• Una nota baja de alta potencia puede destruir facilmente el delicado domo de un tweeter dinámico, independientemente de que éste no sea capaz de reproducirla.
• Un divisor de frecuencias pasivo (passive crossover network) es un circuito con dos o más componentes reactivos, es decir un filtro eléctrico que asigna a cada reproductor la banda apropiada de frecuencia de la señal, luego de ser amplificada.
• Los divisores, así como otros tipos de filtros, poseen distintas formas de respuesta en la zona de cruce o frecuencia de corte (lugar donde la amplitud disminuye en 3 dB) y en la caída o pendiente.

El esquema representa un filtro simple de dos vías, un polo, que separa la señal de audio en dos, una de baja y otra de alta frecuencia. Debemos observar que la pendiente de 6 dB por octava, es pobre para este tipo de sistema.

De acuerdo al orden del filtro, después de la frecuencia de corte la respuesta caerá a razón de 6 dB por octava o 10 dB por década, por cada orden de magnitud del mismo. De esta forma, un filtro de primer orden tendrá una pendiente de 6 dB / oct, uno de segundo orden 12 dB / oct. y sucesivamente. La respuesta del divisor es importante por dos motivos:


En primer lugar la combinación de dos respuestas en la frecuencia de cruce, determinará la respuesta final del mismo. En segundo término, la forma de ésta es un indicativo de la cantidad de energía reactiva que manejan sus componentes a las frecuencias de resonancia.



En general, deberán cumplir con las siguientes características:
-Respuesta combinada plana: La suma de las respuestas de los transductores, supuestos perfectos y de igual rendimiento, a la salida del filtro, debe reconstruir la señal original.

- Impedancia constante: Vista desde el lado del amplificador.
- Variación rápida con la frecuencia (alta pendiente): De lo contrario, cada parlante deberá rendir muy bien para frecuencias alejadas de la de corte.

Los filtros responden a funciones matemáticas complejas, con las que se obtienen distintas características de funcionamiento, entre las que podemos mencionar:
- Filtros Bessel (de cualquier orden): Presentan una pendiente muy gradual con un cambio de fase eléctrica suave en el cruce. Estos filtros suelen ser utilizados en líneas de retardo pasivas debido a la atenuación reactiva que presentan por encima de la frecuencia de corte.
- Filtros Chebychev: Presentan un incremento de su respuesta (un pico), antes del cruce, para luego caer abruptamente. Normalmente se los diseña con sobrepicos de 1 a 3 dB. El corte es rápido a expensas de generar transitorios en el cruce, los que distorsionan la señal.
- Filtros Butterworth: Presentan una respuesta plana sin sobrepicos anteriores a la frecuencia de corte. La atenuación, no tan alta como la del filtro Bessel, es buena, ofreciendo excelentes formas de combinación. En la actualidad constituyen la mejor opción.

Considerando el grado de atenuación y el comportamiento de los diferentes filtros, la tabla indica sus principales características. La figura grafica el comportamiento en el cruce, de un filtro de 6dB/octava y otro de 12 dB/octava.

Los consumidores de equipos de audio domésticos utilizan, generalmente, redes pasivas, las que se instalan entre el amplificador y los transductores. Estas redes se fabrican para manejar grandes potencias y poseen inductores, capacitores y resistores de valores altos. El tweeter utiliza un filtro pasa altos, el woofer un pasa bajos y tantos pasabandas como parlantes de rango medio existan.

• Entre sus características eléctricas debemos mencionar:
+ Frecuencia y pendiente de corte.
+ Ripple del pasabanda.
+ Respuesta de fase.

Dado que las redes se encuentran instaladas despues del amplificador, disipan una gran cantidad de potencia. A mayor pendiente de corte, mayor cantidad de componentes y más consumo de energía. Estos componentes no son, en general, de gran precisión, resultando filtros imprecisos, difíciles de corregir una vez instalados. A esto debe agregarse los atenuadores resistivos necesarios para limitar la potencia que llega a los tweeter. El mayor problema de estos filtros es que aislan los radiadores del amplificador.

La impedancia del altoparlante varía con la frecuencia, dado que es un elemento reactivo. Los filtros pasivos se diseñan para ofrecer una carga resistiva, invariable con la frecuencia. Cuando la impedancia de la carga varía, la respuesta del filtro cambia, cayendo rápidamente fuera de las especificaciones. La única solución consiste en incluir un corrector de impedancia sobre el altoparlante el que consumirá mas energía introduciendo mayor distorsión.
Redes de cruce pasivas (Crossovers)

Las redes de cruce pasivas pueden ser armadas sobre placas de circuito impreso perforadas (veroboard). En caso de gabinetes para transportar, es conveniente fijarla rígidamente al mismo y anclar sus componentes. A efectos de su armado y prueba, es útil recordar que se debe prestar
cuidadosa atención al circuito, verificar las conexiones de fase de los altoparlantes y al probarlo, excitar al sistema con muy baja potencia.

La tabla sugiere algunos valores comunes de componentes para sistemas de dos y tres vías, que deberán ser verificados en el diseño y medición del mismo.

Nota 1: El valor de los capacitores está expresado en μF, con una tolerancia del 20%, del tipo no polarizados y una corriente de ripple de por lo menos 1000 mA.

Nota 2: La tensión deberá ser la suficiente para aceptar la potencia del amplificador, tal como se indica en la tabla.

Nota 3: La misma se puede calcular con:

Nota 4: El valor de los inductores se halla expresado en mHy, con tolerancia del 5%, bobinados al aire y con valor de resistencia de CC menor a 0,6 ohms.

Las figuras muestran la forma de conexionado.

Cálculo de redes de cruce pasivas

Las redes de cruce pueden ser calculadas siguiendo los lineamientos generales de las fórmulas que se indican a continuación, teniendo en consideración que:

Un parlante de determinada impedancia nominal, por ejemplo 8 ohms, solo tendrá este valor en su banda de pistón, fuera de la cual será afectada por su resonancia o por la contribución de la reactancia de la bobina movil, por lo que el diseño final deberá ser la resultante del método de "prueba y error".

Las diagramas adjuntos reproducen distintos tipos de redes y sus ecuaciones de cálculo.

Denominamos:
R: Impedancia nominal del altoparlante.
fc: frecuencia de cruce.
Sistemas activos
Los sistemas activos pueden ser divisores de frecuencia que operan al nivel de línea, o procesadores electrónicos de señal que alimentan los amplificadores dedicados a los transductores específicos para cada rango. Estos sistemas, a pesar de ser más caros, ofrecen varias ventajas respecto de los pasivos, entre las que debemos destacar:

Flexibilidad:
En la mayoría de las redes de cruce (crossovers) activas y procesadores modernos, las frecuencias e inclusive las pendientes, pueden modificarse fácilmente. En todos los casos, el divisor siempre maneja el mismo nivel de línea. Por otra parte, la potencia del sistema siempre puede variarse, aumentando o disminuyendo la cantidad de amplificadores y parlantes del mismo.

Control:
Estas redes pueden ser instaladas cerca de otros procesadores y de la consola de mezcla, de manera tal de tener un control completo del sistema, por lo que la frecuencia de cruce y el nivel de cada rango puede ser manejado con comodidad. Por otra parte, la facilidad de acceso a los diferentes rangos de división de frecuencias, permite agregar al sistema otros procesadores tal como compresores, ecualizadores o retardos de tiempo, imposible de realizar con divisores pasivos.

Protección:
Los driver de compresion y los tweeter no deben ser conectados directamente a los amplificadores. Se debe instalar capacitores en serie. Los pulsos de encendido del sistema pueden facilmente dañarlos. Este capacitor agrega 6 dB extra de pendiente en el crossover.


Independencia de la impedancia

Los divisores pasivos se diseñan para ser utilizados con componentes de determinada impedancia. Si el valor de estas impedancias cambian, las frecuencias de cruce y los Q del filtro, es decir su respuesta y amortiguamiento, también lo hacen. Por ejemplo: reemplazar un driver de 8 Ω por otro de 16 Ω degradará la respuesta en frecuencia debido al desplazamiento de la frecuencia de cruce, apareciendo transitorios por sobrepicos.

En un sistema activo, el cambio de impedancia de los reproductores no afectará en lo más mínimo al divisor, dado que no se haya directamenteconectado. La impedancia de un altoparlante varía dentro del rango de frecuencia de uso y los divisores pasivos se diseñan para el valor mínimo que ésta alcanza en ese rango o para su valor de resistencia en continua. Por el contrario, los sistemas activos no se ven afectados por los cambios de impedancia de los transductores, mientras el amplificador tenga un buen amortiguamiento (damping).

Por último, es importante el hecho de que no se introducen componentes pasivos en serie. Esto mejora la calidad del sonido, particularmente en baja frecuencia, dado que no se reduce el factor de amortiguamiento. Los circuitos pasivos incluyen grandes inductores que, en serie con los woofers, disminuyen este factor. Cuanto más baja sea la frecuencia de cruce y mayor la pendiente, más inductancia se necesitará, lo que empeorará la situación. El uso de alambres de mayor sección y núcleos de aire reducen este efecto, pero encarecen el diseño.

Cuanto mas facilmente pueda el amplificador suministrar la corriente variable sin cambios importantes en la tensión aplicada al parlante, mejor éste podrá reproducir lo que el amplificador está intentando pedirle que haga. La razon por la que el parlante requiere mas o menos corriente, función de la tensión aplicada, es que la impedancia del sistema radiador cambia, dependiendo de: la dirección en que se esté moviendo cuando se aplica la tensión, lo rápido que se esté moviendo en esa dirección y donde se encuentraba en primer lugar.

Esto ayuda a visualizar que la aplicación de una tensión al radiador es para colocar el cono en una posición determinada siendo el factor de amortiguamiento el que decide la dificultad en hacerlo. Otra forma de verlo es que cuando el cono se mueve, reproduciendo el programa, su impedancia varía. En un momento puede valer 6 ohms y en el siguiente 40 ohms.
El factor de amortiguamiento es la relación entre la impedancia específica de la carga en uso (del sistema radiador) dividida la impedancia de salida del amplificador (interna). Para explicarlo, evitaremos la idea de impedancia con sus componentes resistivos, inductivos y capacitivos, algunos de los cuales varian con la frecuencia, y usaremos elementos resistivos puros.

Para una impedancia de carga resistiva de 8 ohms y una de salida de 4 ohms (excesivamente alta), ambas perfectas, el factor será:
8 / 4 = 2

Si esta última pasa a valer 0,1 ohms, tendremos:
8 / 0,1 = 80

A medida que esta relación aumenta, la impedancia de salida del amplificador disminuye, lo que es bueno. Si el amplificador posee un factor bajo, significa que la impedancia interna es alta, lo que reducirá su capacidad de suministrar corriente y su habilidad para controlar el parlante.

Impedancia variable
En realidad, los parlantes no son una carga resistiva pura. Algunas veces la carga es capacitiva, otras inductivas, otras resistivas y otras mixtas. A esto debemos agregar los cables, las conexiones, la red de cruce, las características del gabinete, el tipo de tweeter, etc.
Esto tiene serias consecuencias, dado que a medida que la frecuencia varía, la impedancia del parlante también varía, por lo que un solo número no describe correctamente su comportamiento, por lo que se necesitaría una curva en función de la frecuencia. En realidad, esta curva es absolutamente imprecisa debido a la cantidad de factores que intervienen en su modificación. Un número solo sirve para comparar y eventualmente, cuando este es alto, nos indicará en cuanto afectará a la distorsión del sistema.

Conceptos de Mezcla: Tamaño Vs. Enmascaramiento

Uno de los principales problemas que aparecen al mezclar una canción es el enmascaramiento de frecuencias. Este fenómeno, por el cual una señal de mayor nivel le impide al oído reconocer otros sonidos de menor nivel. El mayor grado de enmascaramiento se produce cuando la frecuencia del sonido y la frecuencia del ruido enmascarador están muy cercanas. Por ejemplo, un tono de 4 Khz enmascara a otro tono más suave de 3,5 Khz, pero tiene poco efecto en un tono de 1 Khz. El enmascaramiento puede ser causado también por los armónicos del tono más fuerte. Por ejemplo un tono de 1 Khz, con un fuerte armónico de 2 Khz, puede enmascarar un tono de 1,9 KHz.

Como mencionamos anteriormente, el espacio de la mezcla es limitado, entonces cuanto más “grande” sea un sonido, mayor es la probabilidad de que oculte otros sonidos. Este fenómeno es una de las principales causantes del uso de ecualización y posicionamiento estéreo en una mezcla. Por otro lado, muchos de los músicos quieren que “su” instrumento suene con peso, cuerpo y definición. Un instrumento que suena bien solo, puede resultar escondido o con un carácter totalmente diferente al estar en la mezcla con otros sonidos más fuertes con un tiembre similar. Para poder lidiar con estos problemas, necesitamos saber cuánto espacio ocupa la imagen de un sonido entre los parlantes. Este tamaño está definido en función del :

+ Rango de frecuencias.
+ Volumen.
+ La apertura en el Estéreo.
+ La reverb y otros efectos.

En principio, los instrumentos graves parecen tomar mucho más espacio en la mezcla que los agudos. Imaginen una canción con tres bajos. Cuanto más grande sea el sonido grave, más va a enmascarar otros sonidos. Sin embargo, imaginen diez campanas en una mezcla y todavía van a poder diferenciarlas, aunque toquen al mismo tiempo. Por su carácter más omnidireccional, es muy difícil decir exactamente de donde provienen los sonidos bajos por debajo de los 300 Hz.

Cuanto mayor sea el volumen de un instrumento en la mezcla, también mayor será el enmascaramiento de los otros sonidos. Por lo tanto, los sonidos fuertes son más grandes. Una guitarra fuerte tenderá a enmascarar más que si estuviera a un nivel más suave.

Para evitar algunos de esos problemas, se emplean delays con tiempos muy específicos para estas aplicaciones. Cuando se utiliza un Delay mayor que 30 ms, lo percibimos como un eco. Pero cuando el delay es menor que los 30 ms aproximadamente, se produce un efecto interesante, ya que el oído no es lo suficientemente rápido para percibirlo como dos sonidos y los integra formando un solo sonido más “gordo”. Este sonido resultante se encuentra extendido en el tiempo, tiende a evitar el enmascaramiento por parte de otros sonidos, y por lo tanto su sonoridad promedio aumenta. Si estos sonidos, el original y el delay, son paneados hacia derecha e izquierda, el efecto que se produce es como si el sonido original se estirara en el estéreo, haciéndolo mucho más presente y espacioso, pero sin necesidad de subirlo de volumen.

Poner reverb en una mezcla es como ubicar el sonido de una sala en el espacio entre los parlantes. Si bien es un efecto muy utilizado, se debe revisar siempre que el tipo y la cantidad de reverb introducidos, sean beneficiosos para la mezcla. Como las reverb se producen con cientos o miles de delays, ocupan un gran espacio si están desplegadas al máximo entre los parlantes, y por ello también causan enmascaramiento. Las reverbs también pueden panearse alterando los espacios según la necesidad de la mezcla.

Dinámicas del control de volúmen

Volumen aparente:
Cada instrumento tiene un nivel tradicional con respecto al estilo de música en el que es utilizado y a la canción en particular. Para examinarlos dividimos el rango dinámico en seis niveles básicos, donde 1 es el más fuerte y 6 el más suave. Estos son volúmenes aparentes y relativos.

Normalmente cada fader controla el nivel de un sonido en particular. El volumen de cada sonido se fija con relación a los otras pistas en la mezcla. Si dibujamos el volumen en el gráfico como función de frente a fondo, también podemos ubicar un sonido en cualquier posición intermedia. Sin embargo, el volumen del instrumento no depende solamente de la posición del fader. Si así fuera, podríamos mezclar tranquilamente sin escuchar, poniendo los faders en la posición que creemos adecuada.

Cuando ubicamos un instrumento en la mezcla utilizamos lo que se denomina volumen aparente, no sólo el voltaje de la señal asociado a la posición del fader VCA. El volumen aparente de un sonido en la mezcla está basado en dos cosas principales: el nivel de fader y la forma de onda, y en otra secundaria: las curvas de Fletcher/Munson. Primero, al cambiar el nivel del fader afecta el volumen del sonido (dB). La forma de onda o estructura armónica del sonido puede hacer una gran diferencia en que tan fuerte o suave percibimos el sonido. Una guitarra distorsionada parece más alta que una guitarra limpia, aunque estén al mismo nivel. Un factor menor, pero que contribuye al volumen aparente de un sonido son las curvas de Fletcher/Munson. Por esto también es importante chequear las mezclas a todos los niveles.

El volumen aparente es, por lo tanto, una combinación del nivel en dB, forma de onda y las curvas de Fletcher/Munson. Afortunadamente, nuestro cerebro calcula rápidamente todos estos parámetros y nos entrega el volumen aparente. Todos nosotros utilizamos el volumen aparente para crear las relaciones entre los sonidos en las mezclas. Es el volumen en que “parece estar” el instrumento o sonido.

Ubicación individual de volúmenes:
Se puede crear dinámica musical y emocional dependiendo de la ubicación de los faders correspondientes a cada instrumento en la mezcla. El primer y más básico nivel de dinámica está basado simplemente en el volumen de cada sonido con relación a los otros sonidos en la mezcla. Por ejemplo, si se ubica una voz bien al frente de la mezcla sonará completamente diferente que si es ubicada más baja. La dinámica musical que puede crearse con la ubicación volúmenes individuales es más compleja de lo que se puede pensar. Mucha gente piensa que balancear los niveles de los sonidos en la mezcla es ponerlos parejos en volumen. Sin embargo y normalmente, uno no quiere poner todos los instrumentos al mismo volumen. Usualmente queremos sonidos más adelante, otros en el fondo y algunos en el medio de nuestro escenario sonoro.

Rangos de volumen aparente:
Volumen aparente 1: Los sonidos a este volumen son extremadamente fuertes. Ubicar sonidos a este nivel es bastante inusual y generalmente se trata de efectos y sonidos de muy corta duración. Si un instrumento normal es ubicado en este rango, será considerado como “mal mezclado” o “muy diferente”. Explosiones, gritos o los relojes en “Time” de Pink Floyd pueden colocarse a estos niveles.

Volumen aparente 2: Los principales sonidos a este nivel son voces e instrumentos solistas utilizados en canciones donde las letras o las mismas voces son la mayor atracción. Como es el caso de Whitney Houston, Celine Dion o Mariah Carey. Si se trata de una canción de un gran instrumentista como Pat Metheny, Kenny G o Wynton Marsalis, también es común encontrar estos niveles. En otros estilos: el boom de rap, tom-toms y bombo en heavy metal, golpes de metales en música latina.

Volumen aparente 3: Los sonidos en este nivel son generalmente partes de la rítmica de la canción como batería, bajo, guitarra, teclados. Las voces principales en ciertas canciones de rock están en este nivel cuando están metidas en la banda. Otros ejemplos: tambores en Dance music, tom-toms y platillos en casi todos los estilos de música, el Hi-Hat puede estar en este nivel en música Dance y Jazz.

Volumen aparente 4: Algunos sonidos en este nivel incluyen los pads y colchones de teclados, batería en Jazz, guitarra y piano en ciertos estilos. Cuando la reverb se identifica como un sonido separado suele estar a este nivel. Los coros y cuerdas pueden estar ubicados a este volumen.

Volumen aparente 5: Los bombos de Jazz y Big Band, la mayoría de las reverbs y efectos están ubicadas en este nivel, de manera tal que se distinguen sólo al escuchar atentamente. Algunos coros y doblajes pueden ser relegados a este nivel para cumplir el efecto. Otros instrumentos situados aquí se utilizan sólo como relleno en la mezcla, ya que su imagen no es clara y definida a tan bajo nivel.

Volumen aparente 6: Los sonidos ubicados en este nivel son tan suaves que son muy difíciles de detectar. Pink Floyd es muy conocido por ubicar susurros o sonidos casi subliminales en algunas canciones para introducir al oyente dentro de la mezcla. Los instrumentos a este nivel pueden ser muy efectivos, pero es importante que sumen de alguna manera en la mezcla, de lo contrario, se los percibe como un ruido molesto y pueden afectar la definición del programa.

La combinación de niveles que se produce en la relación del volumen de los distintos instrumentos, crea una dinámica musical y emocional mucho más intensa comparada con los niveles de un instrumento individual en la mezcla. Ciertos estilos de música han desarrollado sus propios niveles tradicionales a lo largo del tiempo, y en algunos casos tienen reglas muy estrictas.

Normalmente, se puede reconocer qué tan parejos son entre sí los niveles de los instrumentos. En algunos estilos de mezcla los niveles están puestos muy parejos, de forma tal que existe muy poca variación entre los sonidos más fuertes y más suaves de la canción. A este tipo de mezclas se las denomina “Even Mixes” (mezclas parejas), algunos ejemplos de ellas se pueden encontrar en discos de: Tears for Fears, REM, Smashing Pumpkins, Curiosity, Rock alternativo, música Country. También puede ser apropiado para canciones melódicas o baladas. Por otro lado, ciertos estilos son mezclados con muchas variaciones entre los sonidos fuertes y suaves: Dance, Rap, Big Band, Jazz. Algunos viejos grupos son bien conocidos por tratar de producir shocks de volúmenes con explosiones, alarma de relojes o guitarras a gran nivel. A estas mezclas se las conoce como “Uneven Mixes” (mezclas desparejas).

La elección de una mezcla pareja o despareja está determinada por el estilo de música. Sin embargo, el tipo de canción también ayuda a definir la elección. Por ejemplo, una balada puede ser mezclada con volúmenes más parejos para mantener el sentido melódico, y una canción que habla sobre “cambios o emociones fuertes” puede tener marcadas diferencias de nivel. Es muy útil escuchar los detalles de la canción para determinar si los niveles deben ser parejos o desparejos.

La mezcla puede hacerse para satisfacer la canción, de esta forma resulta transparente o invisible. O puede ser utilizada para crear dinámicas propias, puede ser una herramienta para resaltar algunas intenciones o sutilezas, o puede crear tensión. Un buen ingeniero utiliza la mezcla para sintetizar, optimizar y complementar el trabajo realizado hasta ese momento por los productores, arregladores y artistas a lo largo de la grabación.

Conceptos de Mezcla: Uso del Compresor

Tipos de detectores:
El grado en el que un compresor reacciona a un determinado nivel de entrada es función del tipo de detección utilizado. Basicamente existen dos tipos diferentes de detectores: PEAK y RMS.

Por ejemplo, cuando un instrumento realiza una parte solista, tiende a producir una forma de onda mucho más compleja que las líneas de los instrumentos de base. Para provocar esta complejidad cualquier fuente sonora tiende a incrementar su amplitud, aumentando la relación PEAK-RMS.

El detector PEAK, que trabaja con tiempos de detección muy pequeños, tiende a anular esta intención característica de sobresalir sobre los otros instrumentos, haciendo que el compresor reaccione de manera inmediata a los cambios de la señal de entrada. Por el contrario, el detector RMS trabaja sobre el valor RMS de la señal de entrada, para lo cual necesita al menos de un período, y de esta manera ignora estos códigos de sonoridad.Cuando una voz o instrumento produce estas formas de onda complejas se produce un alto contenido de armónicos de alta frecuencia, justamente donde el oído sufre una pérdida de sonoridad, de esta manera el detector RMS sobredimensiona el contenido efectivo de energía, reduciendo la ganancia más de lo que lo haría el oído.

El sistema de mejor resultado es el llamado de integración lineal, en el cuál se sobredimensiona suavemente el valor rms de una forma de onda en forma proporcional a su complejidad.

(click a la imagen para ampliar)

Figura 2. Formas de onda musicales y sus niveles de salida después de pasar por:

a) Detector PEAK convencional

b) Detector RMS convencional

c) Detector de integración lineal con corrección de reverción PEAK

Tiempos de integración RMS e integración lineal:
Es el tiempo necesario para medir el valor RMS de la señal de entrada. El tiempo requerido es función de la más baja frecuencia presente, cuyo valor promedio es determinado. Para mayor presición, el tiempo se extiende hasta tres veces el período cíclico de la frecuencia más baja. Por ejemplo, si deseamos obtener el valor integrado de una onda de 20 Hz (T=50 ms) el tiempo de integración requerido sería de 150 ms. Obviamente si acompañamos a la señal con trasientes, éstas últimas escaparán totalmente a la detección.

Si adoptamos un tiempo de 500 ms, las transientes serán capturadas aceptablemente, pero para las frecuencias por debajo de los 6 Khz el detector funcionará como un peak, con las desventajas ya mencionadas. Suponiendo un tiempo de integración de 5 ms, la unidad trabajará correctamente sobre los 600 Hz. Para frecuencias inferiores, la unidad cesará la medición del valor integrado de las ondas y comenzará a revertir la medida del valor PEAK, en lo que se denomina reversión del valor PEAK.

El uso de tiempos de integración más rápidos podría resultar en la sobredimensión de ciertas transientes, dado que gran cantidad de energía de esas señales está contenida en el primer milisegundo, a pesar que esta energía tiene un bajo factor de audibilidad. Lamentablemente no hay un tiempo de ataque óptimo para todas las posibles variedades de programa, por ello la mayoría de los procesadores traen control del tiempo de ataque para adecuarse al programa musical.

Tiempo de decaimiento:
Al igual que con el tiempo de ataque, no existe un tiempo de decaimiento óptimo para todo tipo de programa. El uso de tiempos largos, a pesar que previene los efectos de la modulación de baja frecuencia, tiende a provocar excesivos tiempos de recuperación que produce agujeros en la continuidad del material. Por el contrario, tiempos muy cortos producen serios problemas de distorsión.

Existen varios circuitos que intentan solucionar el problema, por ejemplo, están los que incrementan el tiempo cuando les llega una señal de baja frecuencia, o los que introducen una recuperación muy rápida después de transientes. Sin embargo, ambos métodos producen una molestia subjetiva al introducir dos velocidades de decaimiento.

Uno de los mejores métodos es usar un decaimiento no lineal o logarítmico. Cada vez que la señal activa la unidad, el tiempo inicial de decaimiento es relativamente largo. Si la entrada es una excursión simple, el decaimiento comenzará lento e irá aumentando hasta restablecerse la ganancia normal. Si la señal de entrada es repetitiva, como una baja frecuencia constante o transientes en serie, el tiempo de decaimiento permanecerá más bien largo hasta que cesen los batidos y el tiempo se acortará exponencialmente. Esto reduce prácticamente el efecto de modulación de baja frecuencia y el efecto “pumping” de transientes repetitivas.

Figura 3. Diferencias de un decaimiento logarítmico y uno lineal para una señal de entrada de baja frecuencia y de transientes.

Latencia



¿Qué es? ¿Cómo nos afecta?
La latencia, en pocas palabras, es el tiempo en milisegundos que tarda una señal (bit, dato, audio, impulso, etc) desde el momento que es enviada hacia la DAW y llega a nuestros oídos devuelta por ella. Acá presento un “esquema” bastante básico, pero claro:



Este “retraso” de la señal, obviamente nos afecta al momento de monitorear y en algunas oportunidades genera una suerte de “Flanger”, llegando en casos extremos a generar un “delay” perfectamente audible.

La “monitorización directa”, no es una mejora en los tiempos en los que nuestra DAW nos entrega el resultado del proceso, sino, que como su nombre lo indica, es un “bypass” del proceso, en pocas palabras es una conexión directa entre la entrada de nuestra placa y su salida a monitoreo (obviamente el “audio” no es procesado).

Las variables que la causan:

- Interfaz de Audio:
Obviamente dependiendo del diseño de la misma, calidad, conversores y prestaciones (DSP, entradas/salidas, conexión a la DAW o si es Standalone ,etc), hay placas que manejan bien el flujo de información (ingreso de audio A/D, proceso, entrega de audio D/D o entrega de audio D/A) ciertamente ayudando a compensar la latencia generada por el paso de la señal o dato a través de su electrónica y otras que lo único que hacen... es hacer casi imposible realizar un trabajo decente.  Obviamente, como pasa generalmente en todos los órdenes de la vida, el dicho lo barato sale caro, aplica en este caso y a veces aplica a productos caros con fallas de diseño.

- CPU:                                                                                                                                                     Muchas veces pensamos, erróneamente, que cada variable en este juego de equilibrios es independiente, lo cual no es así. El procesador (el que hace los cálculos) solamente es uno de los responsables del buen o mal desempeño de nuestra DAW, pero no el único. Cuando nosotros queremos mejorar nuestra latencia y tratamos de llevarla al mínimo, lo más cercana al 0, empezamos a jugar con el Buffer de nuestra placa.

Ahora, mientras más bajo sea el número del BUFFER  (1025, 512, 256, 128, 64), más exigiremos a nuestra pobre CPU que tratará de entregar a nuestra DAW la información (el dato binario, NO AUDIO) en porciones más chicas. Esta exigencia, dependiendo también de las otras variables, devendrá en Clicks, POPS, y también posiblemente en la detención indeseada de nuestro motor de audio y hasta en el famoso “cuelgue” de la computadora. Veamos los otros involucrados en este proceso.

- Memoria:                                                                                                                                                                      
Esta variable es generalmente olvidada y hasta ciertamente menospreciada. Este es otro ERROR común, ya que la memoria juega un papel FUNDAMENTAL en este juego de equilibrio. No es lo mismo estar trabajando con una memoria en Dual Channel, Tri Channel o Single Channel. Tampoco es lo mismo estar jugando con 1, 4, 8,1 6 o 64 GB y, para no dejar a nadie afuera, la velocidad. Las memorias se miden en Mhz y Ghz (igual que nuestro procesador), mucha gente consulta si es mejor tener 8 GB a 1033 Mhz o 4 GB a 2100 Mhz…hay pequeñas reglas, pero no un receta.

- Tipo de conexión de la Interfaz: 
Dependiendo del puerto (USB, FW o Thunderbolt) o BUS (PCI o PCIe) que usemos para comunicar nuestra placa con el HOST (computadora), la latencia irá variando, aumentando de mayor a menor, dependiendo la velocidad y ancho de banda del puerto o BUS. No podemos pretender que un USB tenga la misma latencia que un PCIe.

- Sample ; Bit Rate:
Cuanto mayores sean el Sample Rate y el Bit Rate, tanto el consumo de CPU como la exigencia del buffer serán mayores. Estos impactan directamente en la latencia ya que al requerir más proceso (tanto por el CPU y como por los conversores de la placa de sonido) se genera un aumento en el tiempo de latencia. Ciertamente, dependiendo de la configuración de la DAW, el aumento del valor en esta configuración puede ser prohibitiva (clips, pops & Drops) en en este item. Daremos una vista mucho más profunda sobre este tema en la siguiente parte del artículo.

- Cache de disco:
 El Cache del disco es una pequeña memoria “RAM” que físicamente se aloja en la electrónica del mismo (no donde están los platos), ésta aloja la data más recientemente usada o pedida durante un tiempo antes de entregarla al host o de bajarla a los platos del disco. Mientras más grande sea este cache menor será nuestra latencia en el total del proceso de grabación y reproducción. No nos olvidemos que la grabación y monitoreo son procesos de I/O simultáneos.

- Motherboard:
La pieza casi clave de todo esto. El motherboard (placa madre) es el responsable de gestionar con el chipset (elemento en el cual indagaremos más profundamente en la siguiente parte de este artículo) TODAS las comunicaciones, procesos, transferencias, etc. Sugiero antes de armar una máquina que lleve nuestra DAW o colabore con la misma (Farm) revisar al extremo lo que se denomina “matriz de compatibilidad” entre los componentes que integren nuestra máquina para correr la DAW.
¿Qué es el ASIO o el “driver” de las placas de audio?

Hace varios años la marca Steinberg sacó al mercado un soft llamado ASIO (Audio Stream Input/Output), este soft se encarga de manejar o “administrar” los componentes y variables que participan en la grabación/reproducción de nuestra daw:




Este software (ASIO)  maneja o administra  las relaciones y variables (llamamos variables, por ejemplo, a la cantidad de RAM disponible, frecuencia del procesador, cantidad de cache de disco, etc) entre CPU, memoria, DAW, placa de sonido, disco y motherboard. Dependiendo de cómo manejemos esas variables optimizaremos o (a veces pasa) degradaremos el rendimiento de nuestra DAW generando “clips” y “pops” por el mal manejo y configuración de las mismas. Cada fabricante crea su software basándose en el código base de Steinberg agregando los parámetros de su hardware, para posteriormente, con las sucesivas versiones del mismo, realizar ajustes para mejorar el desempeño y arreglar problemas o bugs de la versión del driver.

Algunos ejemplo de paneles de control ASIO:
Algunas veces, esta información  sobre la latencia no es del todo exacta, para saber hasta que punto un puede exigir una máquina para que nos entregue un rendimiento óptimo, recomiendo que visiten:
Esta página corre ciertas pruebas (de las cuales hablaremos más adelante) con una máquina de pruebas con diferentes placas de audio, ofreciendo por ejemplo los siguientes resultados:
Reference System Detail:
Intel i7 920 Quadcore/ 2.66 GHZ/
Intel X58 / 6 GB DDR3-PC12800.
O.S Detail:
Windows 7 SP1 x64 Pro
Notese el detalle de que en la prueba se incluyó: CPU, motherboard, Cantidad de RAM y tipo, Sistema operativo, Service Pack y versión, driver utilizado y la placa puesta a prueba. Esto es a muestra de resumen para cerrar esta parte del artículo mostrando como interactúan todas las variables para sacar estas estadísticas de desempeño, todo lo referido al DAWBENCH será explicado en las siguientes partes del artículo.
En el siguiente artículo (Parte II) nos explayaremos sobre la correcta configuración de este administrador para evitar según la DAW que manejemos, problemas de configuración y podamos llevar a cabo una buena grabación sin sobresaltos. 

El ARTE DE MICROFONEAR

El arte de microfonear
Una vez finalizada la etapa de pre-producción y definido el plan de trabajo a seguir comenzamos con la etapa de producción, donde el primer paso es entrar al estudio de grabación para realizar las tomas de los diferentes instrumentos. Para lograr el sonido buscado, el punto de partida no sólo es la elección del micrófono, sino también su ubicación y la ubicación del instrumento a grabar dentro de la sala o recinto. Son varios los factores que interactúan a la hora de grabar, obviamente la calidad del instrumento y del intérprete también afectarán. Suponiendo que partimos desde el punto en que nuestro instrumento está en condiciones óptimas, esto incluye calibración, afinación y cambio de cuerdas, parches, etc.; que contamos con músicos experimentados y con buena técnica, sólo resta elegir y posicionar el micrófono adecuado, lo cual no siempre el más caro es el idóneo. Para una buena elección y posicionamiento del mismo deberemos tener conocimiento de las características del instrumento a grabar con el fin de ser criteriosos, por lo tanto iremos estudiando cada instrumento en particular para sacarle el mayor provecho a cada toma. No hay una única técnica válida para cada caso, sino que la creatividad y la experiencia serán tan importantes como el conocimiento de instrumentos y micrófonos a utilizar. La posibilidad de seleccionar y ubicar los micrófonos en una grabación, es la herramienta de trabajo más importante de un ingeniero de sonido. Existe una gran variedad de micrófonos y distintos principios de operación para cada configuración de micrófonos utilizada, con las que se obtendrán diferentes características sonoras. La ubicación o posicionamiento de micrófonos es una forma de arte subjetiva. A pesar de existir numerosas técnicas utilizadas por los profesionales de la grabación, lo que puede ser considerada una “mala técnica”, puede resultar como mejor solución para una aplicación particular. Las técnicas de grabación, evolucionaron en los últimos años junto al desarrollo de la tecnología y los nuevos estilos musicales. Además, se han puesto nuevamente de “moda” algunas técnicas y elementos que habían dejado de utilizarse, y que aplicadas a las condiciones actuales de los distintos estilos musicales, tienen características sonoras interesantes.

Posicionamiento de la fuente
A la hora de grabar es muy importante tener en cuenta la ubicación del instrumento dentro de la sala, pues sabemos que cada recinto tiene su propio modo o “room mode”, lo cual lo hace único. Al estudiar las propiedades acústicas de los recintos podemos observar que en ciertos lugares de la sala el comportamiento en baja frecuencia no es homogéneo. Por lo tanto, los modos de resonancia deberán considerarse en el caso de poder tener control del posicionamiento de la fuente de sonido. El problema modal se da en frecuencias inferiores a 300 hz y es crítico en cuartos pequeños, donde sólo tiene solución a partir del diseño, es decir de la modificación de sus dimensiones. Tiempos de reverberación (RT60) largos incrementan el problema modal y cuartos con dimensiones múltiplos entre si son más problemáticos. Es importante saber que no siempre se puede tener control del posicionamiento, pero el conocimiento de este fenómeno permite entender el porqué de la coloración espectral según la posición.

Características sonoras en función de la distancia

Tanto en el estudio, como en las grabaciones en vivo, existen cuatro estilos de microfoneo que están directamente relacionados con la distancia que hay entre el micrófono y la fuente de sonido. Estos son:
- Distante o balance natural
- Cercano o balance cerrado
- De acentuación
- Ambiental


Microfoneo Distante

El microfoneo distante se refiere al posicionamiento de uno o más micrófonos,
 a un metro o más de la fuente sonora. Esta técnica cumple dos funciones:
- Ubica el micrófono a una distancia a la cual el instrumento o ensamble es
 tomado de manera tal que preserva su balance tonal general.
- Ubica el micrófono a una distancia a la cual el ambiente acústico está incluido 
y combinado con la señal directa de la fuente sonora.  
Este tipo de microfoneo es utilizado, generalmente, en la toma de un gran ensamble de instrumentos, como una orquesta sinfónica o un coro, y depende en gran medida de la calidad del medio ambiente acústico. En una situación como ésta, el micrófono es ubicado a la distancia que toma el balance preciso entre el ensamble y la acústica de la sala. Este balance puede estar determinado por varios factores, incluidos el tamaño de la fuente sonora y las características de reverberación de la sala. Las técnicas de microfoneo distante tienden a agregar una sensación más viva y abierta al programa grabado, porque los micrófonos ubicados a esas distancias, cubren un mayor ángulo de incidencia, permitiendo capturar el campo sonoro satisfactoriamente con unos pocos micrófonos.
La principal desventaja de ésta técnica, es la existencia de una mala acústica de la sala de concierto o de grabación. Las reflexiones descontroladas de una sala con un diseño acústico pobre, producen una grabación poco definida y opaca, con numerosas alteraciones en la respuesta en frecuencia. Para corregir o minimizar éstos problemas, se puede realizar una corrección temporaria de la acústica de la sala, utilizando material absorbente o difusores. Otra desventaja de esta técnica, es la presencia de cancelaciones de fase, debidas a las reflexiones en las paredes. Estas cancelaciones afectan la respuesta de frecuencia, y son causadas por el sonido que viaja hasta el micrófono por dos recorridos diferentes: uno directo desde la fuente sonora y otro reflejado en una pared cercana.
En la figura, el sonido reflejado por el piso recorre un camino más largo que el sonido que alcanza el micrófono directamente. Las frecuencias que llegan 180º fuera de fase con respecto al sonido directo se cancelaran. Esta interferencia de fase puede producir caídas de hasta 15 dB en la respuesta en frecuencia del micrófono.  
  
 Estas cancelaciones pueden ser reducidas o eliminadas, ubicando el micrófono más cerca de la pared, de manera tal, de reducir la diferencia entre los recorridos de las ondas. Los micrófonos como el PZM de Crown trabajan con este principio. Los efectos de estas cancelaciones dependen también de la relación Directo/Reflejado, y por lo tanto, de las cualidades reflexivas de la pared en cuestión. Los problemas de cancelaciones de fase pueden ser producidos por el uso de varios micrófonos lejos de la fuente sonora. Si una fuente sonora es tomada por dos micrófonos con una intensidad similar, puede haber variaciones en la fase, producidas por la diferencia de recorrido de la onda sonora desde la fuente a cada uno de los micrófonos. Cuando estas señales se combinan en un canal, como sucede en la etapa de mezcla, se producen severas alteraciones en la respuesta en frecuencia del instrumento.
Variaciones en la respuesta de las cápsulas debido a la cancelación de fase  
 

  Con el fin de evitar estas cancelaciones en la mayoría de los microfoneos de instrumentos, puede emplearse el llamado principio de tres a uno. Este principio soporta aquello de mantener la integridad de fase entre dos o más micrófonos, y dice que la distancia entre dos micrófonos debe ser al menos tres veces la distancia entre un micrófono y su fuente sonora.   Microfoneo Cercano
Las técnicas de microfoneo cercano, se refieren a ubicar el micrófono a una distancia entre 25 mm y 1 m de la fuente sonora. Esta técnica, es ampliamente utilizada en producciones multipista y en producción de audio para video. El microfoneo cercano cumple dos funciones principales: Crear una calidad de sonido clara y presente e Independizar el instrumento del medio ambiente acústico. Aunque el microfoneo cercano ofrece varias ventajas, un micrófono debería ser ubicado tan cerca como sea necesario, y no tan cerca como sea posible, ya que esto puede afectar la calidad tonal del instrumento. Comúnmente, éstas técnicas involucran distancias entre 2 y 15 cm, y por eso puede ser que no capturen el balance tonal o timbre completo de un instrumento. Por el contrario, un micrófono puede estar situado tan cerca de una fuente sonora, que puede reproducir sólo el sonido específico de esa área del instrumento, dando como resultado un balance tonal parcial. Trabajando con distancias tan pequeñas, mover el micrófono sólo unos pocos centímetros puede cambiar el balance tonal de manera drástica. Las técnicas de microfoneo distante y cercano producen características tonales bastante diferentes. Bajo ciertas circunstancias, es difícil obtener un balance natural cuando se mezclan éstas dos técnicas. Por ejemplo, los estilos de grabación de música sinfónica, utilizan las técnicas del balance natural entre el sonido directo y reverberante. Durante la interpretación, puede haber un pasaje instrumental que requiera un micrófono adicional para mejorar el cubrimiento del instrumento en nivel y presencia. Si este instrumento es tomado desde muy cerca, sonaría demasiado presente y fuera del contexto del microfoneo distante. Para evitar esto, debe realizarse un compromiso entre la distancia del microfoneo distante y el cercano. Un micrófono situado en este rango de compromiso es conocido como micrófono de acentuación.
 
Microfoneo de acentuación
Cuando se utiliza un micrófono de acentuación, debe ser ubicado cuidadosamente. La cantidad de acentuación introducida en la mezcla es muy importante, ya que puede colorear o cambiar el balance entre el solista y los instrumentos que lo rodean. Una buena técnica de microfoneo de acentuación, sólo agrega presencia al sonido de un pasaje de solo. No debe percibirse como un micrófono separado. El paneo adecuado de la señal de éste micrófono, ayuda a fijar el instrumento en la imagen estéreo del balance natural. La ubicación del micrófono de acentuación introduce una discrepancia de tiempo, que produce que el solo se escuche un instante antes que el resto de la formación. Esto hace que el micrófono de acentuación suene más cerca de lo que debería. Para compensar ésta diferencia, puede utilizarse un delay digital que retarde la señal de éste micrófono, aproximadamente entre 10 y 15 ms, para asegurar que la señal del micrófono de acentuación esté presente en la mezcla al mismo tiempo que el balance natural. 

MS
 Microfoneo ambiental
Cuando un micrófono es ubicado a una distancia tal, que el campo reverberante o sonido de la sala predomina sobre el sonido directo, ese micrófono se conoce como micrófono ambiental. El micrófono ambiental suele ser omnidireccional, sin embargo, puede utilizarse un patrón polar cardioide, de espaldas a la fuente sonora, para minimizar el sonido directo tomado por ese micrófono. De esta manera, el micrófono ambiental se concentra específicamente en capturar el sonido de la audiencia o reverberante. Comúnmente, se utiliza un par estéreo mezclado con los micrófonos cercanos para obtener un sonido más espacioso.
Un micrófono ambiental puede ser utilizado básicamente en tres situaciones:
- En una grabación en vivo, pueden ser ubicados en la sala para agregar la reverberación natural que se pierde con el microfoneo cerrado.

- En una grabación en vivo, pueden ubicarse sobre la audiencia para captar sus reacciones y los aplausos.

- En una grabación de estudio, pueden ser empleados para añadir la acústica del estudio al sonido grabado. El microfoneo ambiental, utilizado como efecto, puede agregar profundidad al sonido.
microfoneo

 
Aunque aquí se consideraron de forma separada, las técnicas de balance natural y cerrado pueden combinarse y complementarse hasta alcanzar el estilo de producción deseado. Por ejemplo, las técnicas de microfoneo distante no están limitadas a la música clásica como a veces se cree; pueden ser utilizadas en distintas aplicaciones, desde un coro hasta una batería. Además, una flauta puede sonar interesante, tanto si es grabada en un estudio con un micrófono a 40 cm, o dentro de una catedral a 10 metros. A través de la experimentación, la mezcla de estas técnicas puede crear un efecto único que contribuya al estilo de producción.

Escucha binaural
Los oídos se encuentran aproximadamente a 17 cm uno del otro. Esta distancia hace que los sonidos laterales lleguen al oído que se encuentra más distante de la fuente con menor amplitud, con cierto retardo de tiempo y con un filtrado en altas frecuencias debido a la sombra acústica que produce la cabeza. Estas diferencias de amplitud, fase y frecuencia son la información con la que el sistema nervioso recrea la espacialidad. A esta escucha la llamamos escucha binaural.
Las técnicas de microfoneo estéreo tienen como objetivo capturar un campo sonoro en forma similar a la forma en la que oímos los seres humanos. Veremos cómo funcionan este tipo de técnicas, para que cada uno experimente en busca de tomas de grabación que se ajusten a la imagen estéreo real que los humanos percibimos, o bien en busca de efectos en concreto que faciliten el posicionamiento de las pistas a la hora de realizar la mezcla. Las buenas producciones gozan de una sensación de espacio plena gracias a un correcto emplazamiento estéreo de las pistas y al uso de avanzadas técnicas de microfonía que dotan a las grabaciones de una coherencia espacial directamente ligada a la forma que tenemos los humanos de escuchar a través de dos oídos. Veamos cómo funcionan ese tipo de técnicas, y como aplicarlas para dotar de más grandiosidad espacial a nuestras grabaciones y producciones.

Tomas estereofónicas
Una buena captura con técnica de grabación estéreo es esencial para todo tipo de instrumentos y estilos musicales. El microfoneo estéreo es una mejora al microfoneo mono porque proporciona la sensación de un campo sonoro proveniente de derecha o izquierda, la sensación de profundidad o distancia entre cada uno de los instrumentos, la sensación de distancia del ensamble con el punto de escucha y la sensación espacial del entorno acústico, o sea la reverberación del ambiente.
Lograr una buena imagen estéreo depende de la buena elección de micrófonos y de la correcta ubicación de los mismos.

Tipos de microfoneo estéreo
Hay técnicas generales de microfoneo usadas para grabaciones estéreo, cada una con un diferente sonido y cada una con sus beneficios y desventajas.
- Par coincidente
- Par casi coincidente
- Par estéreo apantallado
- Par espaciado
- Par omnidireccional con cabeza artificial
- Decca Tree

Par coincidente
Un par de micrófonos coincidentes refieren a aquellos que poseen sus cápsulas muy próximas, evitando la cancelación por diferencia de fase, lo cual hace que tenga excelente compatibilidad mono ya que ambas cápsulas perciben el mismo frente de onda. Estas técnicas se basan en la localización por diferencia de frecuencias y dan buena impresión de ambiente en recintos pequeños. Dentro de las técnicas de par coincidente se encuentran:
- XY
- M-S (middle – side)
- Blumlein

Par coincidente XY
par coincidente
El sistema XY estéreo es una técnica de coincidencia que usa dos micrófonos cardioides e idénticos montados de manera tal que sus diagramas polares están cerca de tocarse, con un ángulo típico de 90º entre sus ejes para producir una imagen estéreo. Se han usado ángulos de apertura entre las cápsulas de 120º a 135º, e incluso hasta 180º, lo cual cambiará el ángulo de grabación y la propagación estéreo. A mayor ángulo entre los ejes de cada micrófono, dará una imagen estéreo mas ancha. El ángulo de estos diagramas está cada uno en una dirección que abarca de izquierda a derecha todo el ensamble. Por ejemplo, 2 micrófonos cardioides pueden ser montados en ángulos de manera tal que sus diagramas polares estén uno a continuación del otro como muestra la figura.
Hay muchas variaciones del par coincidente pero la configuración X/Y es la más fácil y las más usada. En esta técnica las señales no tienen diferencias de tiempo, ni amplitud ya que las cápsulas se encuentran a igual distancia de la fuente. Solo existen diferencias de frecuencia dado que una señal proveniente de la izquierda entrara en el ángulo 0º al micrófono de la derecha y en 90º al micrófono de la izquierda. Como sabemos los micrófonos direccionales tienen menos sensibilidad en altas frecuencias en el grado 90º respecto del 0º, la atenuación por desviación del eje de un cardioide es aproximadamente de 6 dB en 90º. Y como sabemos, el uso de micrófonos direccionales a grandes distancias reduce la cantidad de información de bajas frecuencias en la grabación, debido al efecto proximidad mostrado por estos micrófonos. La configuración XY es, por tanto, la elección utilizada a menudo en aplicaciones cercanas. Por ejemplo, como overheads de batería, mediante el uso de esta técnica se consigue que la caja no quede panoramizada por una mala colocación de los micrófonos ambientales, y se garantiza que ésta se reproduzca en el centro de la imagen sonora. De todos modos, con este método la imagen estéreo no suena tan abierta y grande en comparación con otras técnicas de grabación estéreo. Como vemos la técnica XY no se asemeja demasiado a la escucha binaural, por lo que carece de profundidad respecto de otras técnicas, pero tiene buena imagen central y compatibilidad mono.
blumleim
M-S (Middle – Side)
El Arte de Microfonear ( parte I )
M-S se refiere a Mid (medio) – Side (lados). Esta configuración se arma colocando 2 micrófonos: uno direccional, generalmente de tipo cardioide (un omnidireccional puede sustituirlo perfectamente) apuntando directamente a la fuente de sonido y uno bidireccional o figura-8 apuntando hacia los lados. Los micrófonos están posicionados de manera tal que las cápsulas estén lo más cercanas posibles y el ángulo entre ellos sea de 90 º como muestran las figuras. La grabación M-S es buena para imágenes estéreo, especialmente cuando la mayoría del sonido proviene del centro del ensamble. Por esto, esta técnica es menos efectiva en grupos grandes, favoreciendo voces ubicadas al medio que resultan favorecidas por la cercanía. Si la fuente es muy grande, la técnica M-S va a necesitar mucha distancia por lo cual no es aconsejable.
Si se necesita mayor presencia en relación al ambiente, entonces un micrófono hipercardioide se puede utilizar como “M”. Solo se deberá tener en cuenta que se estará sacrificando las octavas bajas en el resultado final. Para mejor ubicación, camine por la sala y escuche donde los instrumentos o fuentes suenan mejor. Procure balancear los instrumentos dentro del ambiente y la imagen estéreo lo mejor posible. Una vez que encuentre la ubicación, instale ahí los micrófonos donde estaba la mitad de su cabeza.
Escuchando cada uno de los micrófonos por separado puede sonar bien o perfectamente mal. Para terminar de armar este sistema de trabajo, la señal de salida de los micrófonos necesita una “codificación” adicional para recrear una “real” imagen estéreo. La señal M-S no puede ser monitorizada directamente en un sistema convencional izquierdo-derecho sino que debe ser decodificada por una matriz M-S. La matriz M-S utiliza la información de fase entre el micrófono central y el ambiental para producir una señal L-R compatible con un sistema estéreo convencional. El direccional proporciona un voltaje “positivo” y el bidireccional (figura-8) no recibe señal del frente de la fuente, que incide sobre el costado del micrófono y proporciona un voltaje positivo con todo lo que recibe por izquierda y un voltaje negativo con todo lo que recibe por derecha.
estereo
Tecnica
La matriz decodificadora M-S se puede fácilmente emular con 3 canales en la consola. Para empezar necesitaremos una mesa de mezclas y alguna forma de duplicar la señal Side, lo mejor es usar un previo de micro que proporcione dos salidas, otra opción es usar un splitter, y otra es meterlo en la mesa y enviarlo a dos auxiliares, entonces conectar esas dos salidas a dos canales (no usaremos el canal que hemos enviado a los auxiliares). El micro cardioide no necesita ningún tratamiento especial. En la mesa de mezclas pondremos los dos canales Side con los panoramas abiertos cada uno a un lado, cambiaremos la fase de uno de ellos y dejaremos los faders abajo; de nuevo el canal Mid lo dejaremos normal: panorama al centro y fader a 0 dB. Con estos niveles estaremos empezando con una señal mono, y según vayamos subiendo las señales Side (siempre con el mismo nivel las dos) iremos convirtiendo el sonido mono en estéreo, cuando tengamos los tres canales a 0 dB tendremos un estéreo normal, y si seguimos subiendo el volumen de los canales Side o bajamos el canal Mid tendremos una sensación de mayor amplitud aunque empezaremos a tener contrafase entre los canales izquierdo y derecho. Cuando digo que tenemos un estéreo normal si los tres canales tienen en mismo nivel, quiero decir que será como tener un par de micros cardioides en configuración XY. Lo más interesante de grabar en MS es que podemos decidir en la mezcla si queremos un estéreo más amplio o más estrecho, o incluso podemos variarlo mientras suena con una sencilla automatización. Solo se trata de variar relación entre los canales Side y Mid, recordando que si tenemos más volumen de Side que de Mid tendremos un estéreo mucho más abierto a costa de aumentar la señal en contrafase entre los canales L y R. La técnica M-S no tiene problemas de fase en estéreo, con una excelente compatibilidad al convertirlo en estéreo, la cual puede ser la mejor opción para capturar ambiente bajo las correctas circunstancias. En muchos casos el resultado conseguido pude ser más natural que con el par espaciado. Una desventaja de este sistema es que para hacerlo compatible con un sistema mono se cancelan los laterales.

Blumlein
Se llama así por Alan Blumlein, ingeniero del sello inglés Decca, creador de la mayoría de las técnicas estéreo coincidentes que usamos hoy en día.
MS
El estéreo Blumlein es una técnica estéreo de coincidencia que usa dos micrófonos bidireccionales situados en el mismo punto y con un ángulo de 90º entre sus ejes. Esta técnica estéreo dará normalmente los mejores resultados cuando se use en pequeñas distancias hasta la fuente de sonido, puesto que los micrófonos bidireccionales emplean la tecnología de gradiente de presión y, por tanto, está bajo la influencia del efecto proximidad. A distancias mayores, estos micrófonos perderán las frecuencias graves. El estéreo Blumlein tiene una separación de canal más grande que el sistema X-Y estéreo, pero con la desventaja que las fuentes de sonido localizadas detrás del par estéreo también serán captadas y se reproducirán posteriormente siempre con la fase invertida. La captación frontal Será tan intensa como la posterior recogiéndose fuertemente la reverberación del ambiente.
Ventaja: Realismo en cuanto a la profundidad.
Desventaja: Si existen fuentes laterales fuera del ángulo de captación aparecerán en oposición de fase en cada canal lo que provoca una desorientación sobre la posición del estéreo para el oyente y una atenuación de dichos sonidos si se lo pasa a mono.
microfoneo

Par casi coincidente

El término casi-coincidente es utilizado para describir una clase de técnicas en las cuales un par de micrófonos son puestos lo suficientemente cerca, de manera tal que sean coincidentes para las bajas frecuencias, pero lo suficientemente separados para tener un retardo apreciable entre los canales para la localización de la fuente sonora en las altas frecuencias. Alguna de estas técnicas simulan la escucha binaural. La importancia de las técnicas casi coincidentes, es que muestran buena localización, combinada con sensación de profundidad. No es recomendable el uso de ésta técnica para el balance cerrado de solistas en un ensamble, ya que pequeños movimientos de la fuente sonora pueden producir cambios importantes en la imagen. Los sonidos provenientes de los extremos izquierdo o derecho pueden ocasionar problemas de sumatoria en Mono, debido al retardo entre canales. Dentro de las técnicas de par casi coincidente se encuentran:
- O.R.T.F.
- DIN
- N.O.S
- Faulkner
- Olson Stereo

Técnica O.R.T.F.

Nombre de la “Oficina de radio difusión y televisión francesa”, la configuración O.R.T.F. mostrada en la figura consiste en dos micrófonos cardioides orientados hacia afuera de la línea central con un ángulo de 110º y una separación de cápsulas de 17 cm.
par coincidente

blumleim

Técnica DIN

El Arte de Microfonear ( parte I )

Esta técnica es similar a la O.R.T.F, consiste en la utilización de dos micrófonos cardioides separados a una distancia de 20 cm y con un ángulo de 90º.

Técnica N.O.S
estereo

Adoptado por la “Organización Holandesa de Broadcasting”, el estándar N.O.S consiste en dos micrófonos cardioides orientados hacia afuera de la línea central con un ángulo de 90º y una separación de cápsulas de 30 cm.

Técnica Faulkner
Tecnica

Desarrollada por el ingeniero inglés Tony Faulkner, la configuración Faulkner utiliza dos micrófonos bidireccionales apuntando directamente hacia la fuente sonora y con una separación de 20 cm. Esta técnica puede combinar la coherencia de la técnica Blumlein con el “espacio” producido por las diferencias de tiempo resultantes de la separación entre los micrófonos. Se recomienda que el par de micrófonos este ubicado más lejos de la fuente que en otras técnicas casi coincidentes, ya que esto proporciona un balance más natural entre los sonidos directo y reverberante.

Técnica Olson Stereo
Esta técnica consiste en dos micrófonos hipercardioides separados 4,6 cm y con un ángulo de 135º.
MS

Par estéreo apantallado
Estéreo apantallado es un término genérico para un buen número de técnicas diferentes que usan una pantalla aislante para realzar la separación entre los canales de la señal estéreo. El efecto sombra provocado por la pantalla tendrá una influencia positiva de atenuación de las fuentes de sonido desviadas del eje, y por ello se realza la separación de canales. Las pantallas deberían estar construidas con un material acústicamente absorbente y no reflexivo, para prevenir las reflexiones en su superficie que puedan colorear el sonido.
Dentro de las técnicas de par estéreo apantallado se encuentran:
- Jecklin Disk (OSS)
- Borud-Shadow
- Madsen-Shadow

Técnica Jecklin Disk
Un disco Jecklin es un disco que absorbe el sonido estando colocado entre dos micrófonos para crear una "sombra" acústica de un micrófono en el otro. La técnica fue inventada por el ingeniero de sonido Jürg Jecklin y se refirió a la misma como una "señal óptima Stereo" (Optimal Stereo Signal: OSS). Esta técnica consta de dos micrófonos omnidireccionales separados unos 17 cm y con una pantalla de unos 30 cm de diámetro y 2 cm de espesor situada entre ellos. La pantalla es un disco rígido recubierto de material absorbente. El ángulo desde el eje central a cada micrófono es de unos 20º. Hay algunas variaciones de esta técnica donde la distancia entre micrófonos llega a 30 cm y la pantalla es de 36 cm de diámetro.

microfoneo

par coincidente

Técnica Borud-Shadow
Esta técnica es una variante de la OSS y consiste en dos micrófonos omnidireccionales con una pantalla absorbente entre ellos, y separados a una distancia de entre 20 y 25 cm.

Técnica Madsen-Shadow
Esta técnica consiste en dos micrófonos bidireccionales, dispuestos con un ángulo de 90º entre ellos y con una separación entre 30 y 50 cm. Entre los micrófonos se ubica una pantalla absorbente.

Par espaciado
Un par de micrófonos espaciados refiere a aquellos que poseen sus cápsulas con una gran separación entre sí. Esta técnica permite una gran sensación de espacialidad y un color de ambiente muy agradable. Esto es debido a que ésta técnica se basa en las diferencias de fase entre un micrófono y otro. No poseen buena compatibilidad mono, y necesariamente requieren espacios más grandes para su implementación. La técnica emplea dos micrófonos frente a la fuente, a cierta distancia y simétricos a una línea central. Estos pueden ser omni o cardioides, los primeros dan una respuesta plana. Este montaje produce un sonido espacioso y grande pero la imagen estéreo es más difusa y menos detallada.
blumleim

Si el campo sonoro es muy amplio podemos separar los micrófonos y en el centro colocar uno cardioide para cubrir el hueco dejado por la separación.
En esta toma los cardioides dan mejor resultado cuando pasamos el sistema a mono, ya que captan menos información en común.

El Arte de Microfonear ( parte I )


A-B estéreo

estereo

La técnica A-B estéreo hace uso de dos micrófonos separados (a menudo omnidireccionales) para grabar señales de audio. La distancia entre los micrófonos supone pequeñas diferencias en la información de tiempo o fase contenida en las señales de audio (según las direcciones relativas de las fuentes de sonido). De igual manera que el oído humano puede apreciar diferencias de tiempo y fase en las señales de audio y usarlas para la localización de las mismas, la diferencia de tiempo y fase actuarán como señales estéreo para permitir a la audiencia captar el espacio en la grabación y experimentar una intensa imagen estéreo de todo el campo de sonido, incluyendo la posición de cada señal individual y los límites espaciales de la propia sala.
Distancia entre micrófonos: Una consideración importante cuando preparamos una grabación A-B estéreo es la distancia entre los micros. Desde que el carácter acústico de la grabación estéreo es principalmente una cuestión de gusto personal, es imposible apuntar reglas inmediatas y eficaces para la técnica estéreo por distancia de micros; sin embargo, es interesante tener en mente algunos factores acústicos importantes. Puesto que la amplitud estéreo de una grabación depende de la frecuencia, cuanto más profunda sea la calidad tonal que deseemos reproducir en el estéreo, mayor distancia ha de haber en la separación entre micrófonos. Usando una distancia recomendada entre micrófonos de un cuarto de la longitud de onda del tono más bajo, y teniendo en cuenta la reducida capacidad del oído humano para localizar frecuencias por debajo de 150 Hz, llegamos a una distancia óptima entre 40 y 60 cm. Distancias menores se usan a menudo para captar fuentes de sonido próximas, para prevenir que la imagen del sonido de un instrumento concreto sea demasiado ancha y poco natural. Distancias por debajo de 17 o 20 cm son detectables para el oído humano porque es la separación equivalente a los oídos. Debería apuntarse también que un incremento en la distancia ente micrófonos disminuirá la capacidad del sistema para reproducir señales ubicadas justo entre ellos. Esto conduce también a una reducción en la calidad de la grabación estéreo cuando se reproduzca en mono.
Distancia entre los micrófonos y la fuente de sonido: La distancia ideal desde el par de micrófonos a la fuente de sonido no depende solamente de tipo y tamaño de la fuente y el entorno en la que se ha realizado la captación, sino también del gusto personal. La posición desde la que la audiencia experimenta el evento (y de aquí la posición desde la cual el micrófono lo registra) debería ser elegida con gusto y cuidado. Las grabaciones musicales críticas, tales como una orquesta al completo en una sala de conciertos, suponen buenos ejemplos de la importancia del posicionamiento correcto de los micrófonos. Aquí los micrófonos se colocarían típicamente por encima o detrás del director. Y aunque la mayoría de los instrumentos proyectan su sonido hacia arriba, los micrófonos deberían estar colocados suficientemente elevados para que cada músico por separado no ensombrezca a los demás. La mezcla de sonido directo y difuso en una grabación es además de importancia crucial, por lo que suele emplearse mucho tiempo en establecer la posición óptima de los micrófonos. Es aquí donde la versatilidad de nuestro sistema A-B estéreo entra en juego. Usando los diferentes emplazamientos acústicos para los micrófonos, la cantidad de ambientación y el color tonal de la grabación, el sistema se puede ajustar sin añadir ningún ruido. La elección del suelo y la cubierta apoyados de la reverberación puede permitirnos añadir flexibilidad cuando coloquemos los micrófonos. Los micrófonos omnidireccionales y el sistema A-B estéreo son, a menudo, la elección más usada cuando la distancia entre los micrófonos y la fuente de sonido es grande. La razón es que los micrófonos omnidireccionales son capaces de captar las verdaderas frecuencias bajas de la señal con indiferencia de la distancia, mientras que los micrófonos direccionales están influenciados por el efecto proximidad. Los micrófonos direccionales, por tanto, mostrarán pérdida de bajas frecuencias a grandes distancias.
En la figura siguiente podemos observar la grabación de un coro con la técnica espaciada y respetando la regla 3 a 1. La regla 3 a 1 dice que al tomar la misma fuente de sonido con más de un micrófono, para minimizar los problemas de cancelación de fase, se debe respetar una distancia entre micrófonos de al menos 3 veces la distancia del primer micrófono a la fuente de sonido.
Tecnica

Par PZM espaciado

MS

Esta técnica es similar a la A-B estéreo pero con micrófonos del tipo PZM.

Par omnidireccional con cabeza artificial

microfoneo

Produce un efecto sorprendentemente realista respecto de la escucha binaural, especialmente a través de auriculares. Excelente respuesta en frecuencia, especialmente en bajos. La técnica de grabación binaural hace uso de dos micrófonos omnidireccionales que se colocan en los oídos de un maniquí. Estos sistemas de doble canal emulan la percepción del sonido, y proveen a la grabación de una importante información aural sobre la distancia y la dirección de las fuentes sonoras. Cuando estas grabaciones se reproducen con auriculares, la audiencia experimenta una imagen sonora esférica, donde todas las fuentes de sonido son reproducidas con la dirección espacial correcta. Las grabaciones binaurales se usan a menudo para sonido ambiente o en aplicaciones de realidad virtual. En una mezcla, nunca está de más contar con una o varias pistas capturadas en "estéreo real", mediante el uso de esta técnica. De este modo, contaremos con una referencia espacial realista que nos permita situar el resto de las pistas a partir de una "anchura" estéreo ya dada.

Árbol Decca ("Decca tree"
Configuración con gran aceptación en el mundo de la grabación orquestal. Originalmente introducido por el sello Decca, el árbol consiste en una figura de tres puntos formada por micrófonos omnidireccionales en un triángulo (casi equilátero) apuntando hacia la fuente sonora. Los dos micros exteriores están bastante apartados, de manera que aparece un agujero central si no se coloca un micro en ese lugar. Ese micro central debería ser mezclado para rellenar el hueco, teniendo cuidado de no enturbiar la perspectiva del sonido haciéndola demasiado monofónica. Las distancias exteriores oscilan entre 60 y 120 cm. El tercero, el del centro puede estar ligeramente por debajo y por delante del par externo. Dependiendo de las variables acústicas de la sala donde el conjunto o la orquesta sean grabados, el árbol puede ser alzado o bajado para lograr el mejor resultado. Es una colocación con mucho éxito porque asegura un sonido natural, sin fisuras para la audiencia, y les permite experimentar la interpretación en un contexto de dinámica total. A menudo, el árbol se coloca justo detrás o encima del director, lo cual da como resultado un balance muy cercano a la intención musical. Además, los tres micrófonos se aproximan más a las secciones de la orquesta que los sistemas A-B, proporcionando mucha más claridad y definición de la imagen estéreo, logrando así una reproducción más intensa y detallada.

par coincidente

blumleim