PCM para dummies
+7
Amaranto
fenixuno
Quimi
rafa75
Júpiter
ferwar
El Hombre del SACD
11 participantes
Página 1 de 1.
PCM para dummies
Basado en hechos reales
Vaya historia surrealista que os voy a contar, pero sucedió de verdad, hace muchos años, por más que os parezca imposible.
Teníamos a un arquitecto holandés que quería construir un monumento en su pequeño pueblo, una gran cúpula de varios metros de altura, y erigida mediante decreto municipal en honor a la música. Una simple cúpula cuya esfericidad evocara la dulzura de tantas melodías inventadas por el hombre a lo largo de su historia. Muchos monumentos se han conocido para llevar a los altares tan noble arte el de la composición. Pero nuestro arquitecto deseaba que aquella cúpula siguiera con su redondez la más perfecta de las curvas, y para ello comenzó a estudiar la técnica más adecuada a sus propósitos.
Fig. 1
Se trataba de levantar un gran arco senoidal, de quince metros de altura, para emular en la piedra la forma de una onda sonora perfecta. El interior sería totalmente hueco para que el público se reuniera en su interior para celebrar conciertos y otros actos musicales. Debido a sus colosales dimensiones, se precisaba que la cúpula fuese soportada por dentro con varios pilares de hormigón, así más o menos:
Fig. 2
Y ahí comenzó el problema, porque nuestro arquitecto sólo contaba con cuatro clases de bloques para su proyecto, piezas que eran fabricadas por una única empresa especializada. Los había de 8, de 4, de 2, y de 1 metro de longitud, y sólo con la suma de estos podía realizar diversos empalmes para llegar a la altura adecuada donde soportar el peso de la gran curva.
Fig. 3
Había una condición para construir esta estructura empalmada: por una razón de seguridad y de economía, se requería que los bloques fueran siempre diferentes entre sí, no valía colocar 15 bloques de un metro para levantar una columna de 15 metros.
Para encontrar la solución a este proyecto, recurrió a un colega suyo de Japón que unos años antes se había planteado lo mismo, y que había resuelto de una manera simple y elegante. Sin dudarlo un minuto, nuestro genio llamó a su amigo para que le ayudara a emsamblar las piezas de la manera más adecuada, y para que su magnífica cúpula fuera lo más perfecta posible, siguiendo una línea correcta.
El arquitecto japonés, muy dado a las adivinanzas y a los juegos matemáticos, envió por carta este mensaje cifrado a su colega holandés:
Se suponía que con ceros y unos era posible describir su curva con precisión, pero nuestro protagonista se quedó muy contrariado ante esa respuesta aparentemente críptica e incompresible.
De nuevo, a vuelta de correo, rogó al amigo que le diera una pista para intentar resolver el acertijo, y éste se la dio de manera inmediata con otra misiva. En el papel sólo escribía dos símbolos:
Aquello parecía indicar que dividiera entre cuatro, y lo que hizo a continuación fue dividir los ceros y unos en grupos de 4, quedando de la siguiente manera:
Entonces, viendo estos grupos de cuatro cifras, recordó de repente que cada uno de los bloques de hormigón estaba marcado con un código de cuatro números, en su base. Tal que así:
Fig. 4
El mayor, de ocho metros, llevaba el código 1000. El de 4 metros, 0100. El de 2 metros, 0010. Y el más pequeño, de 1 metro, 0001. Como puede observarse, en el mensaje del japonés aparecían otros números distintos, y esto no terminó con el misterio, sino que le hizo pensar más y más.
Así que cogió el primer grupo que aparecía en el mensaje, 0101, y probó a sumar. Sí, parecía que 0101 era la suma de las piezas 0100 y 0001.
Es decir, con la pieza de 4 metros más la de 1 metro, se colocaba una primera columna de un total de 5 metros. En el sistema decimal, éste era su equivalente:
Se podían conseguir 16 combinaciones, como por ejemplo éstas:
Fig. 5
¡Asunto resuelto! El nipón le había dado los valores exactos para levantar su cúpula mediante los bloques prefabricados. En la serie de ceros y unos se explicaba la manera de ensamblar dichos bloques para conseguir de manera exacta cada una de las alturas exigidas: 5, 12, 15, 12 y 5 metros a lo ancho de la cúpula:
Fig. 6
Así, de manera elegante, y con sólo cuatro piezas, se conseguían diferentes alturas, en valores enteros desde 0 y hasta 15, pasando por los 14 valores intermedios. Y lo más curioso de todo esto es que la esctructura se podía explicar con ceros y unos, en grupos de cuatro.
Las comparaciones no siempre son odiosas
Esto que os he contado es sólo una parábola para poder explicar el tema que nos ocupa, pero se corresponde con la realidad. La cúpula senoidal no es otra cosa que una onda de sonido, que también es senoidal. El arquitecto holandés es un símil de la empresa Philips, que colaboró con la japonesa Sony para recrear digitalmente una onda (en la década de los 70, Sony ya había anticipado en el mercado un lector de discos digitales, el malogrado Digital Audio Disk, DAD, que manejaba ya el lenguaje digital presente en el posterior Compact Disc). Los bloques de hormigón son bits, y en este caso concreto son 4 bits para codificar nuestro sonido. Y todo el secreto de convertir series de unos y ceros en números enteros decimales es el sistema de modulación PCM, grosso modo. Veamos cómo con cuatro bits igualmente podemos hacer lo mismo para modular esta onda.
Fig. 7
En este caso, vamos a reconstruir una onda completa, es decir, las dos semiondas, la positiva a la izquierda, y la negativa a la derecha, y comenzamos a añadir bits desde la base, en vez de hacerlo desde el eje de coordenadas, y con eso nos evitamos manejar números negativos.
Como podéis observar, aislamos el tercer lapso (primera columna de la izquierda) para analizar los bits que aparecen, y coloreamos sus valores. Azul para el bit 1000 (8 de valor decimal), rojo para el bit 0010 (de valor 2), y verde para el bit 0001 (de valor 1). En digital binario, estaríamos expresando esto de esta manera:
En valores decimales tenemos un 11, tal como aparece en el eje de amplitud, a la izquierda. Pero ¿qué significa ese número 11?. Es ni más ni menos que un valor de voltaje determinado, pongamos para simplificar que son 1,1 voltios. Los mismos que llegarán a nuestro amplificador para lanzar potencia directamente a nuestro altavoz y poder moverlo.
De manera que, muchas palabras (grupos de colores) de bits, contados por el procesador de nuestro lector, va a generar sucesivos valores de tensión. En el tiempo 3, como hemos visto en el diagrama tenemos 1,1 voltios. En el tiempo 6, son 1,4. En el tiempo 9 registramos 1,5... podeís contar por vuestra cuenta los siguientes valores, y observaréis cómo sube y baja la corriente eléctrica siguiendo una curva a través del tiempo. Todo esto es muy simplificado, pues en un CD normal los grupos de bits se cuentan 44.100 veces por segundo, y estos grupos de bits están formados no por 4, sino por muchos más, hasta 16. En una cadena digital, esto es lo que encontraríamos en realidad, 16 bits agrupados en sucesivos grupos:
¿Por qué se usan 16 bits? En el momento de la introducción del CD, 16 bits era un valor muy alto para los ordenadores de la época, y era impensable aumentar más ese número porque el procesamiento de datos se haría demasiado largo para circuitos tan poco potentes, y se corria el riesgo de que el sonido se entrecortara.
Por otro lado, los ingenieros y músicos consultados encontraron que un sample de 16/44.1 era de suficiente calidad para los estándares de la época y para la mayoría de aficionados a la música. Pero se quedaron un poco justos, según parece, porque tras la presentación al público muchos especialistas criticaron el resultado frío y clínico de aquel nuevo formato. Como todos sabemos (aunque algunos no se molestan en averiguarlo) las mejoras de los circuitos y en las técnicas de filtrado han sido constantes, y ha existido una constante evolución para mejorar las cosas, de manera que hoy podemos asegurar sin temor a equivocarnos que los mejores lectores de CD no temen comparaciones con un buen equipo tradicional de tipo analógico. Las nuevas grabaciones en alta definición liberan al sonido digital del estrecho corsé que suponía ajustarse de forma fija a las especificaciones Red Book, que se establecieron como leyes básicas para cualquier sistema compatible con los CD de audio, y dan al sonido digital nuevas posibilidades.
¿Cómo se extrae la información de un CD?
Explicado el núcleo de la codificación digital de clase PCM, paso a exponer cómo se implementa todo esto en nuestros equipos, y cómo es posible que una serie de ceros y de unos puedan llegar a emocionarnos y hacernos creer que escuchamos a Beethoven.
Volvemos a los grupos de 4 bits, para manejar más comodamente los conceptos.
Comencemos por el principio. Sacamos el CD de su caja y observamos sus microscópicos surcos con una lupa. Vaya, y de ahí sale música. Son decenas de kilómetros de código de barras, enrollados en una espiral, y metidos en ese disco de plástico. ¿Cómo se leen los hoyitos (pits) que vemos, a través del cabezal laser? Obviamente, dejamos a los electricistas la explicación de cómo la luz del láser se transforma en impulsos de electricidad.
Fig. 8
El concepto es bastante sencillo de entender: cada cambio de valle a pico (o de land a pit), y de pico a valle se traduce en un cambio de 0 a 1 y viceversa. Un reloj va dividiendo en periodos precisos a medida que el láser pasa por la espiral de datos, y cuando aparece algo distinto a lo anterior, se cambia de estado, a 0 ó a 1.
Fig. 9
Supongamos que nuestro láser ya ha leído el disco, y que en nuestro lector ya circulan amplificados estos datos:
¿Qué hacemos ahora con estos números? Los mandamos a un circuito, que no es otra cosa que una puerta lógica, donde se separan los diferentes valores de tensión. Dentro de ese chip, lo primero que encontramos es un reloj que cuenta 4 bits y los va separando en grupos, para que sean leídos por la siguiente etapa de manera clara y secuencial.
Esta segunda etapa va a transformar por fin la secuencia de dígitos en números enteros, con lo que pasamos del mundo binario al mundo decimal, un material mucho más manejable por nuestros amplificadores. Esto es importante de entender: una batería de conmutadores que suman sus salidas (4 si usamos 4 bits, 16 si manejamos 16 bits) van dejando pasar una pequeña cantidad de corriente, de forma que las diferentes combinaciones entre ellos darán toda la gama de tensiones que precisamos para luego amplificar como música, de la misma forma que en el ejemplo del cuento se usaban 4 bloques para elevar columnas de diferente longitud. De la precisión con que se entregan los diferentes valores de tensión dependerá en buena parte que escuchemos de forma satisfactoria nuestros discos.
Fig. 10
En esta nueva fase tenemos trabajando 4 conmutadores en paralelo que entregan de manera fija 0,8 (azul), 0,4 (rosa), 0,2 (rojo) y 0,1 (verde) voltios. Cuando aparece un 1 en la puerta, se abre el conmutador correspondiente y escupe su dosis de corriente. A un valor binario de 0110, como tenemos al principio de la cadena, el chip nos lo va a descomponer en la suma 0100 + 0010. En la figura, se abrirían entonces los interruptores rosa (0100) y rojo (0010), y de forma conjunta entregan un total de 0,6 voltios.
El segundo grupo de dígitos (1001) genera 0,9 voltios, como aparece en la figura inferior. Y así, todo el tiempo hasta llegar al final del disco. Imagina todos esos interruptores, un total de 16 en el caso del CD, abriéndose y cerrándose a una velocidad de vértigo, miles de veces por segundo, mientras degustas tu música...
Si entiendes todo esto... ¡enhorabuena, ya sabes en qué consiste el sonido digital de tus CD!
Una panorámica general
Voy a intentar ofreceros un esquema general del proceso de grabación-reproducción digital.
Fig. 11
Estamos en el estudio de grabación. Nuestros micrófonos ha recogido una maravillosa pieza musical, y todas sus vibraciones han sido amplificadas y grabadas en una cinta magnética. El resultado de esa grabación lo vamos a meter en nuestra máquina digital para fabricar un disco compacto. Lo primero que hacemos es ajustar la tensión de la corriente eléctrica que procede de la fuente para manejar de forma conveniente todos esos impulsos eléctricos. Esta fase corresponde al cuadradito rosado de arriba. Como puede comprobarse, a la salida de este proceso la onda no ha sido modificada todavía.
En la siguiente fase, usamos un filtro pasabajo para eliminar todas aquellas frecuencias por encima del límite que nuestro sistema digital sea incapaz de procesar. Es el cuadrado azul.
En la tercera fase, que corresponde al cuadrado turquesa, ya vamos a meter la tijera, por decirlo de una manera gráfica. Mandado por un reloj muy preciso, para evitar lo que se conoce como jitter, un circuito va a ir cortanto a intervalos regulares nuestra onda original, para quedar totalmente troceada. De esta manera, habremos descompuesto una onda contínua en un tren de valores decimales correlativos: 1-2-4-5-4-7-3-5... números que se corresponden con la amplitud de la onda original. En este momento, estamos generando los diferentes valores que permiten calcular las alturas de las columnas del cuento, tal como aparece en la figura 2. A la salida de esta fase, ya tenemos un código que se conoce como PAM (modulación por amplitud de impulsos), y que es la versión analógica del PCM digital que vamos a crear a continuación.
Ya estamos ante el famoso convertidor analógico-digital (ADC) del que se habla tanto, y que aparece representado como un cuadrado verde. Este convertidor se encargará de convertir los valores decimales del PAM en ceros y unos. ¿Cómo? Pues como hemos contado en nuestra historieta, y que podemos recordar a través de la figura 5 y siguientes.
Ahí no termina todo, porque todos esos datos binarios no podemos meterlos en nuestro CD por las buenas ¡paciencia! Se necesitan algunos bits adicionales para que todo funcione bien.
Este es el esquema general de lo que llamaremos a partir de ahora bitstream de datos:
Fig. 12
Es como un tren muy largo, casi interminable, donde aparecen diferenciados varias clases de vagones.
Tenemos la locomotora que "tira" del resto del convoy, y que vamos a llamar SINCRO. ¿Qué es esto? Pues ni más ni menos que los datos necesarios para el control de los motores del cabezal láser y del eje que hace girar nuestro disco (recordemos que la velocidad radial del CD no es constante). Cuando se lee esta información, el disco dice a nuestro lector: "tienes que colocar el foco del láser en el sector x, y el motor debe girar a y revoluciones".
Tras esa orden a los servos del lector, encontramos por fin los valores del sonido que hemos estado estudiando, y que se representan con 16 bits dentro de las casillas de color verde. En el primer vagón encontramos los valores que se atribuyen al canal derecho (RC), y enseguida el láser realiza la lectura del vagón de otros 16 bits que se van al canal izquierdo (LC). En realidad, existen otros vagones con información de diversa índole, pero de momento lo simplificamos de esta manera para que todo se entienda mejor.
Finalmente, en la cola, encontramos un curioso vagón, denominado CRC. Se trata de un código de 11 bits cuya misión es asegurar que la lectura de todos los datos anteriores se ha realizado de la manera correcta, cosa que no siempre es así por el polvo o las huellas que han interrumpido la lectura de los datos por un instante. Debido a su complejidad, prefiero dejar su explicación para más adelante (quizás algún día de éstos yo también lo entienda).
Cuando finaliza la lectura del CRC, el láser pasa al siguiente tren de datos, y vuelta a empezar desde el principo a una velocidad de 44.000 trenes por segundo. Vaya cantidad de información más enorme ¿verdad?.
Todo esto es lo que encontramos reflejado en los surcos de nuestros CD, y cuando nos decidimos a escucharlo en casa, el proceso de lectura es justamente el contrario al de su elaboración, tal como aparece en la zona inferior de la figura 11.
¿Por qué la música en digital?
Alrededor del sonido digital se han contado muchas cosas, algunas muy ciertas, otras afectadas por errores de apreciación, e incluso algunas muy alejadas de la realidad, y mucha gente se aferra a la idea de que es, de manera definitiva e irresoluble, inferior al audio tradicional analógico. Pero ¿esto es así? La verdad es que de alguna manera tiene una reputación merecida, porque en ocasiones su sonido es granuloso, débil, poco envolvente, en la mayoría de los casos como consecuencia de algún problema de fondo, o de una pobre ingeniería y su aplicación defectuosa.
Muchos se preguntarán a qué viene toda esta complicación de convertir una onda analógica en millones de ceros y unos. En digital y sobre el papel, este sistema tiene muchas ventajas. Supera técnicamente y en todos los aspectos a un viejo formato popular como es el vinilo, y mejora sus características de ruido, separación de canales, distorsión y dinámica.
¿Por qué binario? Porque nuestros chips y ordenadores funcionan en binario, y manejan bien el stream de datos con las instrucciones de un codec, y no hay posibilidad de errores porque los bits manejan sólo dos niveles, cero y uno, negro y blanco, y entre el negro y el blanco no existen tonos intermedios que pudiésemos confundir o malinterpretar. En binario, podemos copiar una información y replicarla infinitas veces sin que exista pérdida alguna. No pueden perderse los bits o confundirse por otros, todos están bajo estrecha vigilancia, y los algoritmos de tipo CRC ponen aún más difícil el posible error.
Un viejo invento sin aplicación
La Modulación por Impulsos Codificados (PCM) que hemos analizado en este artículo se inventó hace décadas, cuando Alec Reeves propuso que la representación eléctrica del sonido para su transmisión se realizara con muestras a intervalos regulares, y como una sucesión de números binarios. Reeves entendía bien que dichas muestras podían ser generadas y almacenadas con una precisión limitada, pero por otro lado también sabía que la importancia de los errores numéricos sería menor que los errores introducidos en señales analógicas debido al ruido eléctrico y de baja fidelidad de los equipos de su tiempo. Lo que Reeves no tuvo en cuenta (y no tuvo oportunidad de experimentar) era si esos errores más leves serían más o menos molestos que el soplido relativamente soportable que introducían los equipos analógicos. No obstante, el alcance de sus ideas fue impresionante para su época, y cuando en 1937 patentó su sistema declaró que la calidad de la digitalización y del audio reproducido posteriormente dependería especialmente de lo bien hechos que estuvieran los convertidores AD y DA empleados. En aquel momento fue una conclusión que sonaba radical, pero que con los años ha demostrado ser correcta.
Las ideas de Reeves se basaban sólidamente en las matemáticas, y en especial sobre el teorema de muestreo de Nyquist. Esta teoría se publicó por primera vez en 1915, y de forma resumida enunciaba que si una señal no contiene frecuencias más altas que N, entonces la señal puede ser completamente determinada por un conjunto de muestras espaciadas regularmente, siempre que la frecuencia de muestreo sea superior a 2 x N. Esto significa que si queremos sintetizar una señal de audio cuya máxima componente sea 20 kHz, una frecuencia de muestreo superior a 40 kHz es suficiente, por ejemplo... 44.1 kHz.
Todos hemos manejado alguna vez un compás, y la mayoría sabemos que un círculo de un determinado radio puede trazarse conociendo dos de sus puntos. Este hecho es paralelo al enunciado del teorema de Nyquist, y permite entender mejor su significado, máxime si consideramos que una onda senoidal no es más que la proyección lineal de un círculo.
Cuando Reeves patentó su PCM, no le fue posible medir muestras con la suficiente rapidez para registrar la totalidad del ancho de banda del oido humano. Pero en 1947, gracias a la invención del transistor, las cosas cambiaron de un modo radical. Muchos años de desarrollo tecnológico hicieron aumentar la velocidad de los transistores hasta el punto de permitir la construcción de dispositivos digitales que funcionaran de forma eficaz.
La imperfección física de unas matemáticas perfectas
La primera grabación en PCM se probó en 1976, y un año después Sony y Philips ya habían desarrollado prototipos de grabación digital, de almacenamiento y de reproducción. ¿Cómo sonaba todo aquello? No todo lo bien que se esperaba, y es posible que los vinilos de su época todavía entregaran mayor profundidad, mayor precisión, con más aire y más calor, en términos audiófilos.
La razón por la que estos primeros sistemas sonaban pobres no era alguna deficiencia en los teoremas de muestreo, o en los conceptos técnicos del audio digital. Reeves había acertado casi 50 años antes cuando afirmó que las deficiencias del audio digital serían consecuencia de la utilización de convertidores de escasa calidad, los que se disponían en aquel momento. Era extremadamente difícil y costoso tratar de construir un buen convertidor de 16 bits a 44 kHz en la década de los 70, y no fue mucho más sencillo hacerlo en 1982, cuando apareció por primera vez el Compact Disc. En consecuencia, ni los convertidores AD de los equipos de estudio, ni los convertidores DA en los productos de consumo eran lo suficientemente buenos como para festejar aquel enorme bombo que acompañó al lanzamiento del nuevo formato.
Principalmente hay tres problemas principales por los que los convertidores no pueden acercarse al ideal matemático.
En primer lugar, debemos tener en cuenta la precisión y la linealidad de los circuitos de muestreo utilizados. Imaginemos que un voltaje analógico tenga un valor preciso de 1 voltio, y que buscásemos reflejar este valor en una muestra digital, digamos que como 1.000.000 (representada como número decimal). En la década de los 70 era muy poco probable que esto se hubiese conseguido de manera exacta, y esa muestra podría haber sido de un valor de 1.000.001, ó bien 999.999. Y seguro que el error hubiera sido mayor. Esta falta de linealidad se traducía en distorsión de audio. Si el error es aleatorio, por ejemplo, a causa del ruido electrónico dentro del circuito, entonces el resultado dará lugar a un ruido de audio similar al generado por la electrónica analógica, y entonces el problema no es preocupante. Pero si el error es sistemático, habrá una distorsión que puede generar desagradables artefactos digitales. Esto es lo que se muestra, de manera simplificada, en la figura 13, donde una señal analógica que aumenta su amplitud de manera constante se ve afectada por las inexactitudes del sample digital. El muestreo en general es correcto, pero un valor es demasiado bajo, mientras que otro es demasiado alto. El resultado es una versión distorsionada con respecto a la onda de entrada.
Fig. 13
Tu reloj atrasa un poquito
En segundo lugar, tenemos que considerar la exactitud de los relojes que controlan los convertidores. En los sistemas de muestreo utilizados para el audio digital, las diferencias de tiempo entre las muestras deben ser absolutamente regulares, tanto para la grabación como para cuando se reproduzcan. Cualquier desviación del ideal matemático se llama "jitter" y, de nuevo, este error de medición dará lugar a distorsión y a ruido. Este problema se debe a que algunas de las muestras se miden un poco más temprano o un poco más tarde, debido a la baja calidad de los componentes, aunque la tasa media del muestreo sea la correcta.
Incluso en el nacimiento de audio digital los problemas que provocaba el jitter eran pequeños, y otros fenómenos tales como el aliasing (que merecería un capítulo aparte) fueron y siguen siendo más determinantes en la degradación del sonido. Vamos a ilustrar el problema de la misma manera como lo hicimos para la no-linealidad en la figura 13.
Consideremos una señal muestreada a 44,1 kHz, e imaginemos que el reloj que determina cuándo se toman las muestras tiene una precisión de una millonésima de segundo. ¡Esto suena muy preciso!, pero si echamos cuentas vamos a encontrar que cualquier muestra de nuestro CD puede haber sido tomada hasta un cinco por ciento demasiado pronto o demasiado tarde. Esto sería un error totalmente inaceptable, y hoy en día los relojes tienen una precisión de billonésimas de segundo, que es mucho más que la tecnología ofrecía en los inicios de la era digital.
La figura 14 muestra un ejemplo exagerado de este fenómeno. La segunda y tercera muestras son precisas en cuanto a que representan correctamente la amplitud de la señal en el momento en que se toman, pero una se ha medido demasiado tarde, mientras que el siguiente se ha medido antes de tiempo. Esto significa que los valores no son los que deben aparecer, y el resultado, de nuevo, es distorsión.
Fig. 14
Como el redondeo que hace tu banco
En tercer lugar, está la resolución del convertidor. La conversión de un voltaje analógico en una cadena de valores introduce errores de cuantificación. En nuestro ejemplo del cuento que presentábamos al principio, si quisiéramos cubrir un hueco de 50 centímetros no podríamos, ya que la pieza más pequeña tiene 1 metro, de manera que si a la cúpula le colocamos una pieza de 1 metro (en vez de otra de 0,5) nos aparecerá un bulto en la curva del edificio. Este error aparece reflejado en las gráficas de la figura 15. Afortunadamente, este defecto puede ser eliminado mediante la adición de un tipo muy seleccionado de ruido (conocido como "dither") a la señal de entrada. Si añadimos un poco de dither, la distorsión se mantiene aunque a un nivel inferior. Añadimos demasiado y la señal resultante se convierte en excesivamente ruidosa. La teoría es bien conocida, pero el tema ha generado, sin embargo, un debate interminable en los últimos 30 años, y sigue siendo un tema polémico.
Fig. 15
Conclusiones
Así que esto es lo que tenemos. Riesgo de errores en el almacenamiento y la reproducción de las muestras digitales; efectos de la no-linealidad; el jitter; un número inadecuado de bits; aliasing; y procesamiento pobre de señal. Todo ello contribuye a la degradación de la señal, y como resultado, un mito entró en la conciencia del público: de que el audio digital de por sí sonaba mal en todos los casos, y que no existía solución que de manera efectiva solventara los problemas. Pero si aceptamos el teorema de muestreo y adoptamos buenas prácticas de ingeniería, no hay ninguna razón por la cual hoy en día los sistemas de audio digital deban ser otra cosa que excelentes maneras de almacenar, manipular y reproducir audio. Gracias a la tecnología moderna, los desarrolladores pueden acercarse a los ideales mucho más cerca, de modo que, en el mundo real, el audio digital no tiene necesariamente peor sonido que los mejores equipos analógicos, y en muchos sentidos puede ser superior. En honor a la verdad, hay ventajas y desventajas en términos de ruido, de precisión y de flexibilidad, tanto en el mundo analógico como en el digital, y ante la pregunta "¿qué es mejor?", quizas tengamos que responder con la respuesta burlona "¿para qué?".
Por desgracia, la tendencia actual es que se está lejos de consumir alta calidad en audio digital. Persuadir a la industria de la música para reemplazar el equipo de CD con equivalentes de alta definición a 96 kHz fue bastante difícil en la década de 1990, cuando había grandes esperanzas para el cambio a DVD-Audio y a SACD. Tratar en la actualidad de convencer a lo que queda de la industria musical para que se sustituyan nuestros sistemas con equipos a 192 kHz con formato DSD (para que esta realización maravillosa sea destruida luego por la conversión a MP3) es ahora mucho más difícil. Así pues, en un giro perverso del destino, nos encontramos de nuevo en los comienzos de la década de 1970, con unas grabaciones analógicas de alta calidad que muchas personas optan por escuchar y que a menudo suenan más agradables que las alternativas digitales, y eso... ¡manda huevos!.
Vaya historia surrealista que os voy a contar, pero sucedió de verdad, hace muchos años, por más que os parezca imposible.
Teníamos a un arquitecto holandés que quería construir un monumento en su pequeño pueblo, una gran cúpula de varios metros de altura, y erigida mediante decreto municipal en honor a la música. Una simple cúpula cuya esfericidad evocara la dulzura de tantas melodías inventadas por el hombre a lo largo de su historia. Muchos monumentos se han conocido para llevar a los altares tan noble arte el de la composición. Pero nuestro arquitecto deseaba que aquella cúpula siguiera con su redondez la más perfecta de las curvas, y para ello comenzó a estudiar la técnica más adecuada a sus propósitos.
Fig. 1
Se trataba de levantar un gran arco senoidal, de quince metros de altura, para emular en la piedra la forma de una onda sonora perfecta. El interior sería totalmente hueco para que el público se reuniera en su interior para celebrar conciertos y otros actos musicales. Debido a sus colosales dimensiones, se precisaba que la cúpula fuese soportada por dentro con varios pilares de hormigón, así más o menos:
Fig. 2
Y ahí comenzó el problema, porque nuestro arquitecto sólo contaba con cuatro clases de bloques para su proyecto, piezas que eran fabricadas por una única empresa especializada. Los había de 8, de 4, de 2, y de 1 metro de longitud, y sólo con la suma de estos podía realizar diversos empalmes para llegar a la altura adecuada donde soportar el peso de la gran curva.
Fig. 3
Había una condición para construir esta estructura empalmada: por una razón de seguridad y de economía, se requería que los bloques fueran siempre diferentes entre sí, no valía colocar 15 bloques de un metro para levantar una columna de 15 metros.
Para encontrar la solución a este proyecto, recurrió a un colega suyo de Japón que unos años antes se había planteado lo mismo, y que había resuelto de una manera simple y elegante. Sin dudarlo un minuto, nuestro genio llamó a su amigo para que le ayudara a emsamblar las piezas de la manera más adecuada, y para que su magnífica cúpula fuera lo más perfecta posible, siguiendo una línea correcta.
El arquitecto japonés, muy dado a las adivinanzas y a los juegos matemáticos, envió por carta este mensaje cifrado a su colega holandés:
01011100111111000101
Se suponía que con ceros y unos era posible describir su curva con precisión, pero nuestro protagonista se quedó muy contrariado ante esa respuesta aparentemente críptica e incompresible.
De nuevo, a vuelta de correo, rogó al amigo que le diera una pista para intentar resolver el acertijo, y éste se la dio de manera inmediata con otra misiva. En el papel sólo escribía dos símbolos:
:4
Aquello parecía indicar que dividiera entre cuatro, y lo que hizo a continuación fue dividir los ceros y unos en grupos de 4, quedando de la siguiente manera:
0101 1100 1111 1100 0101
Entonces, viendo estos grupos de cuatro cifras, recordó de repente que cada uno de los bloques de hormigón estaba marcado con un código de cuatro números, en su base. Tal que así:
Fig. 4
El mayor, de ocho metros, llevaba el código 1000. El de 4 metros, 0100. El de 2 metros, 0010. Y el más pequeño, de 1 metro, 0001. Como puede observarse, en el mensaje del japonés aparecían otros números distintos, y esto no terminó con el misterio, sino que le hizo pensar más y más.
Así que cogió el primer grupo que aparecía en el mensaje, 0101, y probó a sumar. Sí, parecía que 0101 era la suma de las piezas 0100 y 0001.
0100 + 0001 = 0101
Es decir, con la pieza de 4 metros más la de 1 metro, se colocaba una primera columna de un total de 5 metros. En el sistema decimal, éste era su equivalente:
4 + 1 = 5
Se podían conseguir 16 combinaciones, como por ejemplo éstas:
Fig. 5
¡Asunto resuelto! El nipón le había dado los valores exactos para levantar su cúpula mediante los bloques prefabricados. En la serie de ceros y unos se explicaba la manera de ensamblar dichos bloques para conseguir de manera exacta cada una de las alturas exigidas: 5, 12, 15, 12 y 5 metros a lo ancho de la cúpula:
Fig. 6
Así, de manera elegante, y con sólo cuatro piezas, se conseguían diferentes alturas, en valores enteros desde 0 y hasta 15, pasando por los 14 valores intermedios. Y lo más curioso de todo esto es que la esctructura se podía explicar con ceros y unos, en grupos de cuatro.
Las comparaciones no siempre son odiosas
Esto que os he contado es sólo una parábola para poder explicar el tema que nos ocupa, pero se corresponde con la realidad. La cúpula senoidal no es otra cosa que una onda de sonido, que también es senoidal. El arquitecto holandés es un símil de la empresa Philips, que colaboró con la japonesa Sony para recrear digitalmente una onda (en la década de los 70, Sony ya había anticipado en el mercado un lector de discos digitales, el malogrado Digital Audio Disk, DAD, que manejaba ya el lenguaje digital presente en el posterior Compact Disc). Los bloques de hormigón son bits, y en este caso concreto son 4 bits para codificar nuestro sonido. Y todo el secreto de convertir series de unos y ceros en números enteros decimales es el sistema de modulación PCM, grosso modo. Veamos cómo con cuatro bits igualmente podemos hacer lo mismo para modular esta onda.
Fig. 7
En este caso, vamos a reconstruir una onda completa, es decir, las dos semiondas, la positiva a la izquierda, y la negativa a la derecha, y comenzamos a añadir bits desde la base, en vez de hacerlo desde el eje de coordenadas, y con eso nos evitamos manejar números negativos.
Como podéis observar, aislamos el tercer lapso (primera columna de la izquierda) para analizar los bits que aparecen, y coloreamos sus valores. Azul para el bit 1000 (8 de valor decimal), rojo para el bit 0010 (de valor 2), y verde para el bit 0001 (de valor 1). En digital binario, estaríamos expresando esto de esta manera:
1000+0010+0001=1011
En valores decimales tenemos un 11, tal como aparece en el eje de amplitud, a la izquierda. Pero ¿qué significa ese número 11?. Es ni más ni menos que un valor de voltaje determinado, pongamos para simplificar que son 1,1 voltios. Los mismos que llegarán a nuestro amplificador para lanzar potencia directamente a nuestro altavoz y poder moverlo.
De manera que, muchas palabras (grupos de colores) de bits, contados por el procesador de nuestro lector, va a generar sucesivos valores de tensión. En el tiempo 3, como hemos visto en el diagrama tenemos 1,1 voltios. En el tiempo 6, son 1,4. En el tiempo 9 registramos 1,5... podeís contar por vuestra cuenta los siguientes valores, y observaréis cómo sube y baja la corriente eléctrica siguiendo una curva a través del tiempo. Todo esto es muy simplificado, pues en un CD normal los grupos de bits se cuentan 44.100 veces por segundo, y estos grupos de bits están formados no por 4, sino por muchos más, hasta 16. En una cadena digital, esto es lo que encontraríamos en realidad, 16 bits agrupados en sucesivos grupos:
0100101100101001 0100100011110110 0101111100110011...
¿Por qué se usan 16 bits? En el momento de la introducción del CD, 16 bits era un valor muy alto para los ordenadores de la época, y era impensable aumentar más ese número porque el procesamiento de datos se haría demasiado largo para circuitos tan poco potentes, y se corria el riesgo de que el sonido se entrecortara.
Por otro lado, los ingenieros y músicos consultados encontraron que un sample de 16/44.1 era de suficiente calidad para los estándares de la época y para la mayoría de aficionados a la música. Pero se quedaron un poco justos, según parece, porque tras la presentación al público muchos especialistas criticaron el resultado frío y clínico de aquel nuevo formato. Como todos sabemos (aunque algunos no se molestan en averiguarlo) las mejoras de los circuitos y en las técnicas de filtrado han sido constantes, y ha existido una constante evolución para mejorar las cosas, de manera que hoy podemos asegurar sin temor a equivocarnos que los mejores lectores de CD no temen comparaciones con un buen equipo tradicional de tipo analógico. Las nuevas grabaciones en alta definición liberan al sonido digital del estrecho corsé que suponía ajustarse de forma fija a las especificaciones Red Book, que se establecieron como leyes básicas para cualquier sistema compatible con los CD de audio, y dan al sonido digital nuevas posibilidades.
¿Cómo se extrae la información de un CD?
Explicado el núcleo de la codificación digital de clase PCM, paso a exponer cómo se implementa todo esto en nuestros equipos, y cómo es posible que una serie de ceros y de unos puedan llegar a emocionarnos y hacernos creer que escuchamos a Beethoven.
Volvemos a los grupos de 4 bits, para manejar más comodamente los conceptos.
Comencemos por el principio. Sacamos el CD de su caja y observamos sus microscópicos surcos con una lupa. Vaya, y de ahí sale música. Son decenas de kilómetros de código de barras, enrollados en una espiral, y metidos en ese disco de plástico. ¿Cómo se leen los hoyitos (pits) que vemos, a través del cabezal laser? Obviamente, dejamos a los electricistas la explicación de cómo la luz del láser se transforma en impulsos de electricidad.
Fig. 8
El concepto es bastante sencillo de entender: cada cambio de valle a pico (o de land a pit), y de pico a valle se traduce en un cambio de 0 a 1 y viceversa. Un reloj va dividiendo en periodos precisos a medida que el láser pasa por la espiral de datos, y cuando aparece algo distinto a lo anterior, se cambia de estado, a 0 ó a 1.
Fig. 9
Supongamos que nuestro láser ya ha leído el disco, y que en nuestro lector ya circulan amplificados estos datos:
0110100110111000 ...
¿Qué hacemos ahora con estos números? Los mandamos a un circuito, que no es otra cosa que una puerta lógica, donde se separan los diferentes valores de tensión. Dentro de ese chip, lo primero que encontramos es un reloj que cuenta 4 bits y los va separando en grupos, para que sean leídos por la siguiente etapa de manera clara y secuencial.
0110 1001 1011 1000 ...
Esta segunda etapa va a transformar por fin la secuencia de dígitos en números enteros, con lo que pasamos del mundo binario al mundo decimal, un material mucho más manejable por nuestros amplificadores. Esto es importante de entender: una batería de conmutadores que suman sus salidas (4 si usamos 4 bits, 16 si manejamos 16 bits) van dejando pasar una pequeña cantidad de corriente, de forma que las diferentes combinaciones entre ellos darán toda la gama de tensiones que precisamos para luego amplificar como música, de la misma forma que en el ejemplo del cuento se usaban 4 bloques para elevar columnas de diferente longitud. De la precisión con que se entregan los diferentes valores de tensión dependerá en buena parte que escuchemos de forma satisfactoria nuestros discos.
Fig. 10
En esta nueva fase tenemos trabajando 4 conmutadores en paralelo que entregan de manera fija 0,8 (azul), 0,4 (rosa), 0,2 (rojo) y 0,1 (verde) voltios. Cuando aparece un 1 en la puerta, se abre el conmutador correspondiente y escupe su dosis de corriente. A un valor binario de 0110, como tenemos al principio de la cadena, el chip nos lo va a descomponer en la suma 0100 + 0010. En la figura, se abrirían entonces los interruptores rosa (0100) y rojo (0010), y de forma conjunta entregan un total de 0,6 voltios.
El segundo grupo de dígitos (1001) genera 0,9 voltios, como aparece en la figura inferior. Y así, todo el tiempo hasta llegar al final del disco. Imagina todos esos interruptores, un total de 16 en el caso del CD, abriéndose y cerrándose a una velocidad de vértigo, miles de veces por segundo, mientras degustas tu música...
Si entiendes todo esto... ¡enhorabuena, ya sabes en qué consiste el sonido digital de tus CD!
Una panorámica general
Voy a intentar ofreceros un esquema general del proceso de grabación-reproducción digital.
Fig. 11
Estamos en el estudio de grabación. Nuestros micrófonos ha recogido una maravillosa pieza musical, y todas sus vibraciones han sido amplificadas y grabadas en una cinta magnética. El resultado de esa grabación lo vamos a meter en nuestra máquina digital para fabricar un disco compacto. Lo primero que hacemos es ajustar la tensión de la corriente eléctrica que procede de la fuente para manejar de forma conveniente todos esos impulsos eléctricos. Esta fase corresponde al cuadradito rosado de arriba. Como puede comprobarse, a la salida de este proceso la onda no ha sido modificada todavía.
En la siguiente fase, usamos un filtro pasabajo para eliminar todas aquellas frecuencias por encima del límite que nuestro sistema digital sea incapaz de procesar. Es el cuadrado azul.
En la tercera fase, que corresponde al cuadrado turquesa, ya vamos a meter la tijera, por decirlo de una manera gráfica. Mandado por un reloj muy preciso, para evitar lo que se conoce como jitter, un circuito va a ir cortanto a intervalos regulares nuestra onda original, para quedar totalmente troceada. De esta manera, habremos descompuesto una onda contínua en un tren de valores decimales correlativos: 1-2-4-5-4-7-3-5... números que se corresponden con la amplitud de la onda original. En este momento, estamos generando los diferentes valores que permiten calcular las alturas de las columnas del cuento, tal como aparece en la figura 2. A la salida de esta fase, ya tenemos un código que se conoce como PAM (modulación por amplitud de impulsos), y que es la versión analógica del PCM digital que vamos a crear a continuación.
Ya estamos ante el famoso convertidor analógico-digital (ADC) del que se habla tanto, y que aparece representado como un cuadrado verde. Este convertidor se encargará de convertir los valores decimales del PAM en ceros y unos. ¿Cómo? Pues como hemos contado en nuestra historieta, y que podemos recordar a través de la figura 5 y siguientes.
Ahí no termina todo, porque todos esos datos binarios no podemos meterlos en nuestro CD por las buenas ¡paciencia! Se necesitan algunos bits adicionales para que todo funcione bien.
Este es el esquema general de lo que llamaremos a partir de ahora bitstream de datos:
Fig. 12
Es como un tren muy largo, casi interminable, donde aparecen diferenciados varias clases de vagones.
Tenemos la locomotora que "tira" del resto del convoy, y que vamos a llamar SINCRO. ¿Qué es esto? Pues ni más ni menos que los datos necesarios para el control de los motores del cabezal láser y del eje que hace girar nuestro disco (recordemos que la velocidad radial del CD no es constante). Cuando se lee esta información, el disco dice a nuestro lector: "tienes que colocar el foco del láser en el sector x, y el motor debe girar a y revoluciones".
Tras esa orden a los servos del lector, encontramos por fin los valores del sonido que hemos estado estudiando, y que se representan con 16 bits dentro de las casillas de color verde. En el primer vagón encontramos los valores que se atribuyen al canal derecho (RC), y enseguida el láser realiza la lectura del vagón de otros 16 bits que se van al canal izquierdo (LC). En realidad, existen otros vagones con información de diversa índole, pero de momento lo simplificamos de esta manera para que todo se entienda mejor.
Finalmente, en la cola, encontramos un curioso vagón, denominado CRC. Se trata de un código de 11 bits cuya misión es asegurar que la lectura de todos los datos anteriores se ha realizado de la manera correcta, cosa que no siempre es así por el polvo o las huellas que han interrumpido la lectura de los datos por un instante. Debido a su complejidad, prefiero dejar su explicación para más adelante (quizás algún día de éstos yo también lo entienda).
Cuando finaliza la lectura del CRC, el láser pasa al siguiente tren de datos, y vuelta a empezar desde el principo a una velocidad de 44.000 trenes por segundo. Vaya cantidad de información más enorme ¿verdad?.
Todo esto es lo que encontramos reflejado en los surcos de nuestros CD, y cuando nos decidimos a escucharlo en casa, el proceso de lectura es justamente el contrario al de su elaboración, tal como aparece en la zona inferior de la figura 11.
¿Por qué la música en digital?
Alrededor del sonido digital se han contado muchas cosas, algunas muy ciertas, otras afectadas por errores de apreciación, e incluso algunas muy alejadas de la realidad, y mucha gente se aferra a la idea de que es, de manera definitiva e irresoluble, inferior al audio tradicional analógico. Pero ¿esto es así? La verdad es que de alguna manera tiene una reputación merecida, porque en ocasiones su sonido es granuloso, débil, poco envolvente, en la mayoría de los casos como consecuencia de algún problema de fondo, o de una pobre ingeniería y su aplicación defectuosa.
Muchos se preguntarán a qué viene toda esta complicación de convertir una onda analógica en millones de ceros y unos. En digital y sobre el papel, este sistema tiene muchas ventajas. Supera técnicamente y en todos los aspectos a un viejo formato popular como es el vinilo, y mejora sus características de ruido, separación de canales, distorsión y dinámica.
¿Por qué binario? Porque nuestros chips y ordenadores funcionan en binario, y manejan bien el stream de datos con las instrucciones de un codec, y no hay posibilidad de errores porque los bits manejan sólo dos niveles, cero y uno, negro y blanco, y entre el negro y el blanco no existen tonos intermedios que pudiésemos confundir o malinterpretar. En binario, podemos copiar una información y replicarla infinitas veces sin que exista pérdida alguna. No pueden perderse los bits o confundirse por otros, todos están bajo estrecha vigilancia, y los algoritmos de tipo CRC ponen aún más difícil el posible error.
Un viejo invento sin aplicación
La Modulación por Impulsos Codificados (PCM) que hemos analizado en este artículo se inventó hace décadas, cuando Alec Reeves propuso que la representación eléctrica del sonido para su transmisión se realizara con muestras a intervalos regulares, y como una sucesión de números binarios. Reeves entendía bien que dichas muestras podían ser generadas y almacenadas con una precisión limitada, pero por otro lado también sabía que la importancia de los errores numéricos sería menor que los errores introducidos en señales analógicas debido al ruido eléctrico y de baja fidelidad de los equipos de su tiempo. Lo que Reeves no tuvo en cuenta (y no tuvo oportunidad de experimentar) era si esos errores más leves serían más o menos molestos que el soplido relativamente soportable que introducían los equipos analógicos. No obstante, el alcance de sus ideas fue impresionante para su época, y cuando en 1937 patentó su sistema declaró que la calidad de la digitalización y del audio reproducido posteriormente dependería especialmente de lo bien hechos que estuvieran los convertidores AD y DA empleados. En aquel momento fue una conclusión que sonaba radical, pero que con los años ha demostrado ser correcta.
Las ideas de Reeves se basaban sólidamente en las matemáticas, y en especial sobre el teorema de muestreo de Nyquist. Esta teoría se publicó por primera vez en 1915, y de forma resumida enunciaba que si una señal no contiene frecuencias más altas que N, entonces la señal puede ser completamente determinada por un conjunto de muestras espaciadas regularmente, siempre que la frecuencia de muestreo sea superior a 2 x N. Esto significa que si queremos sintetizar una señal de audio cuya máxima componente sea 20 kHz, una frecuencia de muestreo superior a 40 kHz es suficiente, por ejemplo... 44.1 kHz.
Todos hemos manejado alguna vez un compás, y la mayoría sabemos que un círculo de un determinado radio puede trazarse conociendo dos de sus puntos. Este hecho es paralelo al enunciado del teorema de Nyquist, y permite entender mejor su significado, máxime si consideramos que una onda senoidal no es más que la proyección lineal de un círculo.
Cuando Reeves patentó su PCM, no le fue posible medir muestras con la suficiente rapidez para registrar la totalidad del ancho de banda del oido humano. Pero en 1947, gracias a la invención del transistor, las cosas cambiaron de un modo radical. Muchos años de desarrollo tecnológico hicieron aumentar la velocidad de los transistores hasta el punto de permitir la construcción de dispositivos digitales que funcionaran de forma eficaz.
La imperfección física de unas matemáticas perfectas
La primera grabación en PCM se probó en 1976, y un año después Sony y Philips ya habían desarrollado prototipos de grabación digital, de almacenamiento y de reproducción. ¿Cómo sonaba todo aquello? No todo lo bien que se esperaba, y es posible que los vinilos de su época todavía entregaran mayor profundidad, mayor precisión, con más aire y más calor, en términos audiófilos.
La razón por la que estos primeros sistemas sonaban pobres no era alguna deficiencia en los teoremas de muestreo, o en los conceptos técnicos del audio digital. Reeves había acertado casi 50 años antes cuando afirmó que las deficiencias del audio digital serían consecuencia de la utilización de convertidores de escasa calidad, los que se disponían en aquel momento. Era extremadamente difícil y costoso tratar de construir un buen convertidor de 16 bits a 44 kHz en la década de los 70, y no fue mucho más sencillo hacerlo en 1982, cuando apareció por primera vez el Compact Disc. En consecuencia, ni los convertidores AD de los equipos de estudio, ni los convertidores DA en los productos de consumo eran lo suficientemente buenos como para festejar aquel enorme bombo que acompañó al lanzamiento del nuevo formato.
Principalmente hay tres problemas principales por los que los convertidores no pueden acercarse al ideal matemático.
En primer lugar, debemos tener en cuenta la precisión y la linealidad de los circuitos de muestreo utilizados. Imaginemos que un voltaje analógico tenga un valor preciso de 1 voltio, y que buscásemos reflejar este valor en una muestra digital, digamos que como 1.000.000 (representada como número decimal). En la década de los 70 era muy poco probable que esto se hubiese conseguido de manera exacta, y esa muestra podría haber sido de un valor de 1.000.001, ó bien 999.999. Y seguro que el error hubiera sido mayor. Esta falta de linealidad se traducía en distorsión de audio. Si el error es aleatorio, por ejemplo, a causa del ruido electrónico dentro del circuito, entonces el resultado dará lugar a un ruido de audio similar al generado por la electrónica analógica, y entonces el problema no es preocupante. Pero si el error es sistemático, habrá una distorsión que puede generar desagradables artefactos digitales. Esto es lo que se muestra, de manera simplificada, en la figura 13, donde una señal analógica que aumenta su amplitud de manera constante se ve afectada por las inexactitudes del sample digital. El muestreo en general es correcto, pero un valor es demasiado bajo, mientras que otro es demasiado alto. El resultado es una versión distorsionada con respecto a la onda de entrada.
Fig. 13
Tu reloj atrasa un poquito
En segundo lugar, tenemos que considerar la exactitud de los relojes que controlan los convertidores. En los sistemas de muestreo utilizados para el audio digital, las diferencias de tiempo entre las muestras deben ser absolutamente regulares, tanto para la grabación como para cuando se reproduzcan. Cualquier desviación del ideal matemático se llama "jitter" y, de nuevo, este error de medición dará lugar a distorsión y a ruido. Este problema se debe a que algunas de las muestras se miden un poco más temprano o un poco más tarde, debido a la baja calidad de los componentes, aunque la tasa media del muestreo sea la correcta.
Incluso en el nacimiento de audio digital los problemas que provocaba el jitter eran pequeños, y otros fenómenos tales como el aliasing (que merecería un capítulo aparte) fueron y siguen siendo más determinantes en la degradación del sonido. Vamos a ilustrar el problema de la misma manera como lo hicimos para la no-linealidad en la figura 13.
Consideremos una señal muestreada a 44,1 kHz, e imaginemos que el reloj que determina cuándo se toman las muestras tiene una precisión de una millonésima de segundo. ¡Esto suena muy preciso!, pero si echamos cuentas vamos a encontrar que cualquier muestra de nuestro CD puede haber sido tomada hasta un cinco por ciento demasiado pronto o demasiado tarde. Esto sería un error totalmente inaceptable, y hoy en día los relojes tienen una precisión de billonésimas de segundo, que es mucho más que la tecnología ofrecía en los inicios de la era digital.
La figura 14 muestra un ejemplo exagerado de este fenómeno. La segunda y tercera muestras son precisas en cuanto a que representan correctamente la amplitud de la señal en el momento en que se toman, pero una se ha medido demasiado tarde, mientras que el siguiente se ha medido antes de tiempo. Esto significa que los valores no son los que deben aparecer, y el resultado, de nuevo, es distorsión.
Fig. 14
Como el redondeo que hace tu banco
En tercer lugar, está la resolución del convertidor. La conversión de un voltaje analógico en una cadena de valores introduce errores de cuantificación. En nuestro ejemplo del cuento que presentábamos al principio, si quisiéramos cubrir un hueco de 50 centímetros no podríamos, ya que la pieza más pequeña tiene 1 metro, de manera que si a la cúpula le colocamos una pieza de 1 metro (en vez de otra de 0,5) nos aparecerá un bulto en la curva del edificio. Este error aparece reflejado en las gráficas de la figura 15. Afortunadamente, este defecto puede ser eliminado mediante la adición de un tipo muy seleccionado de ruido (conocido como "dither") a la señal de entrada. Si añadimos un poco de dither, la distorsión se mantiene aunque a un nivel inferior. Añadimos demasiado y la señal resultante se convierte en excesivamente ruidosa. La teoría es bien conocida, pero el tema ha generado, sin embargo, un debate interminable en los últimos 30 años, y sigue siendo un tema polémico.
Fig. 15
Conclusiones
Así que esto es lo que tenemos. Riesgo de errores en el almacenamiento y la reproducción de las muestras digitales; efectos de la no-linealidad; el jitter; un número inadecuado de bits; aliasing; y procesamiento pobre de señal. Todo ello contribuye a la degradación de la señal, y como resultado, un mito entró en la conciencia del público: de que el audio digital de por sí sonaba mal en todos los casos, y que no existía solución que de manera efectiva solventara los problemas. Pero si aceptamos el teorema de muestreo y adoptamos buenas prácticas de ingeniería, no hay ninguna razón por la cual hoy en día los sistemas de audio digital deban ser otra cosa que excelentes maneras de almacenar, manipular y reproducir audio. Gracias a la tecnología moderna, los desarrolladores pueden acercarse a los ideales mucho más cerca, de modo que, en el mundo real, el audio digital no tiene necesariamente peor sonido que los mejores equipos analógicos, y en muchos sentidos puede ser superior. En honor a la verdad, hay ventajas y desventajas en términos de ruido, de precisión y de flexibilidad, tanto en el mundo analógico como en el digital, y ante la pregunta "¿qué es mejor?", quizas tengamos que responder con la respuesta burlona "¿para qué?".
Por desgracia, la tendencia actual es que se está lejos de consumir alta calidad en audio digital. Persuadir a la industria de la música para reemplazar el equipo de CD con equivalentes de alta definición a 96 kHz fue bastante difícil en la década de 1990, cuando había grandes esperanzas para el cambio a DVD-Audio y a SACD. Tratar en la actualidad de convencer a lo que queda de la industria musical para que se sustituyan nuestros sistemas con equipos a 192 kHz con formato DSD (para que esta realización maravillosa sea destruida luego por la conversión a MP3) es ahora mucho más difícil. Así pues, en un giro perverso del destino, nos encontramos de nuevo en los comienzos de la década de 1970, con unas grabaciones analógicas de alta calidad que muchas personas optan por escuchar y que a menudo suenan más agradables que las alternativas digitales, y eso... ¡manda huevos!.
Última edición por SACDófilo el Lun 4 Abr 2011 - 1:47, editado 1 vez
El Hombre del SACD- Cantidad de envíos : 5204
Localización : Badajoz
Fecha de inscripción : 24/06/2010
ferwar- Cantidad de envíos : 1030
Localización : Valencia
Fecha de inscripción : 18/12/2008
Júpiter- Cantidad de envíos : 1089
Localización : Costa Brava
Fecha de inscripción : 27/06/2010
rafa75- Cantidad de envíos : 1552
Edad : 49
Localización : Guadalajara
Fecha de inscripción : 17/12/2008
Re: PCM para dummies
Enhorabuena!
Quimi- Cantidad de envíos : 485
Localización : Spain
Fecha de inscripción : 15/12/2008
Re: PCM para dummies
Mis más sinceras felicitaciones,
fenixuno- Cantidad de envíos : 25
Localización : Alicante
Fecha de inscripción : 05/02/2011
Amaranto- Cantidad de envíos : 467
Localización : Leon
Fecha de inscripción : 04/05/2010
Re: PCM para dummies
Antes que nada agradecerte el trabajo que te has pegado!.
Yo veo bien lo que dices, pero en general, mezclas hechos subjetivos con otros objetivos, y ahí es donde falla la explicación, creo.
"Por otro lado, los ingenieros y músicos consultados encontraron que un sample de 16/44.1 era de suficiente calidad para los estándares de la época y para la mayoría de aficionados a la música. Pero se quedaron un poco justos, según parece, porque tras la presentación al público muchos especialistas criticaron el resultado frío y clínico de aquel nuevo formato."
16/44.1 eran y SON de suficiente calidad, el oído humano de hoy en día es exactamente el mismo que el de las personas que vivían en los años 50-60-70-80... (en general, claro), si me apuras la media seguro que peor!, la juventud de antes (60/70) tenía en los guateques de antes picús poco potentes, hoy en día los cahavles entran a cualquier pub o disco y tienen el pitido asegurado durante dos o tres días!, de la presión sonora a la que se exponen.
He seguido el otro post y es la eterna lucha entre cerebro y corazón, entre ciencia y religión -si me lo permitís-.
Si os habéis hecho alguna vez una audiometría, comprobaréis que el oído humano está "diseñado" para un rango de frecuencias bastante limitado, y por arriba, a partir de 8.000 Hz ya hay una pérdida de audición importante, y los que más "llegan para arriba" suelen tener menos de 20 años, y de esos en este foro (y en esta afición) hay menos que pocos!.
Todavía recuerdo cuando compré la primera cámara de 8 megapíxeles; hice una foto con la máxima calidad para ver el resultado, y cuál fué mi sorpresa, se veía igual (en mi monitor de 19 pulgadas) que la misma foto hecha con 3 megapixels;
la diferencia radica principalmente en la calidad al ampliar (zoom) la imagen, la de 3 megapixels empieza antes a verse borrosa, claro, pero las dos imágenes vistas seguidas son indistinguibles una de otra.
Es un pequeño ejemplo de lo que digo. El hecho de que el compact disc "corte" tajantemente a 20.000 Hz y los SACD/DVD-AUDIO...se extiendan más allá de esa franja creo que es irrelevante, viendo donde llegan nuestros oídos. Otro tema es el tratamiento de la zona que sí percibimos.
Claro, si hacemos una foto con la calidad más baja, se aprecia la "falta de información", pero a partir de cierto punto... y en el audio, viendo a dónde llegan nuestros oídos, ese punto ya se rebasó hace año lo suficiente.
Yo tengo en casa SACD y DVD-AUDIO y las diferencias que pueda haber serán debidas a lo que se ha hecho con el master para que las haya.
Saludos.
Invitado- Invitado
Re: PCM para dummies
Inteligente observación, Salvamus, sabes de lo que hablas. De hecho, esa frase que señalas entra un poco en contradicción con lo expuesto como conclusión. Yo mismo, a nivel doméstico, entro en contradicción: encuentro que mis CD son muy musicales, algunos me parecen inmejorables... pero cuando escucho mis SACD entro en trance . Todo esto lo he escrito al vuelo, y me han preocupado más los gráficos que otra cosa, con el fin de ayudar a mucha gente a entender de verdad en qué consiste el PCM y, en general, el sonido transformado en información binaria.
Un saludo.
Un saludo.
El Hombre del SACD- Cantidad de envíos : 5204
Localización : Badajoz
Fecha de inscripción : 24/06/2010
Re: PCM para dummies
De nuevo te doy las gracias por la explicación que has puesto, yo tengo pocos conocimientos técnicos y siempre aprendo algo.
Respecto a lo de la contradicción, mira, sin ir más lejos, te puedo decir que en casa tengo un DAT portátil de Sony (que guardo como oro en paño!), el TCD-D8 (el primero, creo); he grabado conciertos con él a 48.000 y después al pasarlos a cd con la grabadora Marantz por la salida óptica (la grabadora convierte la señal a 44.100) siempre me ha parecido que el sonido del cd resultante era menos claro que el de la cinta!, fíjate.
Saludos.
Respecto a lo de la contradicción, mira, sin ir más lejos, te puedo decir que en casa tengo un DAT portátil de Sony (que guardo como oro en paño!), el TCD-D8 (el primero, creo); he grabado conciertos con él a 48.000 y después al pasarlos a cd con la grabadora Marantz por la salida óptica (la grabadora convierte la señal a 44.100) siempre me ha parecido que el sonido del cd resultante era menos claro que el de la cinta!, fíjate.
Saludos.
Invitado- Invitado
Re: PCM para dummies
excelente el post. sorprendente pensar que tenian claro los principios y las posibilidades hace casi 100 años.
Jaime2010- Cantidad de envíos : 4195
Localización : Santiago de Chile
Fecha de inscripción : 31/05/2010
javihv- Cantidad de envíos : 4806
Edad : 50
Localización : Córdoba (Spain)
Fecha de inscripción : 05/05/2010
Re: PCM para dummies
Te felicito por la exposición, buen trabajo.
Con respecto a las contradicciones, yo entro en contradicción en el sentido de que me tiro unas semanas escuchando lo analógico y, al cabo del tiempo, echo de menos lo que me aportaba lo digital, así que vuelvo al mismo. Digamos que estoy en un movimiento tipo muelle.
Bajo mi punto de vista, la tecnología digital es mucho más elegante pero mucho más compleja de implementar que la analógica. De todas formas, lo que en teoría queda estupendamente, luego no se percibe tan bien. Por ejemplo, tal y como afirma Pohlmann en su obra "Principios de Audio Digital", el sobremuestreo es una técnica digital que se emplea para intentar superar los problemas del uso de un filtro analógico de pendiente abrupta.
El SACD suena supuestamente mejor que el sistema PCM porque:
1) es más lineal que el sistema PCM: en este último la distorsión aumenta a medida que la señal es más débil, cuando en un sistema analógico es justo al revés. El SACD, con su codificación sigma-delta es teóricamente lineal (salvo los errores en la base de tiempo o nuestro queridísmo jitter)
2) es equivalente a un sistema de 64x oversampling, con lo que el filtro analógico, tanto en la grabación como en la reproducción puede ser, o bien más suave, o bien igual de abrupto que el tradicional (por ejemplo 16x oversampling) y provocando una mayor atenuación de la banda a filtrar, con lo que hay menos aliasing.
3) tiene mejor respuesta al impulso: esta característica no la tengo tan clara, por la sencilla razón de que no se ha establecido con unanimidad el umbral de audición en el dominio del tiempo.
Precisamente, cuando escucho vinilos lo que percibo como superior es el nivel de detalle de los bajos niveles y la ausencia de la más mínima fatiga, así como una mejor definición espacial. Con lo digital (me refiero al PCM), la espacialidad queda como más comprimida.
En fin, al que le interese lo digital le recomiendo el libro de Pohlmann, que tiene un nueva 6º edición.
Saludos
Con respecto a las contradicciones, yo entro en contradicción en el sentido de que me tiro unas semanas escuchando lo analógico y, al cabo del tiempo, echo de menos lo que me aportaba lo digital, así que vuelvo al mismo. Digamos que estoy en un movimiento tipo muelle.
Bajo mi punto de vista, la tecnología digital es mucho más elegante pero mucho más compleja de implementar que la analógica. De todas formas, lo que en teoría queda estupendamente, luego no se percibe tan bien. Por ejemplo, tal y como afirma Pohlmann en su obra "Principios de Audio Digital", el sobremuestreo es una técnica digital que se emplea para intentar superar los problemas del uso de un filtro analógico de pendiente abrupta.
El SACD suena supuestamente mejor que el sistema PCM porque:
1) es más lineal que el sistema PCM: en este último la distorsión aumenta a medida que la señal es más débil, cuando en un sistema analógico es justo al revés. El SACD, con su codificación sigma-delta es teóricamente lineal (salvo los errores en la base de tiempo o nuestro queridísmo jitter)
2) es equivalente a un sistema de 64x oversampling, con lo que el filtro analógico, tanto en la grabación como en la reproducción puede ser, o bien más suave, o bien igual de abrupto que el tradicional (por ejemplo 16x oversampling) y provocando una mayor atenuación de la banda a filtrar, con lo que hay menos aliasing.
3) tiene mejor respuesta al impulso: esta característica no la tengo tan clara, por la sencilla razón de que no se ha establecido con unanimidad el umbral de audición en el dominio del tiempo.
Precisamente, cuando escucho vinilos lo que percibo como superior es el nivel de detalle de los bajos niveles y la ausencia de la más mínima fatiga, así como una mejor definición espacial. Con lo digital (me refiero al PCM), la espacialidad queda como más comprimida.
En fin, al que le interese lo digital le recomiendo el libro de Pohlmann, que tiene un nueva 6º edición.
Saludos
neo- Cantidad de envíos : 207
Localización : Córdoba
Fecha de inscripción : 25/01/2009
Re: PCM para dummies
solo dos palabras
IM- PRESIONANTE
IM- PRESIONANTE
sigur ros- Cantidad de envíos : 1106
Localización : huesca
Fecha de inscripción : 16/12/2008
Temas similares
» Conceptos básicos para elegir amplificador y cajas para dummies
» Reediciones europeas para dummies: Guía para evitar sustos y/o aprovechar chollos
» Pro-Ject Stream Box S2 Ultra, NECESITO AYUDA para la mejor APP para utilizarlo.
» DAC para dummies (para ignorantes, vamos)
» HUM para dummies
» Reediciones europeas para dummies: Guía para evitar sustos y/o aprovechar chollos
» Pro-Ject Stream Box S2 Ultra, NECESITO AYUDA para la mejor APP para utilizarlo.
» DAC para dummies (para ignorantes, vamos)
» HUM para dummies
Página 1 de 1.
Permisos de este foro:
No puedes responder a temas en este foro.