Ayuda de la IA para mejor comprensión de artículos libros y textos en general. Por ejemplo ... de audio

DrFunk Mar 17 Sep 2024 - 10:21

En los últimos años de carrera universitaria y en los primeros de mi vida profesional estuve trabajando en temas relacionados con la Inteligencia Artificial. Posteriormente, he intentado mantenerme al día a través de información de divulgación, leyendo algunos papers, viendo vídeos ...

En los últimos 5 años se ha pegado un salto cualitativo y cuantitativo obteniéndose unos resultados que me han sorprendido hasta mí que siempre he estado familiarizado con los distintos avances . Al que más y al que menos, por ejemplo, le sonará chatgpt o ha visto las imágenes o vídeos generados con Midjourney o Sora respectivamente u otros (por poner dos ejemplos de software de entre los muchos que hay)

Ayer, me enteré de la existencia de un software que, de momento, es gratuito, y que ha vuelto a recuperar mi capacidad de asombro. Se trata de NoteBookLM Este software creado por Google, te permite añadir documentos, libros y, en general, cualquier soporte escrito y, posteriormente, a través de una interfaz textual como la que tiene chatgpt, hacerle preguntas, pedirle aclaraciones, pedirle resúmenes ... Lo que quieras.

Supongamos que vemos varios vídeos en youtube sobre un tema que nos interesa especialmente (en nuestro caso relacionado con el audio) pero en los que la persona que lo explica o el nivel técnico que maneja es tan alto que se nos escapan cosas y además, por si fuera poco, el idioma del vídeo es ... ¿Sueco?. Además, hemos encontrado el paper original en inglés y algunos comentarios en foros. Pues, por ejemplo, nos podríamos bajar las transcripción a texto de estos vídeos (youtube nos la puede facilitar), bajarnos el paper y copiar en un archivo de texto lo leído en los foros. Cargar todos los documentos en NotebookLM y empezar a trabajar con ellos. Podemos pedirle desde que nos lo traduzca todos al español, hasta que haga una síntesis de todo ello, que nos destaque los puntos importantes, que nos lo explique adaptándolo a nuestro nivel técnico, preguntas sobre aspectos concretos que no nos hayan quedado claros ... Esto es cualquier cuestión que se nos pueda pasar por la imaginación. Todo ello hablando con éste a través de un chat como si estuviésemos hablando con una persona.

Yo lo he probado (no en profundidad) pero parece muy fácil y funciona muy bien.

Para rizar el rizo tiene una funcionalidad que te deja ojiplático. A partir de los documentos que le facilitas es capaz de generar un podcast de audio en inglés (de momento) con dos personas (un hombre y una mujer) indistinguibles de seres humanos que en un tono afable y de divulgación hablan sobre las ideas expuestas en los documentos aportados. Es, sencillamente, alucinante.

Bueno, os animo a que juguéis un rato con éste (no tiene porqué ser con temas de audio) antes de que lo pongan de pago.

Saludos

DrFunk Miér 2 Oct 2024 - 10:54

Veo que este hilo no ha suscitado demasiado interés y lo cierto que, aunque de momento es un prototipo e irá mejorando, me parece muy interesante para gente que accede a documentos o vídeos y no entiende todo o se pierde porque, por ejemplo, el que ha realizado el vídeo/documento no es demasiado afortunado exponiendo los contenidos aunque estos puedan ser muy interesantes. A mí, por lo menos me pasa a veces.

Hoy tenía ganas de juguetear y, como se pueden subir vídeos, he querido experimentar un poco. He pensado en vídeos interesantes sobre un tema y, que a la vez, sean un poco tediosos o difíciles de seguir. Rápidamente me ha venido a la cabeza OCA (obsesive compulsive audiophile) Este es un tío alemán que me encantan sus contenidos pero, como el mismo reconoce, es muy tedioso exponiendo los temas.

Lo que he hecho es añadir a NotebookLM tres vídeos que guardan relación entre ellos , En concreto:

Y le he pedido que me desarrolle todo el contenido que propone en los vídeos. Para ayudarle le he dicho que la información me la proporcione en un determinado formato, porque si no tiende a resumir. El formato que le he pedido no es nada técnico ni nada que haya que saber, simplemente le he explicado con mis palabras como querría que respondiese.

Lo que he obtenido es lo siguiente:

DrFunk Miér 2 Oct 2024 - 11:04

1. Elección de los Componentes del Sistema Estéreo
NOMBRE DE LA ACTIVIDAD: Selección de los componentes de audio apropiados para un sistema estéreo.
OBJETIVO: El objetivo es elegir componentes que sean complementarios entre sí y apropiados para el tamaño de la sala, las preferencias de escucha y el presupuesto.
PASOS PREVIOS: Investigar y comprender las diferentes características de los componentes de audio, incluyendo altavoces, amplificadores y fuentes de sonido.
DESCRIPCIÓN:
1. Altavoces: Considerar el tamaño de la sala, la colocación de los altavoces (cerca de la pared o lejos de ella), la respuesta de frecuencia deseada y la compatibilidad con el amplificador.
2. Amplificador: Elegir un amplificador con suficiente potencia para manejar la impedancia de los altavoces. Consultar la base de datos de audio de 2021 para obtener información sobre la compatibilidad de amplificadores y altavoces.
3. Fuente de Sonido: Seleccionar una fuente de sonido de alta calidad como un reproductor de CD, un streamer de música o un ordenador con un buen DAC.

2. Posicionamiento Correcto de los Altavoces
NOMBRE DE LA ACTIVIDAD: Encontrar la ubicación óptima para los altavoces en la sala de escucha.
OBJETIVO: Lograr un equilibrio tonal óptimo, una imagen estéreo precisa y una amplia escena sonora.
PASOS PREVIOS: Medir las dimensiones de la sala, identificar la posición de escucha preferida y tener en cuenta las recomendaciones del fabricante de los altavoces.
DESCRIPCIÓN:
1. Triángulo de Escucha: Formar un triángulo con los altavoces y la posición de escucha, manteniendo ángulos iguales entre cada punto, idealmente entre 22.5 y 30 grados.
2. Distancia entre Altavoces: Seguir las recomendaciones del fabricante sobre la distancia mínima entre los altavoces para asegurar una separación estéreo adecuada.
3. Distancia de las Paredes: Experimentar con la distancia de los altavoces a las paredes, especialmente a la pared trasera, para encontrar la respuesta de graves más equilibrada. Considerar la regla de los tercios o quintos para minimizar las resonancias de la sala.
4. Posición de Escucha: Ubicar la posición de escucha a una distancia de la pared trasera que sea aproximadamente un tercio o un quinto de la longitud total de la sala.
5. Simetría: Asegurar que ambos altavoces estén a la misma distancia de las paredes laterales para mantener una imagen estéreo equilibrada.
6. Orientación (Toe-In): Ajustar el ángulo de los altavoces hacia la posición de escucha para optimizar la imagen estéreo y la escena sonora. Seguir las recomendaciones del fabricante.
7. Ajuste Fino: Utilizar música de referencia con una imagen estéreo bien definida, como "Her Majesty" de The Beatles o "Amused to Death" de Roger Waters, para realizar ajustes finos en la posición y la orientación de los altavoces.

3. Medición Correcta
NOMBRE DE LA ACTIVIDAD: Medir con precisión la respuesta de frecuencia de la sala utilizando REW y un micrófono de medición calibrado.
OBJETIVO: Obtener datos de medición fiables que se utilizarán para crear filtros de corrección precisos.
PASOS PREVIOS:
• Hardware: Conectar un micrófono de medición calibrado (USB o XLR) al ordenador.
• Software: Configurar REW seleccionando los controladores de audio apropiados, la configuración del micrófono y la calibración.
DESCRIPCIÓN:
1. Configuración de la Medición: En REW, configurar los parámetros de medición, incluyendo la longitud de la medición, la frecuencia de muestreo y el tipo de señal.
2. Posicionamiento del Micrófono: Colocar el micrófono en la posición de escucha, a la altura de los oídos.
3. Nivel de Volumen: Reproducir el barrido de frecuencia de REW a un volumen de escucha cómodo, asegurando que el nivel esté dentro del rango dinámico del micrófono.
4. Mediciones Múltiples: Realizar varias mediciones (al menos 3) en la misma posición para promediar el ruido y las anomalías.
5. Alineación y Promedio: Alinear las mediciones utilizando la función de correlación cruzada en REW y calcular un promedio vectorial para obtener una respuesta de medición más precisa.

4. Crossover de los Altavoces y Corrección de la Fase en el Dominio del Tiempo del Recinto de los Altavoces
NOMBRE DE LA ACTIVIDAD: Corregir las anomalías de fase introducidas por los crossovers de los altavoces y las resonancias del recinto.
OBJETIVO: Mejorar la claridad, la imagen y la respuesta transitoria general alineando temporalmente las señales de los distintos altavoces.
PASOS PREVIOS:
• Obtener las frecuencias de cruce de los altavoces en el manual del fabricante o en sitios web de especificaciones.
• Identificar el tipo de recinto de los altavoces (sellado o portado).
DESCRIPCIÓN:
1. Importación de Mediciones: Importar las mediciones de respuesta al impulso corregidas en el tiempo a rePhase.
2. Configuración del Crossover: Introducir las frecuencias de cruce de los altavoces en rePhase.
3. Ajuste del Orden y la Polaridad del Filtro: Ajustar el orden del filtro y la polaridad en función del diseño del crossover del altavoz.
4. Corrección de Fase del Puerto (si es necesario): Aplicar la corrección de fase del puerto si se utilizan altavoces con puerto. Elegir el tipo de filtro de corrección de fase del puerto (por ejemplo, Q bajo ventilado, Q estándar ventilado, Q alto ventilado) en función de la respuesta de fase del altavoz.
5. Generación del Filtro: Generar un filtro de corrección de fase en rePhase y guardarlo como un archivo .wav.

5. Elaboración de un Filtro de un Array Virtual para los Bajos (VBA)
NOMBRE DE LA ACTIVIDAD: Crear un filtro VBA para mejorar la respuesta de graves y contrarrestar los efectos de las ondas estacionarias en las frecuencias bajas.
OBJETIVO: Lograr una respuesta de graves más suave, potente y precisa.
PASOS PREVIOS: Medir la respuesta de la sala e identificar la frecuencia de resonancia de la sala.
DESCRIPCIÓN:
1. Identificar la Frecuencia de Resonancia: Determinar la frecuencia de resonancia principal de la sala analizando las mediciones de la respuesta al impulso en REW. Buscar el primer pico prominente en las frecuencias bajas.
2. Calcular el Retardo: Convertir la frecuencia de resonancia a milisegundos y multiplicarla por dos para obtener el retardo necesario para el filtro VBA.
3. Crear un Pulso de Dirac: Generar un pulso de Dirac perfecto en REW.
4. Crear un Filtro Pasa Bajos: Diseñar un filtro pasa bajos en REW con una frecuencia de corte y una pendiente adecuadas para la respuesta de graves deseada.
5. Ajustar el Filtro Pasa Bajos: Ajustar el filtro pasa bajos para que coincida con la curva objetivo deseada y complementar la respuesta de frecuencia natural del altavoz.
6. Invertir la Polaridad y Aplicar Retardo: Invertir la polaridad del filtro pasa bajos e introducir el retardo calculado para contrarrestar la onda estacionaria.
7. Combinar con el Pulso de Dirac: Sumar el filtro pasa bajos con retardo e inversión de fase al pulso de Dirac para crear el filtro VBA final.

6. Corrección de la Respuesta en Frecuencia por Debajo de los 200 Hz
NOMBRE DE LA ACTIVIDAD: Aplicar una ecualización correctiva a las frecuencias inferiores a 200 Hz utilizando REW.
OBJETIVO: Suavizar la respuesta de graves y reducir los picos y valles causados por las ondas estacionarias en la sala.
PASOS PREVIOS: Cargar las mediciones de la respuesta de la sala corregidas por fase y VBA en REW.
DESCRIPCIÓN:
1. Establecer la Curva Objetivo: Determinar una curva objetivo adecuada para el rango de graves, teniendo en cuenta las preferencias de escucha y las características de la sala.
2. Configurar los Parámetros de Auto EQ: Ajustar los parámetros de Auto EQ en REW, incluyendo el rango de frecuencia (20 Hz - 200 Hz), el suavizado (1/48 de octava), los límites de corrección y la opción de refuerzo.
3. Aplicar Auto EQ: Ejecutar el algoritmo de Auto EQ para generar filtros que corrijan la respuesta de frecuencia en el rango de graves.

7. Corrección de la Respuesta en Frecuencia Entre 200 Hz y 500 Hz
NOMBRE DE LA ACTIVIDAD: Aplicar una ecualización correctiva a las frecuencias entre 200 Hz y 500 Hz.
OBJETIVO: Mejorar la claridad, la presencia y el equilibrio tonal general en el rango de frecuencias medias-bajas.
PASOS PREVIOS: Cargar las mediciones de la respuesta de la sala con las correcciones de fase, VBA y ecualización de graves aplicadas.
DESCRIPCIÓN:
1. Ajustar los Parámetros de Auto EQ: Configurar los parámetros de Auto EQ para el rango de frecuencia de 200 Hz a 500 Hz. Utilizar un suavizado menos agresivo (por ejemplo, 1/12 de octava) y límites de corrección más estrictos en comparación con el rango de graves.
2. Aplicar Auto EQ: Ejecutar el algoritmo de Auto EQ para generar filtros que corrijan la respuesta de frecuencia en el rango de 200 Hz a 500 Hz.

8. Corrección de la Respuesta en Frecuencia por Encima de los 500 Hz
NOMBRE DE LA ACTIVIDAD:Aplicar ecualización correctiva a las frecuencias superiores a 500 Hz utilizando una técnica de ventana corta.
OBJETIVO: Mejorar el detalle, la imagen y el equilibrio tonal general en el rango de alta frecuencia.
PASOS PREVIOS: Cargar las mediciones de la respuesta de la sala con todas las correcciones anteriores aplicadas.
DESCRIPCIÓN:
1. Determinar el Retardo de la Ventana: Calcular el tiempo que tarda el sonido directo de los altavoces en llegar a la posición de escucha (por ejemplo, 8 ms para una distancia de 3 metros). Este valor determinará el tamaño de la ventana derecha.
2. Ajustar los Parámetros de la Ventana: Ajustar los parámetros de la ventana en REW utilizando el retardo calculado para la ventana derecha y un valor mayor para la ventana izquierda (por ejemplo, 1000 ms).
3. Aplicar Suavizado Psicoacústico: Habilitar el suavizado psicoacústico en REW para tener en cuenta las características de enmascaramiento del oído humano.
4. Ajustar los Parámetros de Auto EQ: Configurar los parámetros de Auto EQ para el rango de frecuencia de 500 Hz a 20 kHz. Utilizar un suavizado mínimo o nulo y límites de corrección conservadores para evitar efectos secundarios audibles.
5. Aplicar Auto EQ: Ejecutar el algoritmo de Auto EQ para generar filtros que corrijan la respuesta de frecuencia en el rango de alta frecuencia.

9. Corrección en Exceso de Fase
NOMBRE DE LA ACTIVIDAD: Crear y aplicar un filtro de inversión de fase para mejorar la coherencia de fase entre los altavoces en el rango audible (100 Hz - 1000 Hz).
OBJETIVO: Mejorar la imagen estéreo, la escena sonora y reducir los cambios de imagen percibidos.
PASOS PREVIOS: Cargar las mediciones de la respuesta de la sala con todas las correcciones anteriores aplicadas.
DESCRIPCIÓN:
1. Aplicar Suavizado e Inversión de Fase: Aplicar un suavizado de 1/48 de octava a las respuestas de los altavoces y luego invertir la fase entre 100 Hz y 1000 Hz.
2. Ventana Dependiente de la Frecuencia: Aplicar una ventana dependiente de la frecuencia a las respuestas de fase invertidas, ajustando el número de ciclos para mantener el rango de fase dentro de +/- 45 grados.
3. Reversión de Magnitud: Invertir la magnitud de la inversión de fase para eliminar cualquier fluctuación del SPL introducida en el paso anterior.
4. Combinación con un Pulso de Dirac: Combinar el filtro de inversión de fase con un pulso de Dirac perfecto por encima de una frecuencia de fusión óptima (por ejemplo, 1413 Hz) utilizando una transición sin mezcla.

10. Generación del Filtro Óptimo
NOMBRE DE LA ACTIVIDAD: Combinar todos los filtros generados anteriormente en un único filtro de convolución para su uso en un reproductor de música o un motor de convolución.
OBJETIVO: Aplicar todas las correcciones necesarias a la señal de audio de forma eficiente y sin introducir artefactos audibles.
PASOS PREVIOS: Tener todos los filtros generados en los pasos anteriores guardados como archivos .wav separados.
DESCRIPCIÓN:
1. Orden de Multiplicación: Multiplicar los filtros en REW, comenzando con el que tenga el tamaño de ventana derecha más grande para preservar la resolución.
2. Recorte del Filtro: Ajustar los tamaños de las ventanas izquierda y derecha en REW para minimizar el número de taps sin afectar negativamente la respuesta del filtro.
3. Exportar el Filtro: Exportar el filtro recortado como un archivo .wav, seleccionando el formato mono o estéreo según sea necesario para el reproductor de música o el motor de convolución.
Siguiendo estos pasos, podrás crear un filtro de corrección de sala digital que mejorará significativamente la precisión sónica de tu sistema de audio.

DrFunk Miér 2 Oct 2024 - 11:09

Esta respuesta nos puede parecer, a veces, difícil de entender, incompleta, poco detallada o lo que sea. Yo que me he visto los vídeos varias veces pues, aunque le he pedido una descripción detallada, si tuviese que llevarla a la práctica lo mismo necesitaría más detalle. Por ejemplo, el punto cinco me parece muy poco detallado así que le he pedido que me dé más detalle sobre el procedimiento y me ha respondido lo siguiente:

Creación paso a paso de un Filtro de Arreglo Virtual para Bajos (VBA)
Aquí tienes una descripción detallada de cómo crear un filtro VBA, basándose en la información del vídeo "Boost your bass output with a virtual bass array filter":

1. Identificar la frecuencia de resonancia de la sala:
• Analiza las mediciones de respuesta al impulso en REW para encontrar la frecuencia de resonancia principal de la sala.
• Busca el primer pico prominente en las frecuencias bajas. El vídeo utiliza el ejemplo de una sala cuyas dimensiones suman 11,83 metros. Basándose en el cálculo de la frecuencia de resonancia de la sala, la frecuencia objetivo se estima en torno a los 15 Hz.
• Ten en cuenta que esta es sólo una estimación, y la frecuencia de resonancia real puede variar.

2. Encontrar el pico de la primera onda estacionaria:
• En lugar de confiar en la frecuencia de resonancia estimada, busca el pico de la primera onda estacionaria en tus mediciones de REW.
• Asegúrate de aumentar la resolución de la medición ajustando la configuración de la ventana. El ancho de la ventana izquierda afecta a la precisión del gráfico, mientras que el ancho de la ventana derecha determina la profundidad en el área de graves que puedes medir.
• Localiza el pico con la mayor precisión posible utilizando la resolución de medición disponible.

3. Calcular el retardo:
• Divide la frecuencia del pico de la primera onda estacionaria entre dos para obtener la frecuencia de resonancia real. Por ejemplo, si el pico de la primera onda estacionaria está en 33,4145 Hz, la frecuencia de resonancia real es 16,70725 Hz.
• Convierte esta frecuencia a milisegundos.
• Multiplica el valor en milisegundos por dos para tener en cuenta la distancia recorrida por la onda sonora (ida y vuelta). Este es el retardo que se aplicará al filtro VBA.

4. Crear el filtro VBA:
• Genera un pulso de Dirac en REW. Este será la base del filtro VBA.
• Crea un filtro de paso bajo en REW. La frecuencia de corte y la pendiente de este filtro dependerán de la respuesta de graves deseada y de la curva objetivo del sistema.
• Invierte la polaridad del filtro de paso bajo. Esto ayudará a contrarrestar la onda estacionaria a la frecuencia de resonancia.
• Aplica el retardo calculado en el paso 3 al filtro de paso bajo. Esto asegurará que el filtro se active en el momento adecuado para cancelar la onda estacionaria.
• Suma el filtro de paso bajo con retardo e inversión de fase al pulso de Dirac para crear el filtro VBA final.

5. Verificar el filtro VBA:
• Observa la respuesta del filtro VBA en REW. Deberías ver que el pico y el valle del filtro coinciden con el pico y el valle de la respuesta de la sala a la frecuencia de resonancia.
• Convoluciona el filtro VBA con la respuesta al impulso original de la sala en REW.
• Comprueba que la respuesta resultante muestra una mejora en la respuesta de graves, con una reducción de la intensidad del pico y el valle a la frecuencia de resonancia.

Es importante destacar que este proceso puede requerir ajustes y experimentación para obtener el mejor resultado para tu sala y sistema de audio específicos.
Información adicional:

Los vídeos también mencionan la importancia de ajustar la pendiente y el punto de corte del filtro de paso bajo en función de la curva objetivo que se busca.

DrFunk Miér 2 Oct 2024 - 11:16

Bueno, tal vez sólo con esto, no somos capaces de llevarlo a la práctica pero podemos seguir preguntando a la AI y, sobre todo, lo importante es que nos hacemos una idea intuitiva de lo que hay que hacer para después volver a las fuentes (vídeos, documentos ...) y enterarnos mejor de los detalles y, en general de lo que está hablando.

También, no hay que perder de vista que esto es sólo un prototipo (por eso de momento es gratis) pero nos da una idea de por dónde va el futuro próximo.

Ponerle deberes a los niños por parte de los profesores se va a convertir en todo un reto pero también lo mismo el paradigma de enseñanza va a tener que cambiar.

En fin, a mí me divierte mucho. Yo lo he aplicado a vídeos sobre audio pero esto es aplicable a muchísimas cosas. Imaginad que tenéis una o varias hojas excel con un montón de datos sobre un determinado tema sobre el cual queréis hacer preguntas. Sólo tenéis que darle las hojas y hacer las pregunTAS. En fin, no me enrollo más.

ducados123 Miér 2 Oct 2024 - 12:10

La verdad es que las IA son increíbles, son unas herramientas muy eficaces, ciertamente tan buenas como los datos que utilizan para funcionar, porque son esos datos los que definirán el sesgo de sus respuestas, por lo que me parece muy interesante para resolver problemas complejos o tareas de alta precisión, digamos que me parece que las IA son claramente de "ciencias", para "letras" incluiremos ahí las artes ya es algo más complicado, en este frente no todo es A o B, 0 o 1, etc. Por supuesto, se puede "adiestrar" para componer música, o pintar un cuadro, incluso escribir un libro y presentar esto como la nueva obra de Bach, Murillo o Cervantes, solo hay que meterle toda la obra real y pedirle una nueva obra de ese autor.

El problema está en que aceptemos esos resultados, también en que realmente haga falta tenerlos, me vale como curiosidad y no tendría inconveniente en escuchar una nueva cantata de Bach. En filosofía o historia me parece muy poco fiable, dependiendo de quién introduzca los datos para trabajar las cosas pueden cambiar radicalmente, pudiendo llegar a considerar a Hitler como un genio incomprendido, incluso un benefactor de la humanidad, la peligrosa tendencia de utilizar como "fondo" internet es muy preocupante, incluso intentando ser totalmente ecuánime determinadas opiniones que circulan por la red influirían en el resultado final.

De todos modos este mundo de la IA está en pañales, me gustaría ver lo que verán mis nietos cuando tengan mi edad, no alcanzo a imaginar ... quizá no lo necesite porque la IA llegue a tiempo de alargarme la vida hasta los 120 años (Dios no lo permita) Very Happy

.

Saludos.

Pepe Muñoz Miér 2 Oct 2024 - 12:29

Hola Dr. Funk!

Creo que este tema está generando poco interés porque es bastante complejo y la mayoría de compañeros se hace preguntas más simples, tipo "¿cómo puedo solucionar el problema de graves que tengo?" "¿si cambio esta u otra pieza del equipo me sonará mejor?" y cosas por el estilo, como se puede apreciar viendo los hilos que generan más interés.

Todo lo que has escrito hoy serviría para acercarnos a responder alguna de estas dudas habituales, pero, aunque resumido, sigue siendo muy técnico y muy específico (Rew, Rephase, Dirac) por lo que solo es entendible por personas que estén puestas en ese tema (o que les interese), lo que no es el caso de la inmensa mayoría de compañeros. Aunque te agradezco tu exposición, porque a algunos si que nos interesan esos temas más técnicos, como es mi caso.

Personalmente, los ajustes de corrección los hago con Sonarworks, un software de medición, ecualización y ajustes de fase que funciona de forma automática. Imagino que a costa de ser algo más limitado que los que citas, aunque es muy potente y, de hecho, es el que utilizan gran parte de los estudios de grabación. Evidentemente, si me dedicase profesionalmente al tema de acústica y corrección preferiría los que has citado, pero este es perfecto para alguien que quiera optimizar su entorno de escucha sin complicarse demasiado la vida.

Esta claro que las aplicaciones de inteligencia artificial dedicadas a resumir textos pueden ser muy útiles, especialmente para los estudiantes, porque les reduce el trabajo. Lo que ya no tengo tan claro es si esa reducción no irá en detrimento de la asimilación de conceptos. He leído mucho sobre todo lo relacionado con el sonido, y ahora que estoy jubilado todavía le dedico más tiempo a esa lectura. Pero siempre me gusta dar una primera leída a lo que sea, para a continuación tomar apuntes o hacerme esquemas. Y es precisamente durante esa tarea de hacer resúmenes o esquemas donde más aprendo sobre el fondo del tema, que es lo que me interesa. Me refiero a que si delego esa tarea en la IA, igual me pierdo esa parte del aprendizaje

Por mi parte, donde me encantaría que avanzase la inteligencia artificial sería en el campo de la interpretación de las mediciones y su correspondencia con las sensaciones de escucha. Creo que en ese cruce de caminos entre la física y la psicoacústica es donde están muchas de las respuestas a la mayoría de preguntas que nos hacemos los audiófilos. Al menos esa es mi humilde opinión.

Saludos

DrFunk Miér 2 Oct 2024 - 13:02

ducados123 escribió:
La verdad es que las IA son increíbles, son unas herramientas muy eficaces, ciertamente tan buenas como los datos que utilizan para funcionar, porque son esos datos los que definirán el sesgo de sus respuestas,

Eso es absolutamente cierto pero afortunadamente ese problema está bastante acotado. Cada día los datos que se utilizan para el entrenamiento, tienen más calidad. Hace unos pocos años, no hay que irse muy atrás, lo que se hacía es explorar internet indiscriminadamente (Web scraping) y los resultados incorporaban todo tipo de sesgos e información plagada de errores. Afortunadamente eso ha cambiado.

Lamentablemente, el problema más importante que tienen los LLMs (Grandes modelos de lenguaje) que están basados en unos modelos de redes neuronales llamados Transformers que, inherentemente a la forma en que funcionan, tienden a "alucinar". Es decir, te responden muy coherentemente pero la información es falsa (se la inventan) y una persona que no domina el tema puede pensar que es información correcta cuando no lo es. Esto se está intentando solucionar pero, EMHO, mientras el paradigma de modelo sea el transformer, seguirá pasando en mayor o menor medida.

ducados123 escribió:
para "letras" incluiremos ahí las artes ya es algo más complicado, en este frente no todo es A o B, 0 o 1, etc. Por supuesto, se puede "adiestrar" para componer música, o pintar un cuadro, incluso escribir un libro y presentar esto como la nueva obra de Bach, Murillo o Cervantes, solo hay que meterle toda la obra real y pedirle una nueva obra de ese autor.

No te creas, es ahí precisamente donde se están obteniendo unos resultados increíbles. Hay muchos sistemas de generación de imágenes, vídeo o música. De hecho, la gente que trabaja en esos temas están que echan las muelas porque ven que se van a quedar sin trabajo. Los diseñadores gráficos serán como los delineantes, una profesión del pasado. Ya se generan fotos indistinguibles de fotos reales. La generación de vídeo también es una pasada. En música van un poco más atrasados pero ya hay cosas interesantes.

ducados123 escribió:
De todos modos este mundo de la IA está en pañales, me gustaría ver lo que verán mis nietos cuando tengan mi edad, no alcanzo a imaginar ... quizá no lo necesite porque la IA llegue a tiempo de alargarme la vida hasta los 120 años (Dios no lo permita)

Existen un par de conceptos que se manejan en AI: Uno es la AGI (Inteligencia Artificial General) se trataría de una inteligencia artificial capaz de realizar todas las tareas que realiza un ser humano con un nivel de excelencia superior a éste. Bueno, pues, según todas las previsiones, estamos a muy pocos años (menos de 5) de alcanzar este hito.

Existe otro concepto que es la ASI (Super Inteligencia Artificial) que es un hipotético sistema de inteligencia artificial (IA) basado en software con un alcance intelectual más allá de la inteligencia humana.

Pues mira, no se si te suena Sam Altman. Es el CEO de OpenIA (la empresa de Chatgpt) que, al día de hoy es la empresa líder en AI. Hace poco, en relación a la publicación del nuevo modelo O1 que es un modelo de inteligencia artificial capaz de "razonar". Este nuevo modelo se caracteriza porque antes de dar una respuesta se dedica a "razonar" (explorar alternativas) lo que supone que consume más tiempo. Cuanto más tiempo se le deja razonar mejor es su respuesta y supone un "nuevo" paradigma en la forma de funcionar las AIs.

Sam Altman vaticino que, para alcanzar el hito de la ASI quedan no demasiados años (entre 5 y 15) y afirmó que podría funcionar según el nuevo paradigma de manera que se le podría pedir "Dame la cura para el cancer" y la AI se tiraría horas, días, semanas o incluso meses pensando en el tema y pidiendo ocasionalmente la información (resultados de análisis, cultivos, experimentos) que necesitase para completar su razonamiento.

Que alguien de la relevancia de Sam Alman afirme estas cosas no es gratuito y nos da una idea de cómo va ser el futuro próximo.

Por otra parte están los políticos estos Europeos que intentan legislar para tener controlada la AI, como si hubiese manera de controlarla (los ejércitos, los chinos, los rusos ...) y que están haciendo que Europa se vaya quedando atrás y que, al final, sean otros países los que nos controlen a nosotros porque van a ser los dueños de la tecnología que tarde o temprano terminaremos usando.

Yo os animo a que juguéis con NotebookLM. Es muy fácil de usar y os puede ayudar a profundizar en temas que dan un poco de repelux por ser áridos o mal explicados.

DrFunk Miér 2 Oct 2024 - 13:18

A ver Pepe, lo que he puesto es un ejemplo de algo y alguien al que a mí, en ocasiones, me cuesta entender. Muchas veces se ve que se ha preparado por escrito lo que va a decir y lo va leyendo a toda leche. En cualquier caso hay vídeos mucho más sencillos en youtube que, incluso, podrían resultar complicados para mucha gente. Depende del nivel que manejamos cada uno. En cualquier caso un posible enfoque podría ser el siguiente:

Selecciona material en el que se esté interesado del nivel que sea. Da igual porque le voy a indicar que la respuesta la adecue a mi nivel. En general, cuanto más elaborada sea la pregunta mejor será la respuesta.
Pide que haga un resumen simplificado y expresado de manera que yo, con mi nivel, lo pueda entender.
Guarda la respuesta en lo que NotebookLM llama "Notas" (hay un iconito en la base de la respuesta) por si te interesa volver sobre ésta. Por ejemplo, imagina que la primera pregunta que le haces es que te haga un índice de los temas tratados y después quieres volver sobre cada uno de los puntos haciendo preguntas concretas sobre cada uno de ellos. Tenerlo en una notita te viene muy bien.
Si has entendido lo que responde, pídele que profundice en un aspecto concreto y, como siempre, guarda la respuesta por si quieres volver a leer algo.
Puede ser que no hayas entendido algo de la respuesta. Pídele que te aclare, te ponga ejemplos ...
Este proceso lo puedes repetir las veces que haga falta hasta que hayamos comprendido la totalidad con la profundidad que necesitemos siempre recordando que, cuanto mejor es la pregunta y mejor expresa lo que pretendemos obtener mejor será la respuesta.

Contenido patrocinado

Ayuda de la IA para mejor comprensión de artículos libros y textos en general. Por ejemplo ... de audio

Ayuda de la IA para mejor comprensión de artículos libros y textos en general. Por ejemplo ... de audio

Re: Ayuda de la IA para mejor comprensión de artículos libros y textos en general. Por ejemplo ... de audio

Re: Ayuda de la IA para mejor comprensión de artículos libros y textos en general. Por ejemplo ... de audio

Re: Ayuda de la IA para mejor comprensión de artículos libros y textos en general. Por ejemplo ... de audio

Re: Ayuda de la IA para mejor comprensión de artículos libros y textos en general. Por ejemplo ... de audio

Re: Ayuda de la IA para mejor comprensión de artículos libros y textos en general. Por ejemplo ... de audio

Re: Ayuda de la IA para mejor comprensión de artículos libros y textos en general. Por ejemplo ... de audio

Re: Ayuda de la IA para mejor comprensión de artículos libros y textos en general. Por ejemplo ... de audio

Re: Ayuda de la IA para mejor comprensión de artículos libros y textos en general. Por ejemplo ... de audio

Re: Ayuda de la IA para mejor comprensión de artículos libros y textos en general. Por ejemplo ... de audio