El Proyecto Gutenberg ofrecerá audiolibros generados con IA de Microsoft

Proyecto Gutenberg logo

Hace algunos días les comentaba sobre el uso de la Inteliencia Artificial en la producción de Audiolibros. Muy seguramente cada vez veremos (escucharemos) más audiolibros que hacen uso de esta tecnología. Algunos de los que ya ensayan la inteligencia artificial en la producción de audiolibros han optando por grabar voces de actores y actrices; otros, graban voces de actores y actrices que ya fallecieron. Aquí, desde luego, podríamos detenernos a analizar el riesgo que esto puede representar para los derechos de autor y, desde luego, el derecho de uso de las voces grabadas, pero ese, sin duda, es tema para otro post. 

En el terreno del uso de voces sintéticas, encontramos que tampoco es algo tan reciente; sin embargo, llama la atención la reciente alianza entre el Proyecto Gutenberg (la biblioteca digital más antigua en la historia del libro electrónico) y Microsoft que busca transformar libros electrónicos al formato audiolibro utilizando Inteligencia Artificial.

Si bien es cierto que desde hace algunos años el Proyecto Gutenberg ya ofrece entre sus formatos de lectura el audiolibro, recordemos que al tratarse de un proyecto en el que son los voluntarios quienes digitalizan libros libres de derechos (actualmente más de 70 mil documentos) o, en este caso, quienes producen con voces sintéticas o humanas los audiolibros; se entiende que la oferta de audiolibros sea aún muy escasa. Sin embargo, esta colaboración con Microsoft le permitirá al Proyecto Gutenberg ofrecer cerca de 5 mil audiolibros generados con Inteligencia Artificial. 

Para lograr esta meta, las obras existentes en el Proyecto Gutenberg se cargan en Synapse Data Science en Microsoft Fabric, una plataforma que permite analizar grandes cantidades de información. Una vez cargados los archivos, son analizados con Azure Synapse Analytics para crear archivos de audio utilizando los servicios de Azure AI. 

En el sitio de Microsoft Customer Stories aseguran que utilizando esta tecnología las voces utilizadas en los audiolibros pueden incluso transmitir emociones y están entrenadas para imitar a los humanos de modo que suenan naturales. Por otro lado, hay algunas obras como las de Shakespeare en las que se utilizan distintas voces para los distintos personajes. También se podrán utilizar voces en otros idiomas.

Además de lo “convincente” de las voces, otra de las ventajas de esta tecnología es quizá la velocidad de conversión de texto a voz: 30 segundos por título. Algo que, sin duda, resultará muy atractivo para alcanzar la meta del Proyecto Gutenberg: el acceso al conocimiento y, por lo pronto, estos 5 mil libros en formato audiolibro.

El acceso al conocimiento es un bien público y un derecho humano. Ahora, con los audiolibros, la Inteligencia Artificial de Microsoft nos está ayudando a expandir nuestro alcance con nuevas audiencias. Grandes obras literarias es más accesible que antes.

– Greg Newby. Director y CEO del Proyecto Gutenberg.

Aunque en lo personal tengo mis serias dudas sobre el uso de la Inteligencia Artificial relacionadas principalmente con el derecho de las y los creadores, además de la fiabilidad de los resultados, por sólo mencionar algunas; encuentro interesante que en este proyecto Microsoft no sólo haya donado su tecnología para llevar más audiolibros a las y los lectores, también es importante señalar que estos audiolibros serán de dominio público y estarán a disposición no sólo en la página del Proyecto Gutenberg, sino también en otras plataformas como Internet Archive, Apple Podcasts, LibriVox y Google Podcasts. 

Mayor información en Microsoft Customer Services.

Ver video

Deja un comentario