Vocal Synthesis: Casiotone

Vocal Synthesis: Tecnología que redefine cómo se toca un instrumento

Imagine un teclado como ningún otro que haya visto antes, uno que pueda “cantar” letras preprogramadas según las frases musicales que toca. A diferencia de los teclados y sintetizadores convencionales y, en contraste con los equipos especializados de producción de estudios, el Casiotone CT-S1000V representa un nuevo concepto de instrumento de presentación construido en torno a una nueva e innovadora tecnología: Vocal Synthesis.

Desde la década de 1980, la tecnología basada en PCM ofreció a los tecladistas acceso a una gran cantidad de sonidos de instrumentos auténticos como estándar. Sin embargo, las réplicas convincentes de la voz humana cantada siempre se mantuvieron fuera del alcance. Las voces no solo muestran grandes variaciones en el timbre, incluso en un tono constante, sino que las letras agregan un capa de complejidad integral. Incluso para una palabra determinada, las diferencias en la melodía y las frases, así como las palabras precedentes y consecuentes, demandarán cambios en la forma de onda.

Y aunque existen productos que tienen como objetivo replicar el sonido de la voz humana en un formato de teclado, se requirieron técnicas especializadas de funcionamiento y presentación o calibración minuciosa e interpretación de letras preprogramadas, factores que tienen una aceptación limitada entre los músicos.

La tecnología Vocal Synthesis de Casio supera estos problemas, ya que pone reproducciones auténticas de la voz humana cantada al alcance de los tecladistas. Asimismo, el lanzamiento del CT-S1000V significa que cualquiera puede crear voces cantadas cuando lo desee, sin necesidad de usar técnicas especiales.

- Un instrumento que “canta” en tiempo real

- El modo Note (Nota) y el modo Phrase (Fraseo) dan control sobre la progresión de las letras

- Control en tiempo real sobre el timbre vocal

- Combine funciones para crear texturas vocales complejas

- Cargue las versiones originales con la aplicación Lyric Creator

- Vocal Synthesis: El primer gran salto en la generación de sonido desde PCM

Un instrumento que “canta” en tiempo real

Vocal Synthesis, una nueva tecnología que pone líneas vocales cantadas al alcance de los instrumentalistas, fue desarrollada por Casio junto con investigadores del Instituto de Tecnología de Nagoya. Los modelos de articulación basados en investigaciones de aprendizaje automático anteriores se utilizan para modular los tonos vocales de una variedad de parches vocales virtuales conocidos como Vocalists, en combinación con letras predefinidas incorporadas y letras de canciones programadas por el usuario ingresadas en la aplicación Lyric Creator para producir líneas cantadas con fluidez a través del teclado. Las voces, que se crean a partir de la combinación de tonos vocales producidos por una fuente de sonido PCM diseñada para imitar las cuerdas vocales humanas, junto con filtros que generan frases de acuerdo con la entrada de letras, también se pueden ajustar en tiempo real a través de perillas físicas para ajustar aún más características como la edad y el género.

Esta tecnología es una desviación radical de enfoques anteriores que activaban sonidos vocales pregrabados a través de un teclado o codificadores de voz, que combinan voces cantadas en tiempo real con tonos de sintetizador. Además de eliminar la necesidad de técnicas especiales, Vocal Synthesis le permite emparejar sus letras preprogramadas con cualquier melodía o armonía que desee, lo que abre nuevas posibilidades en el nexo de la expresión instrumental y lírica.

El modo Note (Nota) y el modo Phrase (Fraseo) dan control sobre la progresión de las letras

La forma en que las letras avanzan se determina de acuerdo con uno de los dos modos siguientes: Modo Note (Nota), en el que las notas que se reproducen forman la melodía, y las letras se suceden con cada nota reproducida; y modo Phrase (Fraseo), que avanza automáticamente a través de las letras con una métrica fija mientras toca.

El modo Note (Nota) produce líneas vocales fluidas y de sonido natural mediante la activación de cada sílaba de las letras según las notas que toque y la aplicación de las consonantes finales cuando suelta las teclas. También hay varias funciones para evitar el riesgo de perder su lugar por tocar una nota incorrecta. Los pedales SP-3 y SP-20 de Casio (que se venden por separado) u otro interruptor de pie disponible en el mercado se pueden utilizar para avanzar y retroceder por las letras o restablecer la posición de la letra. También puede seleccionar qué sílaba se puede pronunciar a continuación con las teclas de registro grave y controlar cómo deben avanzar las sílabas cuando se tocan los acordes.

Si bien el modo Note (Nota) (y el software de Vocal Synthesis existente) exige en gran medida que la melodía vocal se fije por adelantado, en el modo Phrase (Fraseo), sin embargo, el CT-S1000V le ofrece opciones de improvisación avanzando por las letras de forma automática a medida que toca. Simplemente configure las letras y sus subdivisiones rítmicas y BPM con anticipación y, luego, toque de manera libre y escuche las letras que se cantan a tiempo.

Este modo le permite ir más allá de las simples concepciones de melodía y crear líneas vocales complejas basadas en técnicas de teclado avanzadas. Al mismo tiempo, si sus habilidades de teclado son más básicas, puede estar seguro de que la frase no se “arruinará” si accidentalmente golpea algunas teclas equivocadas. Otra ventaja del modo Phrase (Fraseo) son las uniones fonéticas naturales que crean conductos vocales que fluyen. Esto también proporciona una excelente plataforma de composición, lo que le permite trabajar nuevas líneas vocales y desarrollar arreglos a través de la interfaz intuitiva del teclado.

De hecho, es el modo Phrase (Fraseo) lo que convierte al CT-S1000V en un nuevo teclado con nuevos generadores de sonido y tonos, y en un instrumento que abre nuevas posibilidades para la expresión musical.

Control en tiempo real sobre el timbre vocal

El CT-S1000V tiene 22 preajustes de voz o “Vocalists”, cada uno con su propio carácter, desde “Choir Group” y “Bossa Nova” hasta “Child”, e incluso “Vocoder”. Estos Vocalists, en los que cada uno consta de formas de onda múltiples y elementos como el ruido blanco, se ajustan con precisión para producir claridad tanto en vocales como en consonantes, ya sea que se interpreten líneas de melodía monofónicas o armonías más complejas.

Mientras tanto, las perillas de control físico del panel de la consola del CT-S1000V ofrecen control en tiempo real de los parámetros, tales como vibrato y portamento, así como de las características tonales que determinan los perfiles de edad y de su Vocalist elegido. Asimismo, cuando ajusta la pulsación y la liberación de las teclas, como también la velocidad de la pronunciación, puede esculpir transiciones aún más naturales entre palabras y sílabas, y controlar sutilmente la sincronización de las voces resultantes oídas. Además, puede cargar un archivo WAV de 16 bits y 44,1 kHz y crear su propio usuario de Vocalist, al mismo tiempo que la combinación de diferentes parámetros puede ayudar a desarrollar sonidos completamente originales. Este es el alcance de la experimentación que hace que el CT-S1000V sea tan único y agradable, todo ello respaldado por la tecnología Vocal Synthesis de Casio.

Ejemplos de Vocalist

CHOIR GROUP

Sonido de coro femenino de tamaño mediano. Las consonantes se articulan con claridad y se pueden escuchar incluso cuando se tocan cuerdas.

CHOIR TRIO

Trío masculino. Las consonantes se articulan con claridad y se pueden escuchar incluso cuando se tocan cuerdas.

VOCODER 1

Sonido similar al de un vocoder popularizado por éxitos de discoteca de los años 80, con un tono de una octava en la parte inferior.

: BOSSA NOVA

Sonido vocal femenino de estilo bossa nova Breathy.

OPERA

Sonido de ópera con un vibrato distintivo.

DEATH VOICE

Un sonido vocal feroz conocido como un “gruñido”, utilizado en el género Death Metal. No hay ningún tono fundamental en el sonido.

GHOST

Las inflexiones ascendentes se agregan en la fase inicial para crear un sonido fantasmal y divertido.

ANIMALS

Un sonido único en el que las letras se pueden hablar mientras se imita a pollos, vacas, leones, gatos y cabras.

Combine funciones para crear texturas vocales complejas

Las posibilidades creativas de Vocal Synthesis y el CT-S1000V se expanden aún más mediante la combinación de sus muchas características incorporadas. Por ejemplo, el control de arpegios genera cuerdas arpegiadas y otras frases de teclas de retención, pero también se puede utilizar junto con el aleatorizador para vocalizar sílabas de letras aleatorias en orden aleatorio a fin de crear clústeres fonéticos de otro mundo.

Los efectos de DSP incorporados en combinación con los tonos instrumentales permiten descubrir incluso más combinaciones dinámicas. Mantener presionada una tecla con la función Retrigger (Recuperación) activa recrea el efecto de golpear la tecla en sucesión rápida y perfectamente sincronizada. Puede utilizar la función Recuperación en combinación con la función Hold (En espera) para que las teclas se vuelvan a activar, incluso después de que se hayan lanzado, lo que facilita las texturas y los arreglos que serían imposibles de tocar físicamente.

Carga de versiones originales
con la aplicación
Lyric Creator

Consulte App Store/Google Play para obtener información sobre la compatibilidad con el modelo de su dispositivo inteligente y el sistema operativo.

Guía del usuario de la aplicación

Conectar su dispositivo inteligente a su instrumento

Ingrese sus letras

Las letras de canciones favoritas y las creaciones originales por igual se pueden ingresar en inglés y japonés con su dispositivo iOS o Android a través de la propia aplicación Lyric Creator de Casio. Este texto se divide automáticamente en unidades que pueden ser sílabas (aunque también puede asignar divisiones de manera manual y agrupar varias sílabas juntas) y, después de exportar los datos resultantes al CT-S1000V, está listo para su reproducción.

Ajuste la métrica

En el modo Phrase (Fraseo), la métrica de reproducción de las letras se determina mediante la asignación de valores de nota (corcheas, negras, etc.) a las unidades de sílabas, y la inserción de silencios. Los tonos de letra individuales incluyen datos de tempo que se pueden ajustar con el CT-S1000V. El tempo también se puede sincronizar con el reloj MIDI desde su DAW u otro dispositivo MIDI externo para asegurarse de que su frase vocal siempre permanezca en el tiempo, independientemente de cuán aventurero se ponga.

23/1/2025 ¡Ya está disponible Lyric Creator versión 2.0.0!

Nuevas funciones para una creación de letras más flexible y cómoda

Se incluyó una nueva función que simplifica los ajustes de valores de nota para frases líricas. Además de la entrada estándar de símbolos de nota, ahora es posible editar los valores de nota arrastrándolos a lo largo de las líneas de cuadrícula. Cada valor de nota se muestra como un cuadro visual, lo que facilita el ajuste intuitivo tanto de la longitud como de la posición. Esto permite un ajuste preciso de la duración de las notas y los descansos, lo que no era posible con la entrada estándar de símbolos de nota. Además, ahora se pueden ver líneas de barras en la pantalla, lo que agiliza la edición de ritmos complejos, como las síncopas entre medidas.
Además, se agregó la posibilidad de reproducir frases líricas en cualquier tempo directamente en la app. Esto le permite comprobar instantáneamente el ritmo y cómo sonará la frase lírica antes de transferir los datos líricos a un instrumento.

Anímese al detalle con Fraseo y Dicción

Los usuarios que buscan un enfoque verdaderamente detallado pueden profundizar aún más y editar los fonemas comprendidos en cada sílaba. Además de crear una dicción vocal más clara, este proceso se puede utilizar para aproximar los acentos regionales o imitar la pronunciación de palabras en idiomas distintos del inglés y el japonés. (Tenga presente que la biblioteca de fonemas disponible consiste únicamente en sonidos que se producen en inglés y japonés estándar).

Cadenas de letras juntas para secuencias más largas

Aunque Lyric Creator establece un límite en la longitud de la letra que se puede ingresar (hasta 100 sílabas de octavas), una vez cargadas en el CT-S1000V, las letras individuales se pueden unir en secuencias mucho más largas. Esta función le permite ajustar las secciones individuales en la etapa de entrada antes de combinarlas en el CT-S1000V para crear una canción completa.

Cree sus propias voces

La aplicación Lyric Creator también se puede utilizar para transformar un sampleo de audio WAV (16 bits/44,1 kHz, mono/estéreo, máx. de 10 segundos de duración) almacenado en su dispositivo inteligente en un parche Vocalist original que luego se puede cargar en el CT-S1000V. La interfaz de edición le permite establecer características como edad, género, rango vocal y vibrato.

Los 22 preajustes de Vocalist del CT-S1000V se diseñaron para obtener una máxima claridad de pronunciación mediante la combinación de diferentes formas de onda con elementos como el ruido blanco y, por lo tanto, es posible que las formas de onda de usuario de Vocalist no alcancen el mismo nivel de articulación. Sin embargo, con alguna experimentación, puede crear nuevos sonidos, incluidos los abstractos similares a los preajustes de animales del CT-SV1000V.

Para comenzar a experimentar, descargue un sampleo de forma de onda gratuita compatible con el usuario de Vocalist (SawC4+WhiteNoise.wav) desde el siguiente vínculo:
https://support.casio.com/en/support/download.php?cid=008&pid=20

Conexión del CT-S1000V a su dispositivo inteligente

Una vez que la aplicación Lyric Creator está instalada en su teléfono inteligente, puede comenzar a transferir letras, secuencias, sampleados vocales, etc., si conecta su dispositivo a su CT-S1000V a través de un cable USB. Mientras está conectado, también puede utilizar la aplicación para ver cuánto espacio disponible hay en la unidad interna del CT-S1000V, eliminar archivos y editar nombres de archivos. Los archivos de programa se exportan en un formato patentado que permite compartir entre usuarios del CT-S1000V. También puede importar datos de letras en XML de música y valores de notas desde su DAW.

Conectar su dispositivo inteligente a su instrumento

Vocal Synthesis: El primer gran salto en la generación de sonido desde PCM

La historia de Casio sobre el desarrollo de fuentes de sonido

Nacida a partir de la investigación y el desarrollo de la industria del audio que comenzó en la década de 1970, la tecnología de modulación por código de pulso (PCM, por sus siglas en inglés) tuvo un gran impacto en nuestro paisaje musical diario a través de la reproducción digital de las ondas sonoras de fuentes analógicas como instrumentos físicos y la voz humana.

Síntesis de vocales y consonantes

Casiotone 201.

Fuente de sonidos PD

[CZ-101]

Fuente de sonidos iPD

[VZ-1]

En 1980, impulsado por el objetivo de aprovechar la tecnología digital para llevar la alegría de tocar música a todos, Casio Computer Co., Ltd. entró por primera vez al mercado de instrumentos musicales con el Casiotone 201 y su innovador enfoque de síntesis de vocal y consonante. Luego, a mediados de esa década, con música grabada que cambia de registros analógicos a CD digitales y con otros fabricantes de instrumentos compitiendo por desarrollar una plataforma de síntesis digital para la creación de música, Casio lanzó el sintetizador CZ-101, basado en nuestra exclusiva fuente de sonido de distorsión de fase (PD). Asimismo, la contribución de Casio a la síntesis digital dio otro salto hacia delante en 1988 con el lanzamiento del VZ-1 y su tecnología de distorsión de fase integrada (IPD).

La década de 1980 fue un período en el que los instrumentos electrónicos tuvieron un gran impacto en la música popular. Además, los nuevos teclados y sintetizadores que cuentan con tecnología PCM se centraron en el escenario, ya que les permitió a los artistas crear registros con sonidos completamente nuevos y explorar nuevos estilos de presentaciones. Mientras tanto, las mejoras en la memoria siguieron disminuyendo el precio de los instrumentos digitales, para acercarlos cada vez más a los consumidores comunes.

En 1985, Casio lanzó el teclado electrónico MT-500, que utilizaba la generación de tonos basada en PCM para digitalizar los sonidos de las baterías y los platillos, y preparó el camino al éxito del legendario teclado de sampleado SK-1, que vendió un millón de unidades después de su lanzamiento en 1986. A esto le siguió, en 1988, el CT-640, un teclado electrónico basado completamente en la generación de tonos con tecnología PCM.

Para aquel entonces, la tecnología PCM también dio lugar a pianos electrónicos con sonidos cada vez más auténticos. El CDP-3000 basado en PCM, el primer piano electrónico de Casio con un teclado de acción de martillo, fue otra novedad en 1988, mientras que 1991 aportó una expansión completa al mercado de pianos electrónicos con las presentaciones de la popular serie CELVIANO al mismo tiempo que Casio lanzó el AP-7 y su fuente de sonido de piano avanzado (AP). En los años siguientes, las mejoras en la memoria continuaron impulsando un rendimiento mejorado y una calidad de sonido a precios cada vez más asequibles.

Sin embargo, las fuentes de sonido PCM tenían sus limitaciones.

Aunque eran ideales para lograr una reproducción fiel de los sonidos almacenados, las fuentes de sonido PCM reproducían con dificultad variaciones sutiles en el tono y la articulación según la dinámica de reproducción. Casio lanzó una unidad de desarrollo destinada a abordar este problema y a mejorar la arquitectura de PCM y, en 1993, se presentó el CTK-1000: un piano electrónico cuya fuente de sonido de arquitectura de sonido integrado (iXA) combinaba la generación de tonos basada en PCM con respuesta táctil y funcionalidad DSP.

Muchos de nuestros productos actuales aún utilizan fuentes de sonido basadas en PCM, combinadas con tecnologías únicas de Casio para reproducir cambios complejos en el tono debido a factores como la disminución de notas y la dinámica en que se toca. Nuestra línea de pianos electrónicos incluye tanto la serie Privia como la serie CELVIANO, que cuentan con fuentes de sonido Acoustic and Intelligent Resonator (AIR) y el CELVIANO Grand Hybrid con su fuente de sonido Air Grand. Mientras tanto, la serie Casiotone también cuenta con la fuente de sonido acústica inteligente multi-expresiva (AiX) basada en PCM.

Fuente de sonidos basada en PCM

[SK-1]

[CT-640]

[CDP-3000]

CELVIANO AP-7

[CTK-1000]

Privia PX-S1100

CELVIANO Grand Hybrid GP-510BP

Casiotone CT-S1

Sin embargo, aunque estos avances permitieron que la generación de tonos basada en PCM proporcione recreaciones fieles de una amplia variedad de sonidos instrumentales, sigue teniendo dificultades con el instrumento más fundamental e históricamente importante de todos: la voz humana. Las reproducciones de las líneas vocales cantadas se enfrentan a diversos desafíos. Las diferentes técnicas vocales no solo producen variaciones muy complejas en el tono, sino que el contenido lírico también presenta una gran cantidad de variables para procesar. Esto va desde la diversidad del vocabulario hasta las transiciones entre sílabas y la forma en que una melodía o frase diferente puede transformar completamente la forma de onda necesaria para una palabra determinada. Además, aunque los enfoques basados en PCM evolucionaron en los últimos años, junto con los vocoders y otras tecnologías, las deficiencias significativas siguen obstaculizando la adopción generalizada.

Ahora, por fin, 2022 trae consigo los antiguos esfuerzos de desarrollo de Casio para dar sus frutos en un enfoque completamente nuevo de la tecnología de generación de sonido: Vocal Synthesis, y un nuevo tipo de instrumento: el Casiotone CT-S1000V. Este nuevo dispositivo combina Vocal Synthesis con un revolucionario modo Phrase (Fraseo) para realizar la impactante y compleja tarea de poner líneas vocales cantadas al alcance de la mano, pero con una interfaz que es lo suficientemente simple e intuitiva para que cualquier persona la use. Y al igual que los últimos 30 años trajeron una gran cantidad de cambios a nuestro estilo de vida, esperamos que esta última innovación pueda tener un impacto similar en los campos de la composición y las presentaciones musicales.

Vocal Synthesis

Casiotone CT-S1000V

Casiotone