Planeta Red
  • Inicio
  • Dispositivos
  • Noticias
  • Reviews
  • Manuales
  • Aplicaciones
Sin resultados
Ver todos los resultados
Planeta Red
Sin resultados
Ver todos los resultados
Planeta Red
Inicio Noticias

Google Gemini 2.5: Audio nativo y generación de voz controlable en español

Por Hidalgo O_L
04/06/2025
en Noticias
1
Google Gemini 2.5
Compartir en FacebookCompartir en Twitter

La presentación de Gemini 2.5 por parte de Google durante el I/O 2025 ha dejado claro que la compañía busca redefinir la interacción entre humanos y máquinas. Con el lanzamiento de estas nuevas capacidades de generación de audio, Google ofrece una experiencia mucho más cercana, emocional y natural, que trasciende el texto convencional y da paso a una comunicación más auténtica.

Todas las características del nuevo Google Gemini 2.5

Una de las joyas de este avance es el audio nativo con Gemini 2.5 Flash preview. Gracias a esta innovación, los usuarios pueden mantener conversaciones fluidas y realistas con la IA. A diferencia de los sistemas tradicionales que transforman texto a voz, aquí se genera directamente el audio de respuesta, creando una experiencia más viva y adaptativa.

Lo fascinante de este modo de audio es su capacidad de entender y reflejar emociones. Cuando el usuario expresa miedo, sorpresa o enfado, Gemini 2.5 no solo lo comprende, sino que modula su respuesta con matices emocionales. Además, puede adoptar diferentes acentos y estilos lingüísticos, lo que lo convierte en una herramienta versátil para diversas aplicaciones.

Controllable TTS: la voz que se adapta a ti

Por otro lado, la funcionalidad de controllable text-to-speech (TTS) amplía las posibilidades de personalización. Esta característica permite generar diálogos con múltiples voces, jugar con la velocidad de narración y enfatizar palabras o frases para lograr la entonación deseada. Todo ello, con soporte para 24 idiomas y la capacidad de mezclar varios de ellos en la misma conversación, facilitando un alcance global.

Aunque estas funciones todavía no están disponibles para desarrolladores a través de APIs, Google ha abierto el acceso para probarlas en su plataforma AI Studio. En el stream tab, se pueden experimentar los diálogos nativos, mientras que en el generate media tab se pueden explorar las posibilidades del TTS controlable.

Lo que propone Google con Gemini 2.5 no es solo una mejora técnica, sino un paso adelante en la forma en que entendemos la interacción con las máquinas. Con la integración de emociones, acentos y un control preciso sobre la voz, la comunicación se vuelve más humana y rica. Esta apertura de funciones en fase de prueba deja claro que el futuro de la inteligencia artificial pasará por una voz más cercana y adaptable.

En definitiva, Gemini 2.5 promete ser mucho más que un asistente: un auténtico interlocutor capaz de entendernos y responder con una calidez y precisión sorprendentes. Una innovación que, sin duda, marcará el futuro del audio y la comunicación.

Etiquetas: Gemini 2.5
Artículo anterios

¡Adiós a los límites de Windows! Ahora podrás desinstalar Microsoft Store y elegir tu navegador por completo

Siguiente artículo

iPhone 18 Pro, 18 Pro Max y 18 Fold: así será el nuevo chip A20 de 2nm

Hidalgo O_L

Escritor, apasionado del gaming, la comedia y la fantasía medieval.

Siguiente artículo
iPhone 18 Pro, 18 Pro Max y 18 Fold

iPhone 18 Pro, 18 Pro Max y 18 Fold: así será el nuevo chip A20 de 2nm

LG UltraFine 40WT95UF: Primer monitor 5K2K con Thunderbolt 5 para profesionales

LG UltraFine 40WT95UF: Primer monitor 5K2K con Thunderbolt 5

Razer HyperFlux V2 Wireless Charging System

Razer HyperFlux V2 Wireless Charging System, una alfombrilla que carga tu ratón gaming mientras juegas

Comentarios 1

  1. John says:
    8 meses hace

    Gracias

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

TOPANÁLISIS/REVIEW

Garmin Forerunner 165 Music

Garmin Forerunner 165 Music

El Garmin Forerunner 165 Music es un reloj deportivo con pantalla €314
Razer DeathAdder V4 Pro

Razer DeathAdder V4 Pro

El Razer DeathAdder V4 Pro es una obra maestra de la €178
Acer PD163Q

https://amzn.to/4aVPLIn

El PD163Q es un ejercicio de ingeniería ambicioso. Acer ha logrado €358
Teufel BOOMSTER

Teufel BOOMSTER

El Teufel BOOMSTER es un altavoz 2.1 con subwoofer, radio DAB+
SoundPeats Air5 Pro+

SoundPeats Air5 Pro+

SoundPeats nos presenta unos nuevos auriculares que son todo lo que €72

TE INTERESA

Nuevo OPPO A6k 4G - Smartphone Libre con IA, 4GB RAM+256GB, Batería 6100 mAh, Pantalla LCD HD+ 120Hz, IP64, Cámara 50MP, Dual SIM, Versión Española - Azul
OPPO A6k 4G - Smartphone Libre con IA, 4GB RAM+256GB, Batería 6100 mAh, Pantalla LCD HD+ 120Hz, IP64, Cámara 50MP, Dual SIM, Versión Española - Azul
Comprar en Amazon
Nuevo OPPO A6k 4G - Smartphone Libre con IA, 4GB RAM+256GB, Batería 6100 mAh, Pantalla LCD HD+ 120Hz, IP64, Cámara 50MP, Dual SIM, Versión Española - Negro
OPPO A6k 4G - Smartphone Libre con IA, 4GB RAM+256GB, Batería 6100 mAh, Pantalla LCD HD+ 120Hz, IP64, Cámara 50MP, Dual SIM, Versión Española - Negro
Comprar en Amazon
Nuevo OPPO A6x 5G - Smartphone Libre con IA, 6GB RAM+256GB, Batería 6100 mAh, Pantalla LCD HD+ 120Hz, IP64, Cámara 50MP AI, Dual SIM, Versión Española - Negro
OPPO A6x 5G - Smartphone Libre con IA, 6GB RAM+256GB, Batería 6100 mAh, Pantalla LCD HD+ 120Hz, IP64, Cámara 50MP AI, Dual SIM, Versión Española - Negro
Comprar en Amazon

Artículos Recientes

Monitor AOC Agon AG275UXM2 con tecnología QD-Mini LED y 2304 zonas

AOC Agon AG275UXM2: Monitor 4K Mini LED con 2304 zonas

31/01/2026
Xiaomi Pad 8 Pro global

Xiaomi Pad 8 Pro Global: Geekbench confirma Snapdragon 8 Elite

31/01/2026
  • Quienes somos
  • Publicidad
  • Política de Privacidad
  • Aviso Legal
  • Contacto

Sin resultados
Ver todos los resultados
  • Inicio
  • Dispositivos
  • Noticias
  • Reviews
  • Manuales
  • Aplicaciones