Artículos sobre fantasía y escritura

Dragon Naturally Speaking, el dragón que escribe lo que dices

Por: José Alejandro Cantallops Vázquez

Y no, antes de que pienses que me equivoqué de título con el de un cuento cómico, no lo he hecho: hoy les hablaré sobre el Dragon Naturally Speaking, el cual es, mi opinión, el mejor programa de dictado que existe actualmente. Además de esto, es una herramienta muy útil que te permitirá controlar la computadora sólo con tu voz y si eres de los que escribe mucho, reducirá a casi nada el dolor en tus muñecas.

Así que si eres una de estas personas que quiere ahorrarse el dolor en las manos que viene tras largas horas de escritura, transcribir tus grabaciones de audios o cuentos y tienes la paciencia de ayudar a crecer a este bebé dragón. Entonces, quédate leyendo, este artículo te interesará mucho.

El mundo sin teclados está cerca

¿Cuántos de nosotros no crecimos viendo esas películas de ciencia ficción en las que tu computadora escribía todo lo que le decías de manera perfecta? El futuro sería un mundo sin teclados, o eso pensábamos, porque estoy seguro de que ustedes han probado o visto uno de estos programas de dictado que dicen que te ahorrarán una cantidad inmensa de tiempo, pero que tras un par de pruebas nos decepcionaban por su mala calidad de transcripción.

Sí, yo también pasé un montón de horas pensando en lo genial que sería simplemente sentarme a escribir mis “grandes” novelas dictándoselas a la computadora y que esta hiciera el trabajo duro de transcribirlas. Una esperanza que había abandonado hasta que probé este software, el cual, aunque es bastante bueno no te librará por completo del teclado, pero sí te dejará probar un poco de ese futuro.

¿Qué es el Dragon Naturally Speaking?

Entrando más en materia, el Dragon Naturally Speaking es un programa de reconocimiento de voz desarrollado por la empresa americana Dragon Systems, que tras varias fusiones y adquisiciones actualmente forma parte de Nuance Communications. Y, aunque apenas es conocido fuera del circuito profesional, es un software que se especializa en la transcripción de dictado, audios grabados y convertir texto en audio.

Como ya les he mencionado, este software no es demasiado conocido, por lo que mi llegada a el, fue pura casualidad. Hace un par de años estaba buscando una alternativa al Text Aloud para convertir las novelas en audio y pensé que con los 4 gigas que se llevaba la versión 12 de este programa, iba a tener una calidad de voz casi humana. Aunque, sucedió lo contrario, la calidad de su software de texto a voz es buena, pero ya le tengo un cariño inmenso a Jorge y a Helena. Sin embargo, eso hizo que me centrara en su principal característica: el dictado.

Pero lo primero que hay que saber es que el software no es estático, sino que el Dragon aprende de los errores que le corriges y se ajusta más y más a tu voz, la manera en que hablas y tu cadencia. El programa puede llevar esto a un extremo tal que no sólo es capaz de reconocer mi voz en un medioambiente lleno de ruido de fondo y otras voces, sino de hacerlo con completa precisión. Su origen angloparlante condiciona que la precisión de su software sea casi increíble en inglés, mientras que en español deje un poco que desear.

También vale la pena aclarar que las dos versiones con las que he trabajado y de las que les hablaré: la 12 y la 15.3; son crackeadas y no disfrutan de todo el apoyo que ofrecería una instalación original y teniendo internet en casa. La diferencia de rendimiento no es tan grande, pero si influye mucho en aspectos claves como el soporte técnico y la velocidad de aprendizaje de la máquina. Lo otro es que su costó ronda entre los 500 y los 1200 usd, dependiendo de las funcionalidades que pidas. Barato, ¿no?

¿Qué necesitas para usarlo?

¿Emocionado? ¿Interesado? Al menos, ¿curioso? Si es así, entremos en la parte técnica. El Dragon Naturally Speaking, como muchos softwares de hoy en día, necesita de algunos requerimientos mínimos por parte de nosotros (y no, no me refiero a tener una seductora voz de narrador/heroína de radionovela de los años 20) y nuestra computadora:

  • Una computadora (aunque si tienes un Iphone y dinero suficiente está disponible una versión para móvil, aunque de esta no sé mucho), de preferencia una laptop, pues la mayoría de nosotros no tendremos un micrófono profesional con una cable de metro ochenta para conectarlo a la tarjeta de sonido y tendremos que usar los micrófonos que vienen incorporados con algunos audífonos.
    • Mínimo, un i3 a 1,5 GHz. Es un programa realmente pesado si tienes pocos recursos.
    • 4 Gb de memoria RAM, el programa puede operar con menos y solo un par de veces lo he visto usar más de dos gigas, pero lo mejor es tenerlos para que la computadora no viva deteniéndose cada vez que dictas.
    • 4 Gb de disco duro, al menos inicialmente. A medida que Dragon vaya aprendiendo más sobre tus patrones de dictado y tu voz, la carpeta de tu perfil puede llegar a crecer hasta el giga y medio, pero de ahí en adelante se estabiliza.
  • Un micrófono profesional para computadoras o un par de audífonos que tengan micrófono incorporado. Te recomiendo que si tienes varios, los pruebes hasta encontrar el mejor, que no siempre coincide con el audífono de mejor marca. Los fabricantes venden unos bastante buenos con microtarjeta de sonido y entrada usb que aumentan mucho la calidad del sonido, pero son caros (19-53 usd) e inaccesibles a nuestra hermosa isla.
  • Un lugar en el que puedas dictar. Al principio, y especialmente si eres una persona tímida, lo mejor es un lugar donde no haya otras personas. Luego Dragon se irá acostumbrando a tu voz y podrás bajar el tono de voz y hacerlo en público.
  • La instalación puede tomar entre media hora y una hora, dependiendo de la versión del Dragon y los recursos de tu computadora. Pero no lo hagas hasta tener un par de audífonos con micrófono, sino te quedarás trabado a la mitad. Y, por favor, pasa el tutorial, es clave.

Tienes que enseñar a escribir al bebé Dragon

Muy bien, ya el software está instalado, pasaste el tutorial y te gustó lo que puedes hacer. Has esperado a estar solo en tu cuarto, sala u oficina de trabajo. Estás seguro de que nadie te molestará, los niños están durmiendo y los demás en el trabajo están ocupados con sus tareas. Activas el programa, abres una página en blanco del Word, te acercas el audífono a los labios y dices tus primeras grandes palabras y… a la segunda, tercera o quinta oración, si tienes esa voz perfecta de locutor(a): aparece un error.

Borras y vuelves a probar, más errores… ¡el tío este del blog me estafó, ya verá el comentario que le dejaré!… Y más o menos así sucedería si no les explico el punto más básico de este software: no es perfecto, tienes que enseñar al Dragon a escribir. Y ese es un proceso que toma tiempo y dedicación.

¿Cuánto tiempo necesita para aprender?

Mucho menos de lo que necesitaste tú para poder escribir un dictado de corrido y sin equivocarte. Según mis cálculos, unas 200-300 horas de dictado, además de darle a aprender los documentos que has escrito y corregir los errores usando el comando corregir del programa, si los borras y lo reescribes normalmente, el programa no aprenderá de ellos. Sí, cuesta tiempo y que tengas un mínimo de habilidades de corrección, pero se paga a largo plazo.

Actualmente le dicto a mi perfil de Dragon en tiempo real y he logrado velocidades de traducción de unas 1.200-1.500 palabras por hora (4-5 páginas). Mientras que transcribiendo o dictando normal de 2000-4.500 palabras por hora (7-15 páginas). Todo un ahorro de tiempo y dolor de muñecas, como prueba de ello, el año pasado fui capaz de traducir durante la cuarentena (mes y medio) las últimas 150 diatribas de Limyaael, unas 350.000 palabras, todas usando este software.

Y, para terminar, les propongo hacer un balance de los aspectos positivos y negativos que he identificado durante el año que he estado usando el Dragon Naturally Speaking.

Ventajas

  • Ahorro de tiempo escribiendo y menos dolor de muñecas. En especial si lo que le vas a dictar son textos sencillos, no por el contenido, sino de tener pocas mayúsculas, negritas, cursivas, paréntesis y otros tipos de símbolos gramaticales.
  • Puedes transcribir tus propias grabaciones. Esta es una utilidad que me gustó mucho y que uso cada vez que no quiero escribir mis ideas, me grabo con el celular y convierto el archivo en una audio de un solo canal y luego se lo doy al programa para transcribirlo. Su precisión es bastante buena, aunque con más de media hora de audio podría tardarse en procesarla (estas son de 4.000-6.000 palabras). Claro, después de que termine de transcribir tendrás que darle una pasada y corregir los errores.
  • Es perfecto para traducir artículos. Y es el principal uso que le he dado al software, pues si tienes un buen nivel de inglés y puedes hacer una traducción oral a simple vista (traducir el texto mientras vas leyéndolo). Este proceso te ahorra tiempo, te dará rapidez y mejora tus capacidades de traducción. Sin contar que el tener que revisar una segunda vez el texto en busca de errores de transcripción también te servirá para corregirlo y mejorar la traducción.
  • Digitalizar cualquier libro antiguo que tengas en mal estado. Este es un uso menos frecuente, pero casi siempre tenemos un libro del cual ya no aparecen versiones digitales (la mayoría de los libros anteriores a 1940 y los libros soviéticos). De esta manera, podemos pasar a digital el libro mientras lo dictamos. Es un proceso mucho más rápido que si lo tuviéramos que teclear y que nos servirá de mucho para entrenar al programa.

Desventajas

  • El tiempo que toma entrenar al Dragon. Sin duda esta es su mayor desventaja, no solo en cuestión de tiempo, sino también estar pendiente a las tildes y el uso correcto de los tiempos verbales cuando lo corrijamos.
  • La versión 15 tiene un problema con las formas verbales en futuro. Esto puede deberse a que a diferencia de la 12, que era la pro, esta versión que es personal, tiene opciones limitadas, pero no reconoce naturalmente las expresiones futuras.
  • El tiempo que le toma al Dragon hacer el Reglaje de Precisión. El cual, como dice su nombre es la forma mediante la cual el software, usando los datos de dictado almacenados, mejora su algoritmo. Dependiendo de la cantidad de datos puede tomar entre 45 minutos a 2 horas. Durante este tiempo usar el Word será casi imposible, así como utilizar programas exigentes. Lo mejor es hacerlo cuando no tengas que utilizar la computadora.

 

Y con eso termino mi breve reseña y recomendación del Dragon Naturally Speaking. Espero que les haya llamado la atención y si crees que puedes beneficiarte de sus utilidades, lo pruebes y le tengas un poco de paciencia, sus resultados lo merecen. Ahora, para terminar: ¿conoces de otros programas de dictado? ¿Has probado antes el Dragon? Si es así, ¿cuál ha sido tu experiencia? Comparte tu experiencia o alguna duda que te haya quedado y estaré complacido de responderla.

Comparte esta entrada y ayuda al blog.

Ingeniero industrial y profesor de Ergonomía de día y, de noche, escritor de fantasía y traductor. A finales del 2017 crea el blog El último puente, con la intención de aumentar la lectura de la fantasía y su escritura dentro de Cuba.

12 Comentarios

Dejar una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *