Skip to Content

AOL Tech

reconocimientodevoz posts

Intel Jarvis quiere cortar con la nube y enterrar al resto de asistentes personales

Intel Jarvis pretende enterrar al resto de asistentes personales al no requerir conexión con la nube
Durante la pasada edición del CES, Intel estuvo mostrando todo un arsenal de cacharros curiosos (algunos con más salida que otros, para qué nos vamos a engañar), pero uno de los que probablemente terminará dando más de qué hablar es Jarvis. Una de las principales bazas de este nuevo auricular Bluetooth con reconocimiento de voz es la posibilidad de trabajar sin ningún tipo de conexión, como si de magia se tratara. La compañía de Santa Clara ha confirmado a los chicos de Quartz que la unidad puede desenvolverse perfectamente sin necesidad de comunicarse todo el rato con un servidor; este detalle, que además de resultar muy útil en caso de no disponer en un momento dado de conexión, también ayuda a acelerar su respuesta y lograr que la interacción sea más natural que con otros asistentes tipo Siri o Google Now.

Para terminar de rizar el rizo, Intel asegura que no será requisito imprescindible el tener que desenfundar la cartera para poder disfrutar de toda la sabiduría de su nuevo pepito grillo, ya que pretende vender dicha tecnología a los fabricantes de telefonía. Aún no hay detalles concretos sobre su llegada, pero descuida que seguiremos informando. Todo sea por reducir al máximo el repertorio de cachivaches que llevamos encima en nuestro día a día.

Un bug en Google Chrome permite escuchar tus conversaciones (aunque probablemente no tienes nada que temer)

Un bug en Google Chrome permite escuchar tus conversaciones (aunque probablemente no tienes nada que temer)
Google puede sentirse orgullosa por la forma en la que ha conseguido introducir la tecnología de reconocimiento de voz en un gran número de sus productos más populares. Desde Glass a Chrome, pasando por Android, los programas y gadgets de Google se distinguen por su agradecida y práctica capacidad para reconocer nuestras órdenes habladas. Los problemas llegan cuando esta función es explotada para espiar a los usuarios.

Tal Ater, un programado especializado en sistemas de reconocimiento de voz, ha descubierto un bug en Chrome que permitiría que sitios maliciosos escuchen las conversaciones de sus visitantes, activando el software de reconocimiento de forma indebida. Para ello, afortunadamente, el usuario tiene que dar permiso a dichas páginas web, tras lo cual podrían abrir un pop-under con el propósito de espiarle usando el micrófono del equipo. Los sitios que explotaran este bug podrían seguir escuchando tus conversaciones incluso tras cerrar la pestaña correspondiente, siempre y cuando Google Chrome y el pop-under permanezcan abiertos.

Cualquier persona mínimamente prudente no permitirá que un sitio web pueda acceder al sistema de reconocimiento de voz integrado, aunque por desgracia todos conocemos usuarios incapaces de contener su dedo índice cuando ven una ventana pidiendo cualquier tipo de confirmación. En cuanto a Google, la compañía reconoce que el problema es real y que ya tiene una solución desarrollada desde hace tiempo, si bien todavía no ha sido implementada ni parece que tenga planes para ello. Lo que no nos extrañaría es si al menos añadiera algún tipo de notificación para indicar al usuario que un sitio está monitorizando su actividad desde el micrófono. En cualquier caso, esta es la postura oficial de la compañía:

La seguridad de nuestros usuarios es una de nuestras máximas prioridades, y esta característica fue diseñada con la privacidad y la seguridad en mente. Hemos vuelto a investigar el asunto y no es apto para conseguir una recompensa [Nota: Google ofrece premios económicos a los desarrolladores que encuentren problemas importantes en su explorador], dado que un usuario ha de activar primero el reconocimiento de voz en cada sitio que lo solicite. Esta característica se ajusta a la especificación actual W3C, y seguiremos trabajando en mejoras.


Si quieres ver el bug en acción, encontrarás un vídeo tras el salto.

Audience quiere que tu teléfono te preste atención sin gastar batería con sus nuevos coprocesadores

Audience quiere que tu teléfono te preste atención sin gastar batería
Si has estado prestando atención durante los últimos meses, te habrás dado cuenta de que la última tendencia en la industria de la telefonía móvil no son las pantallas 2K ni las cámaras de 20 megapíxeles: son los coprocesadores. Estos pequeños chips secundarios han demostrado su valía a la hora de economizar batería y reducir la carga soportada por el procesador principal en teléfonos como el Moto X y el iPhone 5s de Apple, lo que ha estimulado el interés de otros fabricantes. Audience, una compañía especializada en el diseño de chips de audio, quiere situarse en una posición privilegiada antes de que otras firmas inunden el mercado con sus propios chips, por lo que ha aprovechado el CES para anunciar su VoiceQ, una tecnología disponible en los nuevos chips eS700 que según la compañía es más eficiente y potente que el chipset X8 de Motorola.

Apple quiere que etiquetes tus fotos con la voz

Apple quiere que etiquetes tus fotos con la voz
Apple parece estar dispuesta a simplificar todo lo posible la organización de tus fotos gracias a una nueva solicitud de patente que te permitiría utilizar directamente la voz para crear etiquetas. Según recogen los documentos presentados por los de Cupertino ante la oficina de patentes y marcas de Estados Unidos, dicha técnica permitiría describir las capturas de un dispositivo móvil usando un lenguaje natural y ciertos comandos de voz, así como información de interés de redes sociales para que luego puedan encontrarse de una manera más fácil.

Para que te hagas una mejor idea del funcionamiento y alcance de este software, los de la manzana explican que por ejemplo admitiría que dijeras "aquí estamos en la playa" y la aplicación se encargaría ella solita de etiquetarte a ti junto con la localización en la que ha sido tomada la instantánea, sino que también añadiría a todos aquellos de tus contactos que han confirmado su asistencia a dicha escapada. Para terminar de rizar el rizo, la plataforma incluso tendría la potestad de reconocer gente y escenas automáticamente para agilizar aún más la tarea.

Lo malo de todo esto es que, al tratarse de una mera solicitud, no hay confirmación alguna de que la idea vaya a acabar tomando forma en un futuro cercano. Eso sí, si Apple decidiera pluriemplear aún más a Siri, descuida que te avisaremos volando.

[Vía AppleInsider]

PlayStation 4 reconocerá un número bastante limitado de órdenes de voz

PlayStation 4 reconocerá un número bastante limitado de órdenes de voz
Es posible que la nueva PlayStation 4 vaya a ser la consola más social de esta nueva generación que se avecina, pero no esperes que sea la más atenta del mercado. A pesar de que la nueva cámara PlayStation 4 Eye (PS4 Eye para los amigos) posee cuatro micrófonos como complemento a su lente para capturar órdenes de viva voz, durante un evento de prensa celebrado por Sony con motivo del próximo lanzamiento de la consola en Estados Unidos, se ha comunicado que la PS4 apenas reconocerá un puñado de órdenes habladas. Al menos de lanzamiento.

Con su configuración actual la PS4 no podrá encenderse con una simple indicación por voz del usuario (una característica presente en la Xbox One a través de Kinect y mil veces cacareada por Microsoft), pero es que ni siquiera tendrá las entendederas necesarias para pausar un vídeo en reproducción. Es más, ahora mismo ninguna de las aplicaciones desarrolladas por terceras compañías incorporan reconocimiento de voz.

Facebook se hace con Mobile Technologies, una compañía especializada en reconocimiento de voz

Facebook se hace con Mobile Technologies, una compañía especializada en reconocimiento de voz
Vistos los positivos resultados cosechados por Facebook durante el pasado trimestre, estaba más que cantado que la empresa iba a reinvertirlos en nuevas aventuras -lo que no sabíamos es que nos íbamos a llevar una sorpresa así. La casa se ha hecho con una pequeña compañía dedicada al reconocimiento de voz y la traducción automática llamada Mobile Technologies. Lo más probable es que este nombre te suene un poco más si te decimos que se encuentra tras Jibbigo, una app disponible en iOS y Android que se encarga de traducir sobre la marcha texto o voz a otros idiomas.

Los de Zuckerberg no han ofrecido por ahora detalles concretos sobre cuáles van a ser sus planes de futuro, pero sí han reconocido que las tecnologías de voz han sido siempre uno de sus focos de interés ya que, según Tom Stocky (director de gestión de producto de Facebook), éstas "se han convertido una forma cada vez más importante para que la gente navegue por dispositivos móviles y la web". Por si esto fuera poco, nuestro protagonista opina que dicha tecnología les ayudará a que sus productos se desarrollen un poco más y puedan ponerse al día en esta evolución, convirtiéndose en una "inversión a largo plazo".

[Vía TechCrunch]

Leer - Tom Stocky en Facebook
Leer - Jibbigo

Dragon Mobile Assistant para Android se actualiza a la versión 4.0 con modo vehículo y nuevas notificaciones

Dragon Mobile Assistant para Android se actualiza a la versión 4.0 con modo vehículo y nuevas notificaciones
Los chicos de Nuance siguen trabajando para que no tengas que "molestarte" en posar los dedos sobre tu teclado más de lo necesario. Dragon Mobile Assistant para Android ha dado hoy el salto a la versión 4.0 para pasar a integrar un nuevo modo que detecta cuándo te encuentras en un vehículo en movimiento para hacer saltar automáticamente el Modo Conductor y gestionar tu terminal con la voz, pudiendo así centrarte en la carretera. Tal y como cabría esperar de un sistema de estas características, nuestro protagonista cuenta con notificaciones habladas para llamadas entrantes y mensajes, pero además puede alertarte de citas ya fijadas en el calendario y hasta actualizaciones de Facebook. El lote se completa con avisos variados para el e-mail y mensajes personalizables para despertar al equipo. En caso que estés interesado en darle una oportunidad, tienes que saber que la actualización debería llegar en breve a Google Play, así que no quites ojo a la tienda durante estos días.

Nuance Dragon Notes se planta en Windows 8 para que dictes tus apuntes de una manera más sencilla

Nuance Dragon Notes se planta en Windows 8 para que dictes tus notas de una manera más sencilla
Cada vez está más de moda eso de controlar nuestros cacharros con la voz, un tren en el que Nuance no sólo no está dispuesta a perder siendo toda una veterana en el sector, sino que está empeñada en seguir montada en los primeros vagones. La compañía acaba de anunciar un nuevo programa para tablets y ordenadores con Windows 8 llamado Dragon Notes, que básicamente viene a ser una versión simplificada de la plataforma NaturallySpeaking. La casa parece querer regirse esta vez por el refrán "quien mucho abarca, poco puede" y, por ello, ha preferido centrarse en las tareas más esenciales, como por ejemplo el dictado de voz de correos electrónicos, notas, actualizaciones en redes sociales o búsquedas en la web. De este modo, su nuevo estandarte en el nuevo universo de los de Redmond logra disfrutar de una interfaz mucho más sencilla e intuitiva. Dado que estamos ante una especie de versión "mini", la casa nos cuenta que su precio también ha sido encogido notablemente y, aunque de momento no tenemos precios en euros con los que ilustrarte, quédate con que su coste en Estados Unidos partirá de 20 dólares en lugar de los 100 habituales, a los que luego habrá que sumar otros 10 más por cada nuevo idioma que quieras añadir.

Samsung, Intel y Telefónica invierten en un sistema de reconocimiento de voz que intercepta conversaciones para adelantarse a tus necesidades

Samsung, Intel y Telefónica buscan un sistema de reconocimiento de voz que se adelante a tus necesidades
Más que el reconocimiento facial o la capacidad para sentir tus dedos en el aire y reaccionar acordemente a sus gestos, la próxima gran meta en la interacción hombre-máquina pasa por la correcta interpretación de las órdenes enviadas por viva voz. Todas las grandes compañías involucradas en la electrónica de consumo tienen sus propios planes en desarrollo, aunque eso no impide que puedan invertir en soluciones externas de su interés como han hecho Samsung, Intel y Telefónica, que se han convertido en accionistas de Expect Labs, que ya contaba con el apoyo de Google. ¿Y qué tiene de especial el software de reconocimiento de voz de esta empresa? Pues que puede adelantarse a tus propios deseos, llegando incluso a introducirse dentro de tus llamadas telefónicas.

La tecnología desarrollada por Expect Labs ha sido bautizada con el nombre ACE, de Anticipatory Computing Engine, y está pensada para realizar acciones u ofrecer información escuchando y analizando tus conversaciones en tiempo real. La idea es que ACE no se limite a trabajar únicamente cuando lo invoques desde el botón correspondiente, sino que permanezca atento durante todo el día a cualquier cosa que puedas decir para obrar en consecuencia.

Intel y Samsung están lógicamente interesadas por las nuevas posibilidades que abre a sus ultrabooks y teléfonos móviles (trata de pensar en un S Voice vitaminado e inteligente), pero el caso de Telefónica es todavía más interesante (y ligeramente perturbador), dado que ACE podría convertirse en testigo invisible de tus conversaciones, interviniendo literalmente las llamadas de voz para obtener información útil.

Amazon habría adquirido el asistente virtual y buscador por voz Evi

Amazon habría adquirido el asistente virtual y buscador por voz Evi
Es evidente que Amazon desea mantener todo el control sobre el software utilizado en los Kindle, y eso implica remplazar aplicaciones proporcionadas por Google con algo propio. Debido a esto no nos sorprende del todo saber que la compañía podría haber adquirido una empresa con una aplicación que incluye un asistente virtual y un buscador de voz llamado Evi, según han informado nuestros compañeros de TechCrunch.

Por alguna razón no se ha comunicado esta compra de manera pública, pero resulta curioso que los directores y hasta la secretaria de Evi hayan sido remplazados por empleados de Amazon del Reino Unido. Aunque claro, esto no confirma la adquisición de la compañía, pero al menos puede representar una integración en un nivel bastante elevado.

Sobre el producto que podríamos ver en Kindle, podemos pensar en algo similar al asistente de voz actual de Evi para Android y iOS, que casualmente usa tecnología de Nuance, similar a la de Siri. En todo caso, debemos esperar a que aparezca el producto y/o que Amazon confirme la adquisición de la empresa antes de dar todo esto por contado.

Las próximas Smart TVs de Panasonic vendrán con control por voz Dragon TV

Las próximas Smart TVs de Panasonic vendrán con control por voz Dragon TV
Panasonic y Nuance llevan ya tiempo colaborando en las posibles aplicaciones de un sistema de reconocimiento de voz para televisores, de manera que no nos sorprende en absoluto que ambas casas hayan querido llevar un paso más allá su idilio de cara al lanzamiento de la nueva serie Smart TV. Según detallan en su nota de prensa, los últimos televisores con pantallas LCD y de plasma presentados por Panasonic durante el pasado CES dispondrán del sistema Dragon TV para controlar las opciones más comunes de estos equipos sólo con la voz, permitiendo -entre otras cosas- cambiar el volumen o los contenidos, pasear por sus menús o realizar búsquedas web. En caso necesario, la plataforma es incluso capaz de describir los contenidos y opciones disponibles, por ejemplo para personas con problemas de visión. Por ahora no hay información sobre mercados concretos, pero Panasonic indica que su despliegue global comenzará a principios de esta primavera, así que ya puedes ir ahorrando.

[Vía SlashGear]

Dragon NaturallySpeaking 12 llega para mejorar tus dictados digitales

Si sigues empeñado en no tocar el teclado y pretendes hablar todo el tiempo con tu PC, entonces deberías de echar un vistazo a la nueva versión de Dragon NaturallySpeaking. Nuance ha presentado la versión 12 de su software de reconocimiento de voz, el cual permitirá realizar transcripciones al instante con tan sólo hablar al ordenador. Esta nueva versión llega con 100 nuevas funciones, entre las que destacan un mejor rendimiento, una mejora del 20% en exactitud, mejor adaptación con las preferencias del usuario, integración con Gmail y Hotmail y una nueva función que permitirá hacer uso de la aplicación Dragon Remote Mic para Android. El programa saldrá a la venta el 12 de agosto con un precio de 100 dólares (81 euros), aunque desde ya mismo se pueden hacer las primeras reservas. Tienes más información en el emplace de ternura. -¡Ouch!-

LG Quick Voice se renombra y aprende a hablar inglés

LG Quick Voice se renombra y aprender a hablar inglés
Era cuestión de tiempo que LG abriera las puertas de Quick Voice al mundo anglosajón y los coreanos no ha querido hacernos "esperar" más. La compañía ha anunciado que su app de reconocimiento de voz estará disponible en el noble lenguaje de Shakespeare para el primer semestre del próximo año -sí, el próximo-, permitiendo su disfrute a muchos más usuarios -hasta ahora sólo estaba habilitado en su idioma natal-. Con este anuncio se ha dejado saber algunos detalles más de la propia aplicación, como son la posibilidad de elegir diferentes tipos de voces o que ofrece soporte para hacer también ajustes del Bluetooh, sonido y vibración sin tener que tocar la pantalla.

Esa no es la única novedad que trae consigo esta funcionalidad y es que la propuesta de LG ha decidido acortar su nombre y pasa a llamarse Q Voice, además de hacer saber que, aunque por el momento sólo está disponible para el Optimus Vu y Optimus LTE II, ya cuenta con la intención de dar el salto a otros modelos de la casa... ¿Se están durmiendo un poco en los laureles o es cosa nuestra?

Una empresa de Shanghái denuncia a Apple por pisarle sus patentes con Siri

Una empresa de Shanghái denuncia a Apple por pisarle sus patentes con Siri
Todavía no se ha terminado de deshacer el entuerto entre S Voice y Siri por el que Apple quería paralizar las ventas del Galaxy S III en Estados Unidos, y ya tenemos a una compañía de Shanghái dispuesta a saltar al estrellato diciendo que, en realidad es la casa de la manzana la que ha metido la pata. La firma en cuestión responde al nombre de Zhi Zhen Internet Technology y asegura que el asistente de los de Cupertino choca frontalmente con el sistema de reconocimiento de voz -en chino, por cierto- de su servicio Xiao i Robot para teléfonos y webs, protegido por una patente que data de 2004. Por el momento Apple no se ha pronunciado al respecto de manera oficial, pero no dudamos ni por un momento que sus abogados ya andan preparando un sonado contraataque -y más viendo que curiosamente ambas han optado por usar como icono el mismo tipo de micrófono.

[Vía The Next Web]

Leer - NASDAQ
Leer - Xiao i Robot

Microsoft se alía con Audible para mejorar el reconocimiento de voz de Windows Phone

Microsoft se alía con Audible para mejorar el reconocimiento de voz de Windows Phone
Dice el refrán que no hay dos sin tres y Microsoft acaba de mostrar con qué armas piensa responder al Siri manzanero y el S Voice de Sammy: una alianza con Audible. A pesar de que WinPho lleva acatando comandos de voz desde su séptima versión para abrir o cerrar aplicaciones, en Windows 8 podremos completar la experiencia realizando búsquedas e incluso reproduciendo libros electrónicos. Sin ir más lejos, Kevin Gallo ha sido el encargado de mostrar qué tal funciona el renovado sistema con nada menos que un pequeñísimo extracto de la tan de moda saga Juego de Tronos en directo, saltando capítulos hacia delante o pausando la locución sin demasiados problemas. Pero no creas que se trata de una característica exclusiva de Apollo, ya que la casa ha confirmado que también estará disponible a partir de hoy mismo para dispositivos que ejecuten 7.5.

No te pierdas toda la información en nuestro liveblog del Windows Phone Summit.




Noticias AOL