La compañía Google ha mostrado, en el evento internacional Search On, como los avances en inteligencia artificial están ayudando a transformar sus productos de información, creando experiencias de búsqueda más afines con la forma en la que funciona la mente humana y multidimensionales como las propias personas. En el citado evento se han presentado tres novedades principales para encontrar exactamente lo que buscamos en nuestras búsquedas combinando imágenes, sonidos, texto y voz, como hace de forma natural el ser humano.
Una búsqueda visual más natural, con la multi búsqueda, una forma nueva de hacer búsquedas utilizando imágenes y texto simultáneamente.
La traducción del entorno. Utilizando los avances en inteligencia artificial, Google pasa de traducir texto a traducir imágenes. Hoy ya se utiliza más de mil millones de veces al mes para traducir el texto de imágenes a más de un centenar de idiomas.
Utilización de la visión inmersiva para explorar el mundo. Mediante los avances en visión artificial y modelos predictivos, ha reinventando lo que entendemos por un “mapa”. Los clásicos en dos dimensiones evolucionarán hacia una vista multidimensional del mundo real, que permitirá experimentar un lugar como si se estuviera allí.
“Llevamos más de dos décadas trabajando en nuestra misión de organizar la información del mundo y hacerla accesible y útil para todos. Al principio, fue la búsqueda de texto pero, con el tiempo, hemos ido creando formas más naturales e intuitivas de encontrar información. Por ejemplo, ahora puedes buscar qué es lo que ves con la cámara o hacer preguntas de viva voz”, se ha informado durante el evento.
Desde la perspectiva de Google se vislumbra un mundo en el que se puede encontrar exactamente lo que se busca combinando imágenes, sonidos, texto y voz, como hace de forma natural el ser humano.
Búsqueda visual
Utiliza las cámaras como herramienta, el teclado del futuro, con la que acceder a información y comprender mejor el entorno. En 2017 nacio Lens, que permite buscar lo que vemos utilizando la cámara o una imagen. A día de hoy, Lens se utiliza para responder a ocho mil millones de preguntas cada mes.
La búsqueda visual es más natural con la multibúsqueda, una forma novedosa de hacer búsquedas utilizando imágenes y texto simultáneamente. Hace unos meses, se implementó la versión beta del modo multibúsqueda en Estados Unidos y, en Search On, se ha anunciado que estará disponible en más de setenta idiomas en los próximos meses. Un paso más allá se da con la multibúsqueda cerca de mí, que permite hacer una foto a algo desconocido, como un plato de comida o una planta, y encontrarlo en un lugar cercano, como un restaurante o un centro de jardinería. Este otoño se dará el pistoletazo de salida a esta herramienta en inglés, en Estados Unidos.
Traducir el mundo alrededor
Uno de los mayores potenciales de la percepción visual es su capacidad para romper las barreras lingüísticas. Mediante la inteligencia artificial, se ha pasado de traducir texto a traducir imágenes. Google ya se utiliza más de mil millones de veces al mes para traducir el texto de imágenes a más de un centenar de idiomas. Pero, a menudo, lo que conforma el significado es la combinación de las palabras y su contexto (las imágenes en las que se inscribe el texto). Hoy día, ya se combina el texto traducido con esas imágenes contextuales, gracias a una tecnología de aprendizaje automático llamada Redes Generativas Antagónicas (RGA o GAN, por sus siglas en inglés). Si, por ejemplo, se apunta con la cámara a una revista en otro idioma, veremos en la pantalla el texto traducido superpuesto sobre las imágenes que lo acompañan.
Visión inmersiva
Gracias a los avances en visión artificial y modelos predictivos, Google reinventa los mapas. Los clásicos en dos dimensiones evolucionarán hacia una vista multidimensional, que permitirá experimentar un lugar de manera personalizada.
Al igual que la posibilidad de consultar el tráfico en tiempo real en modo navegación cambió Google Maps, haciéndolo más útil, se ha logrado otro avance significativo con la vista inmersiva de Google Maps, con más información como las condiciones meteorológicas o lo concurrido que está un determinado lugar. Con esta experiencia es posible hacerse una idea de cómo es un lugar antes incluso de poner un pie en él, para decidir dónde se quiere ir y cuándo.
Al fusionar una representación avanzada del mundo con modelos predictivos, se da idea de cómo será un lugar mañana, la próxima semana o incluso dentro de un mes. A día de hoy, se amplia la primera versión de esta función con imágenes aéreas de doscientos cincuenta enclaves emblemáticos. En los próximos meses llegará la vista inmersiva a cinco grandes ciudades.
Fuente: El Día – Tecnología