La tecnología española que ha adelantado a Google y Amazon

Shazura, la firma de reconocimiento de imágenes basada en Inteligencia Artificial, va varios años por delante de los investigadores de Google y Amazon.

A veces, hacer entender al mercado dónde está la “gracia” de una tecnología que se puede parecer a otras existentes, pero que es de lejos mucho mejor puede ser una misión imposible con un Power Point o cualquier otra explicación teórica. ¿Y por qué no crear un Producto mínimo viable, lanzarlo al mercado un tiempo y explicar que eso es sólo una pequeña aplicación de las otras muchas que tiene tu producto? Es lo que hicieron los fundadores de Shazura, una tecnología de reconocimiento de imágenes basada en inteligencia artificial creada en España y liderada por una mujer, Sira Pérez de la Coba, que empieza a convertirse en el partner principal de los gigantes del retail de todo el mundo (aquí ya la utiliza El Corte Inglés).

Publicidad - Sigue leyendo debajo

“Tenemos una tecnología disruptiva de inteligencia artificial que licenciamos a grandes empresas. Una tecnología patentada hace 6 años y que llevarla al mercado nos ha costado tiempo y una estrategia que pasó por crear una aplicación para llamar la atención del mercado. Esa aplicación era Shop & Shop que nos ayudó a dar el salto a Silicon Valley pero no era el objetivo del proyecto”, explica su CEO y fundadora, Sira Pérez de la Coba.

Esa aplicación de reconocimiento de imágenes de moda permitía encontrar artículos en tiendas a partir de una foto de un producto. Pero es solo uno de los muchos usos que tiene su tecnología en muchos mercados. Aunque en la moda es donde pueda tener mayor visibilidad. “Nosotros lo estamos aplicando horizontalmente a múltiples mercados: retail, travel y turismo, salud, redes sociales, industrias… Es una tecnología aplicable a muchos mercados y son distintas soluciones en cada uno de ellos”, añade Pérez de la Coba.

Tecnología de este tipo está detrás de muchos ecommerces y herramientas de recomendación de ropa, por ejemplo. Pero son solo aparentemente lo mismo. “Lo que hay en el mercado son herramientas que interpretan las imágenes a partir de una explicación de texto de las imágenes. Es más lento y menos escalable. Nuestra tecnología, por el contrario, interpreta las imágenes igual que lo hace el cerebro humano. Utilizamos algoritmos que entienden la información visual extrayendo las huellas de las imágenes o vídeos, su finger print. Así, pueden reconocer en tiempo real millones de imágenes o vídeos. No es necesario pasar por el lenguaje de palabras para ver. De hecho nosotros vemos antes que hablamos, cuando somos pequeños. El proceso por el que el cerebro humano reconoce la información visual no tiene nada que ver con el proceso del lenguaje; el proceso de imágenes es hasta 60.000 veces más rápido que el lenguaje. Entonces, ¿por qué basarnos en el lenguaje que es algo inventado por el humano y que tienes que definir distintos idiomas, etc.?”.

Publicidad - Sigue leyendo debajo

Una española en la vanguardia

“Al que se considera el padre de la inteligencia artificial, Geoffrey Hinton, un investigador de Google y el creador de todo este concepto de entrenamiento con datos, hace un año dijo lo que yo llevo 6 años diciendo: que lo estamos haciendo mal y tenemos que tirar todo y empezar de cero. Es decir, no tiene sentido hacer el reconocimiento de imágenes o de vídeo entrenando datos y convirtiéndolo a palabra. Así no es como lo hace el cerebro. Por fin el mercado nos ha dado la razón”.

Una tecnología que “se puede aplicar a cualquier información visual porque no necesitamos datos. El algoritmo simplemente extrae la huella de la imagen, aunque sea algo que no ha visto nunca. Luego lo enlaza con otras. Pero le da igual que sea una foto de Marte, que una silla o un vestido. Entonces, que en el caso de una app de búsqueda visual de moda, efectivamente, hay muchas empresas desde Asos al propio Google con eBay, que tienen o que están lanzando cosas de este tipo. ¿Qué ocurre? Que sigue sin dar la respuesta: precisión. Y cuando ese catálogo va cambiando esa precisión se va degradando. Amazon, que es uno de los que más investiga en el concepto de búsqueda visual, cuando vio nuestra tecnología en una reunión que tuvimos con ellos, nos dijeron: “Nosotros llevamos más de cinco años intentando esto y no lo hemos conseguido. Lo que estamos viendo, si esto es real, es brutal”.

Aplicación a otros sectores

Vale, en el segmento de la moda su utilidad es brutal. Pero, ¿cómo se aplica en el sector salud, por ejemplo? “Todo el material de un hospital tiene variedades de más de un millón de distintos productos, cuando uno de los productos se estropea o simplemente quieren cambiarlo, no está catalogado de manera que el técnico o el operador del hospital pueda decir este es el instrumento 33. Si necesita pedir una pieza que lo sustituya no lo puede identificar. Con nuestra herramienta hace la foto y sobre el catálogo de un millón de productos que pueda haber en el mercado te dice cuál es para que lo puedas pedir directamente. Se evitan así envíos erróneos y hay más de un 50% de reducción de costes operativos”.

La compañía se movió hace tres años a Estados Unidos para captar financiación. Ahora están ya buscando una serie B y curiosamente uno de los fondos interesados “con los que llevamos hablando ya dos años es Google Venture”.

Publicidad - Sigue leyendo debajo