El mayor cuello de botella en cualquier sistema de gestión no es vender, es mantener actualizados los costos. Resolvimos este problema integrando Inteligencia Artificial (Visión Computacional) directamente en la cámara del dispositivo móvil del usuario.
Las cámaras modernas generan imágenes extremadamente pesadas (15MB o más). Subir estos archivos en conexiones móviles lentas arruinaría la experiencia. Por ello, el procesamiento inicial ocurre en el navegador de tu celular: utilizamos la Canvas API de HTML5 para redimensionar inteligentemente la fotografía a una resolución óptima, conservando la legibilidad del texto pero reduciendo el peso del archivo en un 90% antes de enviarlo a nuestros servidores.
No utilizamos un OCR (Reconocimiento Óptico de Caracteres) tradicional, ya que estos fallan miserablemente cuando las tablas están torcidas o mal escaneadas. En su lugar, alimentamos la imagen procesada a un Modelo de Lenguaje de Inteligencia Artificial.
A través de Prompt Engineering estricto, le ordenamos a la IA no solo que lea el texto, sino que comprenda el contexto comercial: deduce cuáles son las descripciones de los productos, separa los códigos SKU, elimina los símbolos de moneda y unifica los decimales, devolviendo una matriz JSON perfecta lista para inyectarse en la base de datos.