Skip to content

GOOGLE TRANSFORMA FOTOS PIXELADAS EN IMÁGENES DE ALTA RESOLUCIÓN

Basándose en un fotografía modelo inicial las inteligencias artificiales actuales pueden generar una imagen similar, colorear o escalar a mayor resolución. Esto último es algo que la IA de Google hace muy bien, tanto que convierte fotografías totalmente pixeladas en fotografías de alta resolución.

Una investigación reciente del departamento de inteligencia artificial de Google muestra cómo los nuevos avances en este aspecto permiten crear increíbles imágenes. El modelo de aprendizaje automático de la compañía es capaz de tomar una foto sin apenas resolución y escalarla para conseguir detalles únicos.

Alternativamente, los modelos de difusión , propuestos originalmente en 2015, han experimentado un reciente resurgimiento en el interés debido a su estabilidad de entrenamiento y sus prometedores resultados de calidad de muestra en la generación de imágenes audio . 

SR3: imagen de
superresolución SR3 es un modelo de difusión de superresolución que toma como entrada una imagen de baja resolución y crea una imagen de alta resolución correspondiente a partir de ruido puro. El modelo se entrena en un proceso de corrupción de imagen en el que el ruido se agrega progresivamente a una imagen de alta resolución hasta que solo queda ruido puro. Luego aprende a revertir este proceso, comenzando con ruido puro y eliminando progresivamente el ruido para alcanzar una distribución objetivo a través de la guía de la imagen de entrada de baja resolución.

Con entrenamiento a gran escala, SR3 logra sólidos resultados de referencia en la tarea de superresolución para imágenes faciales y naturales al escalar a resoluciones 4x-8x de la imagen de entrada de baja resolución. Estos modelos de superresolución se pueden conectar en cascada para aumentar el factor de escala de superresolución efectivo, por ejemplo, apilando un modelo de superresolución de caras de 64×64 → 256×256 y 256×256 → 1024×1024 juntos para realizar una tarea de superresolución de 64×64 → 1024×1024 .