U-Net

U-Net es una red neuronal convolucional desarrollada para la segmentación de imágenes biomédicas en el Departamento de Informática de la Universidad de Friburgo.[1]​ La red se basa en una red neuronal totalmente convolucional[2]​ cuya arquitectura se modificó y amplió para trabajar con menos imágenes de entrenamiento y producir una segmentación más precisa. La segmentación de una imagen de 512 × 512 tarda menos de un segundo en una GPU moderna.

La arquitectura U-Net también se ha empleado en modelos de difusión para la eliminación iterativa de ruido en imágenes.[3]​ Esta tecnología es la base de muchos modelos modernos de generación de imágenes, como DALL-E, Midjourney y Stable Diffusion.

  1. Ronneberger O, Fischer P, Brox T (2015). "U-Net: Convolutional Networks for Biomedical Image Segmentation". 
  2. Shelhamer E, Long J, Darrell T (2014). «"Fully Convolutional Networks for Semantic Segmentation".». IEEE Transactions on Pattern Analysis and Machine Intelligence. PMID 27244717. doi:10.1109/TPAMI.2016.2572683. 
  3. Ho, Jonathan (2020). Denoising Diffusion Probabilistic Models. 

U-Net

Dodaje.pl - Ogłoszenia lokalne