U-Net是弗赖堡大学计算机科学系为生物医学图像分割开发的卷积神经网络。[1]其基于完全卷积网络[2],并在结构上加以修改与扩展,使得它可以用更少的训练图像产生更精确的分割。在现代GPU上,分割一张512×512的图像需要的时间不到一秒。
U-Net架构已经在扩散模型中采用,用于迭代式图像去噪音[3]。这种技术位于很多现代图像生成模型的底层,比如DALL-E、Midjourney和Stable Diffusion。
- ^ Ronneberger O, Fischer P, Brox T. U-Net: Convolutional Networks for Biomedical Image Segmentation. 2015. arXiv:1505.04597 [cs.CV].
- ^ Shelhamer E, Long J, Darrell T. Fully Convolutional Networks for Semantic Segmentation. IEEE Transactions on Pattern Analysis and Machine Intelligence. 2017-04, 39 (4): 640–651. PMID 27244717. S2CID 1629541. arXiv:1411.4038 . doi:10.1109/TPAMI.2016.2572683.
- ^ Ho, Jonathan. Denoising Diffusion Probabilistic Models. 2020. arXiv:2006.11239 .