作家
登录

谷歌最新语义图像分割模型 DeepLab-v3+ 现已开源

作者: 来源: 2018-03-16 09:53:20 阅读 我要评论

有奖调研 | 人脸辨认功能在互联网行业认知度情况


Google 研究团队开源在 Tensorflow 中进行语义图像瓜分(Semantic Image Segmentation)模型 DeepLab-v3+,包含 Google Pixel 2 和 Pixel 2XL 手机上的人像模式(Portrait Mode),以及 YouTube 为影片及时改换背景功能,都是这项技巧的应用。

Google 研究软件工程师 Liang-Chieh Chen 以及 Yukun Zhu 表示,语义图像瓜分的重要目标是为每个像素指定语义标签,例如路、天空、人或是狗等物体,不少的法度榜样须要如许的功能,像是合成浅景深效不雅(Synthetic Shallow Depth-of-field)效不雅,应用在手机 Pixel 2 和 Pixel 2XL 上供给的人像模式(Portrait Mode),能主动模糊人物的背景,作出类似单镜头反光相机的景深效不雅。

别的,在多半摄影 App 都邑供给的及时影像瓜分(Video Segmentation),例如比来 YouTube 揭橥的新功能,为影片换背景的功能,也是语义影像瓜分的应用。

DeepLab-v3+ 在 Tensorflow 长进行,应用安排于办事器端的卷积神经收集(CNN)骨干架构,以获取最佳的结不雅。除了代码之外,研究团队也同时公开了 Tensorflow 模型练习以及评估法度榜样,以及应用 Pascal VOC 2012 与 Cityscapes 材料集练习的模型。

DeepLab-v3+ 技巧是基于三年前的 DeepLab 模型,时代改进了卷积神经收集特点萃取器、物体比例塑造模型以及同化前后内容的技巧,再加上进步的模型练习过程,还有软硬件的进级,大年夜 DeepLab-v2 到 DeepLab-v3,直到如今揭橥的 DeepLab-v3+,效不雅一代比一代好。

DeepLab-v3+ 是由 DeepLab-v3 扩充而来,研究团队增长懂得码器模组,可以或许细化瓜分结不雅,可以或许更精准的处理物体的边沿,并进一步精深度卷积神经收集应用在空间金字塔池化(Spatial Pyramid Pooling,SPP)和解码器上,大年夜幅晋升处理物体大年夜小以及不合长宽比例的才能,最后获得强而有力的语义瓜分编码解码器收集。

Liang-Chieh Chen 以及 Yukun Zhu 特别提到,跟着软硬件的进级,建构在卷积神经网路上的现代语义图像瓜分功能,可以达到的水准已经远远跨越5年前。

【编辑推荐】

  1. 外媒速递:三款开源解决筹划助您轻松实现应用集成
  2. 继 Android P 首个预览版宣布后,谷歌又做了一些改进
  3. GitLab 查询拜访申报显示:2018 将是 DevOps 和开源年
  4. Facebook 开源的对象将 Ubuntu 安装速度进步了 10%
  5. 重磅消息:微软 Service Fabric 正式开源
【义务编辑:张燕妮 TEL:(010)68476606】

  推荐阅读

  区块链技术有可能催生第二次API经济浪潮

有奖调研 | 人脸辨认功能在互联网行业认知度情况第二次API经济:区块链或成下一主因 区块链现如今被很多行业誉为概绫屈性技巧,但其最有价值的功能之一是作为公平化的开辟对象。因为其分散>>>详细阅读


本文标题:谷歌最新语义图像分割模型 DeepLab-v3+ 现已开源

地址:http://www.17bianji.com/lsqh/40757.html

关键词: 探索发现

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
自媒体专栏

评论

热度

精彩导读
栏目ID=71的表不存在(操作类型=0)