有奖调研 | 人脸辨认功能在互联网行业认知度情况
Google 研究团队开源在 Tensorflow 中进行语义图像瓜分(Semantic Image Segmentation)模型 DeepLab-v3+,包含 Google Pixel 2 和 Pixel 2XL 手机上的人像模式(Portrait Mode),以及 YouTube 为影片及时改换背景功能,都是这项技巧的应用。
Google 研究软件工程师 Liang-Chieh Chen 以及 Yukun Zhu 表示,语义图像瓜分的重要目标是为每个像素指定语义标签,例如路、天空、人或是狗等物体,不少的法度榜样须要如许的功能,像是合成浅景深效不雅(Synthetic Shallow Depth-of-field)效不雅,应用在手机 Pixel 2 和 Pixel 2XL 上供给的人像模式(Portrait Mode),能主动模糊人物的背景,作出类似单镜头反光相机的景深效不雅。
别的,在多半摄影 App 都邑供给的及时影像瓜分(Video Segmentation),例如比来 YouTube 揭橥的新功能,为影片换背景的功能,也是语义影像瓜分的应用。
DeepLab-v3+ 在 Tensorflow 长进行,应用安排于办事器端的卷积神经收集(CNN)骨干架构,以获取最佳的结不雅。除了代码之外,研究团队也同时公开了 Tensorflow 模型练习以及评估法度榜样,以及应用 Pascal VOC 2012 与 Cityscapes 材料集练习的模型。
DeepLab-v3+ 技巧是基于三年前的 DeepLab 模型,时代改进了卷积神经收集特点萃取器、物体比例塑造模型以及同化前后内容的技巧,再加上进步的模型练习过程,还有软硬件的进级,大年夜 DeepLab-v2 到 DeepLab-v3,直到如今揭橥的 DeepLab-v3+,效不雅一代比一代好。
DeepLab-v3+ 是由 DeepLab-v3 扩充而来,研究团队增长懂得码器模组,可以或许细化瓜分结不雅,可以或许更精准的处理物体的边沿,并进一步精深度卷积神经收集应用在空间金字塔池化(Spatial Pyramid Pooling,SPP)和解码器上,大年夜幅晋升处理物体大年夜小以及不合长宽比例的才能,最后获得强而有力的语义瓜分编码解码器收集。
Liang-Chieh Chen 以及 Yukun Zhu 特别提到,跟着软硬件的进级,建构在卷积神经网路上的现代语义图像瓜分功能,可以达到的水准已经远远跨越5年前。
【编辑推荐】
- 外媒速递:三款开源解决筹划助您轻松实现应用集成
- 继 Android P 首个预览版宣布后,谷歌又做了一些改进
- GitLab 查询拜访申报显示:2018 将是 DevOps 和开源年
- Facebook 开源的对象将 Ubuntu 安装速度进步了 10%
- 重磅消息:微软 Service Fabric 正式开源
推荐阅读
有奖调研 | 人脸辨认功能在互联网行业认知度情况第二次API经济:区块链或成下一主因 区块链现如今被很多行业誉为概绫屈性技巧,但其最有价值的功能之一是作为公平化的开辟对象。因为其分散>>>详细阅读
本文标题:谷歌最新语义图像分割模型 DeepLab-v3+ 现已开源
地址:http://www.17bianji.com/lsqh/40757.html
1/2 1