随着内容审核的要求越来越严,图片鉴黄几乎是所有做UGC内容应用的标配了。最近在阿里云上搭建了图片鉴黄的应用,发现如果结合阿里云的鉴黄接口和自建人工智能鉴黄系统,可以节省至少85%的费用。
1. 直接使用阿里云的图片鉴黄接口
阿里云的图片鉴黄服务基于深度学习技术神经网络算法,经笔者实测准确率比较高,对图片数量不太高的场景,可以直接使用。如果你的服务和数据都是部署在阿里云上的话,那么所有的数据通讯都是走内网,几乎免费。如果用其他第三方服务,还要通过公网进行图片传输,耗费带宽。
点击免费开通阿里云的内容安全功能,开通后即可调用阿里云的图片鉴黄,图片涉政恐暴识别,图片不良场景识别等多种图片鉴别服务。从初次调用某一功能开始的一个月内,该功能都有一定的免费检测次数,一般是每天3000张图片,足够做测试开发用。
阿里云的鉴黄服务包括内容检测API,站点检测,和OSS违规检测三种模式。我推荐使用内容检测API,可以有更好的控制。当然如果应用场景简单,可以直接用站点检测,和OSS违规检测。
内容检测API有同步检测和异步检测两种方式。一般情况下用同步检测方式即可,开发部署都比较简单。阿里云API接口的响应时间也比较快, 大约在1秒左右,个别情况下会到5秒,但配上足够的用户交互,通常可以满足需求。具体开发文档参见鉴黄同步检测API。
检测接口一般返回三种可能结果,如果是pass,则不是黄图;如果是block,根据阿里的准确率,可以直接判定为黄图;如果是review, 阿里的建议是人工审核。我实际运行下来发现,阿里的系统主要是对动漫内容的准确率不确定。所以如果你的场景都是实景图,同时又不想做人工审核的系统,也可以直接认为是黄图。但如果你有大量二次元内容,则肯定要人工审核了。
【省钱秘笈来了!】开发完成后,则要选择付费方式。购买内容安全流量包比较划算。阿里云,永远是流量包划算!流量包划算!流量包划算!
点击打开流量包购买传送门,点击”立即购买“按钮,进入内容安全流量包购买页面。
然后点击“按量加油包”,我一般选择300万次,性价比比较高。
2. 搭建自己的人工智能鉴黄系统
如果自己的图片处理量比较大,或者短时间内需要处理一大批图片,那么使用阿里云的鉴黄服务会不太划算。比如说我们需要一次性处理300万张图片,按量加油包需要4590万元。但自己搭建一套准确率稍低的鉴黄系统,先过滤掉90%以上肯定不是黄图的内容,再把剩下的10%传给阿里云的鉴黄接口,就只需要10%的鉴黄费用+1台ECS的钱。一般2核4G的ECS足够运行一个初级鉴黄系统,每个月也就不到200块。所以整体费用就降到了700元,可以省85%的费用。
先购买一台2核4G的ECS,阿里云的ECS云服务3折起活动,只需要1404元/年,每个月不到120元。
然后搭建自己的人工智能鉴黄系统。初级的人工智能鉴黄系统用二分类网络判断就可以,训练数据包括正例负例两个集合。其中正例需要自己收集,最好1万张图片以上。负例则收集各种各样的正常图片,数量与正例一致即可。
为了方便试验,我们可以拿github上的Open nsfw model项目作测试。这个项目的Yahoo开源的不适合工作场景(Not Suitable for Work)图片识别项目。 项目链接里有已经训练好的模型。也可以通过增加自己的训练集进行调优。
我试验的Open nsfw系统(预先训练的模型)判断为黄图或不确定的比例在10%左右,比较粗糙。但拿这个结果作为调用阿里云鉴黄接口的前置,可以节省85%的费用。
而实际应用中,我增加了数据集并调优后,判断为黄图或不确定的比例在5%左右,实际节省了超过90%的费用。
更多省钱秘笈,请看:
转载于:https://www.cnblogs.com/yunmanong/p/11009654.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/38003.html