拯救躺枪的人体艺术,用AI鉴黄的图普科技如何区分色情与艺术?

2020-05-07
[ 导读 ] 艺术和色情,有时候很难划定一个明确з的界限,而利用视觉识别做鉴黄的图普如┙何区分呢?2017年2月2۩๑1日,造访图普科技广州总部,聊了聊AI鉴黄中棘手的问题。 〓 ∑

图片来自“123rf.com.cn”

鉴黄是一件很有意思的事情,有人说这是反人™性的生意,表示不看好,但随着直播的火热,鉴黄这个买卖也跟着水涨船高。此外,色情跟人体艺术也难以区分,这种人都难以界定的事情,人工〒智能怎么处理呢?2017年2月21日,造ж访图普科技广州总部,同市场总♀监→李麟聊了聊这个棘手的问题。

:公司的客户有哪些类型?

李麟:除了像映客、花椒等直播平台之外,还有各类UGC(用户生产内容)的平台,以及资源共享下载平台如迅雷,生活服务应用如58同城和各种支持图片、视频的社交应用等。

:图普同直播软件客户是如∮何合作的?

李麟:其实视频可以看成是由一帧一帧的╭╮图像集合而成的,现在利用人#工智能鉴黄ё-对图像进行处理。鉴于客户成本和效率多方面的考虑,我们一般建议客户采取抽帧的方式,由客户将视频间隔相等时长截取成图片(截取间隔由客户决定),再▇█将图片传递给图普♡,通过调用我们的API完成识别过程,系统会给出一个测评结果。┘

图片会被分类成正常、性感、色情三&类,然后同时还会给出概率分数,以及是●否需要复审,比如图片被判为色情,概率0.99,不需要复审,那就代表系统觉得这个图●·片99%可能是色情,属于确定区间;如果被判为色情,概率0.3,需要复审,那就代表系统☺☻觉得这个图片30―%可能是色情图片,处于系统不确定的区间,建议人工复审。完成识别后,我们会将结果传递回直播客户,由对方完成审核,我们不参与审核的过程。

:人都很难区分人体艺术和色情,图普是怎么处理这┒种问题?

李麟:我们的系统是结合深度学习经过了大量数据训练的,所以某些艺术作品存在裸露私密部位有可能被判成色情。我们的建议是:如►果出现界定模糊的情况,可以进行二次人工判定,这个是由客户根据它的标准审核。

另外一种方法是跟我┝们技术部门沟通,深度定制一套系统,划分好艺术和色情的分界线。但是我们现在还没有遇到这种情况,如果只是偶尔出现这种情况,使用人工判定可能是性价比更高的选择。

这π其实也说明人工智能现在还不能完全替代人,有些地方还是需要∥人来判断,但是人工智能的确替代了之前人工审核95%的工作。此外,随着数据训练量的增加,我们的系统也会更准确,比如某个女主播不穿裤子,用一条领带遮住ф了私密部位,这其实属于色情,但是按照原始数据库检测就不容易鉴别出来,所以‰图普通过几家大的直播客户提供的数据,对此类打擦边球的色情行为进行了针对训练,也增加了对≈色α情的识别率。

:是否担心竞争对手的恶意竞争,比如用更低的价格抢客户?

李麟:之前的确有这个担忧,对手可能识别率不高,▲但是用更低的价格去竞争。但是我们到目前还没有这方面的流失,我认为这是因为两点:第一、安全性其实比价格重要,我们同客户之间比较了解,通过持续的模型优化,对他们的识别准确率也相对更高。第二、企业用户的切换成本很高,因๑为API对接、流程调整需要花一些人力物力,也都是成本。

现在图普是按25¤元/万次调用的标准价格收费。客户选择提供图片的▒数量是根据他们自身的风险评估确定的,不同产品提供的图片数量及截图频次会有不同。

:各家宣传的99.X|︴()〔〕%的准确率有意义吗?

李麟:真正让客户满意的方法就是拿去让客户测,B端的客户这一点更简单,效果满意了,他们才会用。

:图像识别在未г来的想象空间有哪些?

李麟:外界对我们最熟悉的认*知就是利用AI做鉴黄,其实我们也在做暴恐和时政敏感、垃圾广告等内容鉴别,这些可能是更加刚需▉的应用。而暴恐和时政敏感的原始数据比鉴黄要更难取得,一般由相关管理部门掌握,已经接入图普鉴黄的诸多企业和部门同】时卌也会把相关暴恐、时政等识别要求和数据样本给到我们,所以图普利用先发优▕势就容易取得这♂方面资源和更加深入的合作,ō而一些后入场的团队可能在数据获取和合作切入方面就比较℃难。

在具体技术上,基于人脸识别、自然场景识别等技术发展的图像增值和内◇容推荐产品是我们已经在做的,跟美拍、美图秀秀合作的就是这方面技术,而未来我们还可以做应用在更多场景中的图片分类、检测、匹配等等。

李总(图普科技CEO李明强)之前说,一些现在收费的企业服务未来可能会免费,图像识别技术将扩展到更多领域,▁▂▃▄那个时候可想象的空间就更大了,这也是整个行业都在摸索的,但是现在大家还都不知道具体的盈利点。就像百度之前做B端搜索,后来做C端发现也行得通,有新的盈利模式,所以现在大家都在一个数据积累的过程中,共同探索图像识别的未来。