基于图片理解和图片问答实现情报分析，「睿视智觉」能否在计算机视觉领域走出差异化？

荔枝·2017-08-11 16:51

图像理解

计算机视觉作为一种人工智能的基础技术应用，其使用场景也较为多样。目前国内从事计算机视觉领域的公司多集中在人脸识别和视频监控方向，并应用于安防、金融、无人驾驶等领域，典型的如商汤科技、旷视科技、依图科技、格林深瞳等。而今天要聊的公司则是一家侧重于图片理解和图片问答的公司。

睿视智觉，成立于2015年，是一家利用图片信息处理算法及FPGA加速技术，提供行业图像信息应用的人工智能公司。目前，作为国内第一个提供Amazon EC2 F1项目深度学习算法及加速服务的技术合作伙伴，已经开始基于AWS平台上服务于家电、珠宝、金融等高价值的行业龙头企业。

事实上，在创始人龚纯斌看来，目前人工智能的行业落地主要受两方面影响，一方面是产品功能是否能切实满足客户需求，另一方面是技术层面是否能够完全支撑产品。而在这两点上，睿视智觉通过对异构数据的理解，目前主要应用于信息情报领域，比如微信、微博领域违规信息的发布等。

据了解，目前睿视智觉现阶段的技术方向主要分为两大快：其一，是基于图片理解及自然语言问答算法及基于深度学习加速算法，提供算法以及加速系统服务；其二，是基于OpneCV类算法提供工业机器视觉系统及设备、工业物联信息可视化服务。产品服务形态来包含图像理解、图片问答、人脸识别、OCR技术、FPGA加速、工业属性检测、工业定位对位、工业尺寸测量。

简单来讲，要想真正实现图片理解和图片问答，首先需要通过计算机视觉技术对图片进行标签化处理，包括图片分类、目标检测、图像分割、目标计数、色彩分析等功能实现，然后在第一层面产生核心的标签，再结合行业知识库融合，通过自然语言处理技术生成语言，进而基于概率返回多个结果，最终实现从视觉到语言的理解（V2L），从而真正能够满足行业需求。

视觉算法剖析

据悉，目前在算法服务方面，其包含了图片审核及二分类、图片增值及客户标签、目标信息捕捉以及图片问答，其中目前二分类的精度达99%以上，跟人相关可达90%以上，物体相关则相对低些；在加速系统方面，基于亚马逊平台，可以在云端为用户提供AIP接口或SDK服务；同时，目前在通过Intel合作FPGA的深度学习运算POC样板开发，用于实现提升本地的计算效率。

而关于工业视觉系统，龚纯斌则表示，相较于传统人工的工作方式，睿视智觉在“定位对位、缺陷识别、尺寸检测”方面已经积累的较多的项目经验，其简单快速稳定的特性能够帮助企业提升相应的工作效率并降低成本。但鉴于工业领域的特殊性，其在算法架构上跟深度学习存在一定的差异，目前还很难做到通用，但未来公司将会逐渐实现在设备、算法层面的标准化。

至于如何推向市场，龚纯斌则表示，目前公司主要服务于对异构数据处理成结构化数据有较大需求的政府领域及大型企业用户。一方面基于算法及加速系统，通过提供图片数据增值、算法及加速云服务，可以用于情报分析、精准营销、公共安全等领域，这里面的客户包含有图片信息处理需求的政府、媒体、有图片数据计算需求的互联网公司、有图像理解需求的机器人公司等。另一方面，针对工业领域，目前主要通过渠道合作方式服务于电子消费领域行业标杆客户，现已实现百万级的营收。

而论及市场竞争，相较于目前众多从安防、金融、无人驾驶领域切入的计算机视觉类公司，睿视智觉首先在市场定位上走了一条差异化的道路，即在行业落地中选择了基于图像理解和图片问答的情报分析领域；与此同时，目前公司在图片自然语言描述领域、图片问答领域的技术突破和积累也更适用于信息情报领域。

团队方面，目前整体规模超30人。创始人龚纯斌，曾在联想集团MBG研发部门从事技术项目管理工作，期间完成16个ODM项目和3个自研项目开发管理，并且在13年参与武汉平台建设，14年搭建项目交付团队，具有丰富的技术及项目管理经验；CTO吴琦，英国巴斯大学博士，主要研究计算机视觉、机器学习以及神经网络与深度学习方向，在2015年微软COCO图片自动标题比赛中曾获第一名；联合创始人肖潇，德国纽伦堡-爱尔兰根大学通信信息专业博士，曾在德国贝尔实验室从事基于下一代光通信系统核心数字信号处理芯片的研究与开发工作，拥有多项发明专利。

据悉，睿视智觉已于今年上半年获得火炬高新科创300万的天使轮投资。目前Pre-A轮融资已基本敲定，预计年底会开启下一轮融资。

本文由「荔枝」原创出品，转载或内容合作请点击转载说明；违规转载必究。

寻求报道

基于图片理解和图片问答实现情报分析，「睿视智觉」能否在计算机视觉领域走出差异化？

最近内容

下一篇