36氪首发 | 为人工智能领域客户提供数据服务,爱数智慧想要成为行业的送水人

石亚琼36氪@123·2017-08-03 16:56
送水的生意

 专家预测,2018年,62%的大企业将会使用人工智能技术。Tractica预测,2024年人工智能市场规模将增长至111亿美元。但AI要在真正发挥作用,优质的数据必不可少,且重要性还会不断提升。

目前在诸多领域市场上已有相应的数据库,这些数据主要源于大公司或者相关学生研究机构,比如谷歌去年发布了一个来自7百万个YouTube视频的大型数据集,Salesforce也发布了一个来自Wikipedia的数据集用于让机器学习模型学习人类语言。但这些公开的数据往往不是高价值的关键数据,又面向所有人开放,对于企业提升竞争力来说,意义不大。在可以预见的周期内,那些会影响自家产品保持市场地位的关键数据,很难被公开。所以,对于AI企业乃至整个与AI行业而言,获取有价值的一手数据就是关键。这些“有价值”的数据往往很难依靠市场上的“公开数据”获取,因而也给做数据服务的公司提供了新的市场机遇。

我们近期接触的爱数智慧就是一家人工智能大数据资源服务企业,致力于为人工智能领域的客户提供全方位的数据采集、制作、设计、计算等服务,希望成为人工智能行业的送水人。

做数据采集、制作、设计、计算等服务的公司市面上已经有不少,爱数智慧主打的卖点之一就是专业性。不同于市面上已有的多数数据服务商,爱数智慧创始团队多是多年算法背景出身,也曾做了多年算法方面的研究。在为Baidu、腾讯、阿里、360、UCweb、蚂蚁金服等各大互联网公司搭建语音识别的baseline声学建模系统过程中,不断意识到优质的数据对于结果提升的重要性。这使得团队在对接客户的过程中,可以清晰理解客户的诉求,也能为没有算法经验的团队提供有价值的建议。 

如今,爱数智慧主要服务于三大领域:语音数据、文本数据和图像数据。语音数据领域的服务主要为语音标注和各类采集等。文本数据领域的服务包括内容爬取、清洗、主要句法标注、事件标注和实体标注等图像数据领域主要针对在人脸特征标注方向。基于团队较强的语音行业的背景,目前语音产品是爱数智慧目前最核心、最成熟、最具竞争力的产品。

现阶段,爱数智慧在数据服务方面主要以定制为主,根据定制内容不同,客单价从数万到数百万不等。销售策略方面,爱数智慧希望主打高性价比。目前已经与腾讯、Nuance、思必驰、美的等建立了战略合作关系。

对于AI公司来说,往往不仅对数据量有高要求,对获取数据的周期也有比较高的期待。为了更好的解决这一客户痛点,爱数智慧也会基于对行业的理解,提前布局储备行业可能所需要的数据库。目前,在一些热点领域已有积累,包含家居命令控制语音数据库、中文电话自然对话语料库、中国成人英语语料库、中国儿童英语语料库、人脸识别、等数据库,未来会以标准化产品的形式提供给客户。

为人工智能行业提供专业的数据支持,必然对团队的专业性有高要求。创始人张晴晴是中科院声学所语言信号处理博士,法国国家实验室LIMSI-CNRS博士后,中国科学院声学研究所任副教授,代表性工作包括:中英文混合双语声学建模、基于基频类置信度的语音合成、中文声学模型优化。同时在民用技术方面领域的研究成果,包括:自动客服系统声学建模/语言建模、语言模型快速领域自适应、双语混合语音识别中的声学建模、中式口音英文语音识别中的声学建模。近几年承办国际级省市级专业项目,成功申请国家自然科学基金“‘语音地图’构建的理论与技术研究”和市财政科技经费项目“面向北京地区多样化语言的语音关键词检索技术”并取得了成果。

团队的核心成员包括汪洋(运营总监)、罗磊(语音技术主管)和王晓飞(技术专家)。运营总监汪洋曾任时光网电商运营总监 、亚马逊中国高级运营经理、沃尔玛中国高级采购经理、曾负责亚马逊、天猫、京东等线上,沃尔玛线下渠道销售及市场推广等运营工作,具有13年以上世界500强外资企业工作和管理经验。语音技术主管罗磊获得了北京科技大学应用数学硕士学位,是运筹学、随机过程、排队论专家,曾为微软CORTANA训练优化模型多年,在多语言语音声学建模方面有近十年的工作经验。技术专家王晓飞系中国科学院声学研究所博士、混响环境下的语音增强专家、约翰•霍普金斯大学博士后研究员、复杂环境下的远讲语音识别研究专家 ,擅长基于传声器阵列的语音增强方法研究和基于深度自编码器和非负稀疏编码等深度学习方法的源分离研究。

爱数智慧还组建了一支高水平专家级团队。目前智能语音核心团队有11人,从事智能语言相关工作;图像团队1人,主要从事人脸识别、行人检测等方面的研究。技术团队有语音识别、NLP 专家2人。项目实施团队有资深数据项目负责人7人。市场合作团队有资深市场与营销负责人2人。

爱数智慧成立于2016年, 2017年初,获得明势资本Pre-A轮融资,预计今年订单数量将达到千万元以上。 

目前,出于对人工智能行业的乐观预期,国内也出现了诸多为行业提供“卖水”生意的公司,数据服务就是其中之一,不仅公司不断涌现,也开始受到资本关注。比如,泛涵科技已完成融资;BasicFinder已于今年3月完成一千多万元pre-A轮融资;数据堂已经成功挂板新三板,2016年年收入达到9680万元,毛利率达到39.68% 。

 

+1
1

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

24小时保过,节省50%-70%的备考时间。

2017-08-03

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业