百度DuerOS硅谷公布「普罗米修斯」计划,要在2018年内开放三个超大数据集

大琳·2017-11-10 13:40
普罗米修斯计划启动后,DuerOS计划在2018年内面向社会依次发布远场唤醒、远场识别、多轮对话三个超大规模数据集。

36氪获悉,美国西部时间11月9日,百度DuerOS在硅谷GSV labs正式宣布启动普罗米修斯计划。

百度度秘事业部首席技术官朱凯华

普罗米修斯是希腊神话人物,因为不顾主神宙斯的反对私自把火种带给人类,而被主神宙斯缚在高加索山的山顶上。人类常纪念普罗米修斯薪火相传的精神。这次百度DuerOS在硅谷推出名为『普罗米修斯』的计划,剑指何方?

据百度DuerOS官网显示,普罗米修斯计划是百度度秘事业部,联合百度语音技术部、百度校园品牌部、百度云、平台测试部等部门联合发起的,以推动对话式AI领域科技及产业发展,培养人才为目标打造的大型计划,由开放数据集、学科共建等项目组成。 

该计划还将设置100万美金基金,鼓励和扶持对话式AI的优秀项目和人才。 

DuerOS是百度度秘推出的一款对话式人工智能系统,在7月5日百度AI开发者大会上,百度度秘事业部总经理景鲲表示要通过DuerOS平台“唤醒万物”,并且在这半年加速扩张自己的朋友圈,联想、海尔、美的、HTC、TCL,都是其合作伙伴,DuerOS的对话能力应用范围有所扩大,手机、电视、音箱等智能家居、智能穿戴和车载场景都有覆盖。景鲲也在外界频繁露脸,力图扩大DuerOS影响力。

从本次硅谷启动普罗米修斯计划的现场来看,百度度秘事业部首席技术官朱凯华、百度主任架构师陈果果都现身并发表了演讲。其中陈果果是百度AI开发者大会上宣布收购的那家语音唤醒公司KITT.AI的联合创始人。

百度主任架构师陈果果

据透露,普罗米修斯计划启动后,DuerOS计划在2018年内面向社会依次发布远场唤醒、远场识别、多轮对话三个超大规模数据集,供全球AI人才进行算法设计和模型训练。 

设备语音唤醒方面,DuerOS将发布数十万条唤醒词录音数据,以及数百小时的误唤醒录音数据;语音识别方面,DuerOS将发布数千小时中文语音识别数据;多轮对话方面,DuerOS将发布万段对话数据,涵盖十余种主题。 

陈果果表示,“在AI时代,数据如同石油一样珍贵”。的确,真实世界中,大数据都集中在巨头手中,创业公司和个人能拿到的数据集非常少,严重影响研发。开放数据集,可以使得这些企业受益。但是开放到什么程度,究竟是哪些数据会开放出来,还是要打一个问号。 

36氪联系到百度度秘事业部总经理景鲲,他表示,“我们会在百度世界大会的时候对中国市场正式发布普罗米修斯计划。”

+1
5

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000
36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业