适用于人工智能的AI助理的谷歌开源数据集

Google今天开源的Coached Conversational Preference Elicitation(CCPE)和Taskmaster-1,是两个人之间对话的数据集。Google AI研究人员共享这两个数据集,以提供模拟实现人类绩效的自然语言系统所需的培训材料。

谷歌研究人员称CCPE是一种收集语音数据的新方法。它包括500个与人们谈论他们的电影偏好的对话 - 总共10,000个,超过12,000个话语。

由于元数据的价值,例如演员和导演的名字,电影首选项被选为主题。

“我们不会将工人限制在详细的脚本或小知识库中,因此我们观察到,与现有数据集相比,我们的数据集包含更现实和多样化的对话,”一篇发表在CCPE上的文章读到。

Taskmaster-1数据集由超过13,200个对话样本组成。它和CCPE都是使用绿野仙踪方法制作的,其中一个人扮演代理人的角色,临时工人网站的工作人员描绘了一个普通的数字助理用户。

Taskmaster-1包含六个类别的对话:订购披萨,创建汽车维修预约,设置乘车服务,订购电影票,订购咖啡饮料和预订餐厅。

在最近谷歌的其他人工智能新闻中,谷歌的项目Euphonia引入了会话式人工智能,可以提高人们对口音和ALS声音的认识,谷歌DeepMind研究人员与其他AI社区利益相关者合作,为更强大的会话AI引入SuperGLUE基准。