自然语言处理

中文分词

将中文语句划分为词

多语料综合F1=96%

中文命名实体识别

识别语句中的命名实体,如人名、机构名、地理位置等

多语料综合F1=88.3%

中文字形嵌入

对每一个中文汉字,根据其字形,为其生成字形相关向量

该字形嵌入可作为其他NLP任务的输入,在自有的命名实体识别模型中,提升F1达2%+

中文文本分类

对输入的文字段落进行分类

在81万新闻数据集上F1达97.2%,在1.7万情感分类数据集上F1达90.4%

中文人机对话

根据特定领域的要求,实现人机对话,完成特定领域的任务

在智能门禁系统中,意图识别率达95%,文本匹配准确率达98%

英文阅读理解

理解输入的文章与问题,并进行回答

2019年1月份RACE榜单刷榜为第一,其中初中题目准确率77.9,高中题目准确率69.8,高中成绩为榜单上首次超过人类成绩,综合成绩72.1.