【基本情况】
新疆民族语音语言信息处理实验室,属于自治区重点实验室,由中科院新疆理化技术研究所、中科院声学研究所、中科院信息工程研究所相关学科方向和团队共同组建。
为了在海量文本数据中提取有效信息,更好地开展文本信息处理,开发了可识别汉、英、维、哈、俄等200多种语言的语种识别系统;整理建设了多语言资源库,开发了词语形态切分、形态还原、词性标注及词对齐等系列工具软件,为开展维吾尔语自然语言处理奠定了坚实基础和技术支撑;针对敏感关键词的监管和舆情监测,开发了维吾尔语、哈萨克语关键词生成软件、维吾尔语文本自动摘要系统、维吾尔语新闻话题检测系统;面向形态丰富语言的实时检索,构建了维吾尔语词级和词根级关键词检索系统、哈萨克语词级和词根级关键词检索系统。
【基地照片】