新乡科技服务中心欢迎您!
首页 / 全部分类 /  / 
民汉跨语言网络社会舆情综合分析监测平台
  • 项目概况

  • 系统名称:《民汉跨语言网络社会舆情综合分析监测平台》 简介: 21 世纪是信息化时代,网络环境下的信息安全体系是国家安全的 重要保障。据 2018 年底最新统计,目前中国网络资源包含 13 种少 数民族文字,共 598 个网站,其中 371 个注册备案。然而目前国家 网信办、人民网等监管网站仅限于汉文,并未涉及少数民族文字网 站内容,境内外民族宗教分裂分子可能利用此监管空白进行渗透宣 传,这对国家信息安全、意识形态安全都存在重大隐患。 为此, 中央民族大学国家语言资源监测与研究少数民族语言中心以国家 自然科学基金重点课题“跨语言社会舆情分析基础理论与关键技术 研究“为基础构建了本系统。 本平台通过实时动态监测蒙、藏、 维、汉、英 5 种文字的网络资源(BBS、新闻、微博、博客等), 建立涵盖宗教、人口、经济、科教等主要领域的社会舆情动态流通 语料库;应用跨语言社会舆情监测指标体系和本项目研发的关键技术和处理工具,搭建了统一的跨语言舆情分析集成管理平台,实现 少数民族语言(蒙藏维汉)网络资源的群体行为分析及综合舆情监 测。本系统可以服务于国家信息安全领域,可以针对少数民族语言 的网络及博客内容进行实时文本分析、监管和信息检索,发现重大 隐患,跟踪热点和所关注的焦点人物、事件等,提供观点的倾向性 分析和数据报告,支持跨语言检索和机器翻译结果输出,服务国家 重大决策。 同时,基于该综合舆情分析平台,遵照舆情监测指标 体系与汉语、英语等相兼容原则,开发了系列可单独应用的工具, 部分工具已单独投入使用,具体包括:  网站实时追踪与信息 自动采集系统;  网站内容实时爬取、预处理系统;  Unicode 编码自动批处理转换软件;  词法分析与词性自动标注系统;  词法分析人工辅助标注工具软件;  领域自动分类与话题聚 类系统;  命名实体与实体关系自动识别系统;  网页内容 词法自动纠错系统;  网站热点发现与追踪系统;  跨语言 网络舆情专题数据分析与报告生成系统;  蒙、藏、维分词及 词性标注软件;  Rocchio 中文文本分类软件;  藏汉相同 主题文本聚类软件;  中文文本语义分类软件等。
  • 团队介绍

  • 服务成果

咨询
.
建议