将富文本的非结构化数据转化为结构化数据的平台
项目概况
- 团队数十年一直从事富文本(PDF、WORD、网页、扫描件等)的语 义理解的基础算法模型研究,在数据挖掘、自然语言理解、人工智 能等国际顶级学术期刊和会议上发表论文近百篇,已建立将富文本 的非结构化数据转化为结构化数据的平台,包括:文档结构识别、 自然语言理解、表格内容理解等模块,核心技术已形成壁垒,并通 过专利网络的布局予以保护。同时,积极开拓富文本语义理解在金 融文档合规性分析方面的应用。在团队的建议下,证监会信息中心 正式将金融文档的合规性分析能力列为监管科技 3.0 着力建设的 7 大数据处理基础能力之一,团队核心成员罗平博士也成为证监会监 管科技 3.0 建设顾问专家组成员。
团队介绍
Copyright @ 2019 新乡科技服务中心 豫ICP备19023816号