当前位置: 首页 » 学科建设 » 研究队伍

中文信息处理与机器学习研究团队

发布日期:2021-01-22

★ 团队负责人简介

李济洪,现为山西大学现代教育技术学院院长,博士,教授,山西大学计算机应用技术一级学科博士点的博士生指导教师。中国中文信息学会(国家一级学会)理事,山西省数学会常务理事,山西省计算机学会理事。

山西大学数学系基础数学专业本科毕业,中国科学院系统科学研究所概率论与数理统计专业理学硕士,山西大学计算机应用技术专业工学博士。

目前主要研究方向有:机器学习、中文信息处理、软件质量评测。曾主持完成了国家社科基金《文本数据挖掘分类算法性能对照的序贯检验方法》,国家自然科学基金《汉语框架语义角色的自动标注技术研究》,山西省科技基础条件平台项目《中文信息处理技术开放平台》、《山西省高性能计算平台》,山西省高校高新技术产业化项目 《IPV4与IPV6双栈网络技术开发与应用》,《网络综合教务管理信息系统》(获山西省教学成果一等奖)等二十多项国家、省部级课题。 在 《Neural Computation》, 《IEEE Transactions on Knownledge and Data Engineering》,《Patten Recognition Letter》, 《软件学报》,《计算机研究与发展》,《中文信息学报》,《应用数学学报》等国内外刊物上发表论文40余篇。

★ 团队研究方向和内容:

(1)研究面向大规模文本数据的重抽样(resampling),或子抽样(subsampling)的方法,以及相关的机器学习的理论和方法。近年来,主要提出多次重复的2折的正则化交叉验证方法(mx2 BCV),研究了在mx2 BCV下的算法性能对照、特征选择、区间估计、序贯检验的理论与方法。

(2)研究汉语句法语义分析器:探索汉语词语的分布表征的机理,汉语二分结构句法分析,汉语框架语义角色标注。研发中文信息处理技术开放平台,提供中文文本处理的的软件系统。

(3)研究基于软件源代码的软件缺陷预测的理论与方法。

★ 团队成员:

王钰博士,副教授

王瑞波 硕士,高级实验师

谷波硕士,讲师

石隽锋  硕士,讲师

曹学飞   博士,讲师

郭新峰硕士,副教授

杨杏丽博士生,讲师

牛倩硕士,讲师

★ 科研项目:

(1)文本数据挖掘分类算法性能对照的序贯检验方法研究,国家社科基金项目,2012.1-2015.12,主持

(2)汉语框架语义角色自动标注技术研究,国家自然科学基金面上项目,2009.1-2013.12,主持

(3) 面向文本数据模型性能比较的交叉验证t-检验,山西省自然科学基金项目,2017.1-2019.12,主持

(4)面向文本数据的正则化交叉验证方法研究,国家自然科学基金青年科学基金项目,2019.1-2022.12,参与

(5)参与方差正则化的分类模型选择方法研究,国家自然科学基金青年科学基金项目,2016.1-2019.12,参与

★ 奖励

王钰,2019年三晋英才青年优秀人才

王瑞波,2019年三晋英才青年优秀人才

★ 论文:

(1)Wang Ruibo, Li Jihong Bayes Test of Precision, Recall, and F1 Measure for Comparison of Two Natural Language Processing Models. ACL2019 long paper.

(2)崔军,刘亚娜,郭新锋,王瑞波,李济洪,基于最大信息系数的静态软件缺陷预测,应用概率统计,2019,35(1)

(3)谷波,王瑞波,李济洪,李国臣,基于RNN的中文二元结构句法分析,中文信息学报,2019.

(4)王瑞波,王钰,李济洪,面向文本数据的正则化交叉验证方法,中文信息学报,2019.

(5) Ruibo Wang, Jihong Li, Xingli Yang, Jing Yang, Block-regularized Repeated Learning-Testing for Estimating Generalization Error. Information Science, 2019, 477. p246–264. SCI, CCF(B)

(6)Yu Wang, Jihong Li,Yanfang Li, Choosing Between Two Classification Learning Algorithms Based on Calibrated Balanced 5×2 Cross-Validated F-Test. Neural Processing Letters, 2017, 46(1), pp 1-13 . SCI,CCF(C)

(7)Ruibo Wang, Yu Wang, Jihong Li, Xinli Yang, Jing Yang, Block-regularized mx2 Cross-validated Estimator of Generalization error. Neural Computation, 2017, Vol. 29, No. 2: 519–554. SCI,CCF(B)

(8)王瑞波,李济洪,李国臣,杨耀文. 基于Dropout 正则化的汉语框架语义角色识别. 中文信息学报. 2017,31(1).

(9)Yang Liu, Li Jihong,Wang Yu, Unbiased Condition of the Dispersion Efects Estimator in Unreplicated Two-Level Factorial Experiments. Journal of Systems Science and Complexity. 2016, VOL. 23,No.6 SCI

(10)李国臣, 刘展鹏, 王瑞波, 李济洪. 融合分词隐层特征的汉语基本块识别. 中文信息学报. 2016,30(2).

(11)Yu Wang, Jihong Li, Credible Intervals for Precision and Recall Based on a K-fold Cross-validated Beta Distribution. Neural Computation, 2016, Vol. 28, No. 8 , Pages 1694-1722.SCI,CCF(B)

(12)Yu Wang, Jihong Li, Ruibo Wang,Xingli Yang, Confidence Interval for F1 Measure of Algorithm Performance Based on Blocked 3×2 Cross-validation,IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING, 2015,27(3):651-659. SCI,CCF(A)

(13)Yu Wang,Jihong Li(*), Yanfang Li, Measure for data partitioning in m×2 cross-validation. Pattern Recognition Letters. 2015,65:211-217.SCI,CCF(C)

(14)Wang Yu, Wang Ruibo,Jia Huichen, Li Jihong, Blocked 3×2 cross-validated t-test for comparing supervised classification learning algorithms,Neural Computation, Vol.26 No.1 2014,2014-01-01 00:00:00, SCI,CCF(B)

(15)杨杏丽 王钰 王瑞波 李济洪 基于组块3×2交叉验证的预测误差估计的方差,应用概率统计, 2014, 30(4):372-380

(16)宋毅君 李济洪 基于条件随机场模型的汉语框架语义角色自动标注,中文信息学报,2014 VOL.28(3) p36-47

(17)李济洪 胡军艳 王钰预测误差的组块3x2交叉验证估计--基于生物数据的模拟比较研究. 生物数学学报 2014, 29(4):700-710.

(18)王钰 李济洪 冯霞 无重复因析试验中散度效应的ML估计,系统科学与数学. 2011, Vol31(7),804-816.

(19)李济洪 高亚慧 王瑞波 李国臣汉语框架自动识别中的歧义消解,中文信息学报. 2011, Vol.25 No.3 p38-44.