“大数据背景下CPI预测问题的文本挖掘技术设计与应用”讲座成功举办

9月1日晚,由清华大学中国经济社会数据研究中心(以下简称“中心”)主办的“大数据背景下CPI预测问题的文本挖掘技术设计与应用”线上讲座成功举办。主讲人为对外经贸大学唐晓彬教授。

讲座由中心助理研究员王洋主持,中心副主任刘精明教授,中心特聘专家冯乃林老师、金弘蔓老师,清华大学社会科学学院郑路副教授、谢丹夏副教授,清华大学经济学报编辑部王红主任,中心助理研究员张钟文老师及经管、社科学院博士后、博士生等共计30余人参加。

唐晓彬教授首先介绍了TF-IDF算法和BERT模型结构;其次,重点介绍了研究方法的设计,详细讲解了CPI预测关键词的扩充,CPI语料库的预训练以及CPI预测关键词的过滤与提取步骤。再次,从数据来源及描述、关键词扩展、关键词的提取和预测效果四个方面介绍了应用实例。最后,总结了基于交互式TF-IDF算法和BERT模型的“两段式”检索过滤模型对CPI预测指标体系的完善作用。

在自由交流环节,与会师生纷纷发言,讨论气氛十分热烈。大家表示通过此次学习和交流,加深了对构建CPI预测指标体系、CPI预测问题相关的文本挖掘技术等方面的认识和理解,拓宽了研究思路和方法。

中心将长期举办微观数据开发应用论坛,通过论坛的形式,促成大家在学术方面的交流和探讨,更好地推动学术研究,产出更多有影响力的成果。