知识发现与数据挖掘在社会科学中的应用:
机器学习与经典统计方法的融合
内容简介
知识发现与数据挖掘(KDD)是一个融合演绎与归纳的辩证研究过程。它通过自动化或半自动化的方式,整合联合、交互及独立的预测变量,以应对因果异质性并提升预测效能。KDD在揭示数据中有效且显著的隐藏模式、为理论与数据分析提供新视角、以及推动科学发现方面发挥着关键的补充作用。
当前的最新趋势是将预测建模这一新兴范式与经典的参数估计回归方法相结合,构建出兼具解释力与预测力的优化模型。本文通过研究案例,阐释如何将机器学习与经典统计方法协同运用,从而挖掘数据中的潜在规律,辅助知识发现。这种融合不仅增强了模型的预测精度,还深化了对社会科学复杂现象的理论阐释,为跨学科创新提供了新路径。
主讲人简介
舒晓灵,加州大学戴维斯分校社会学教授。获明尼苏达大学社会学博士学位及计算机科学硕士学位。研究聚焦当代社会两大深刻变革—市场化与全球化对性别不平等、社会福祉及性别-家庭-婚姻观念与行为的形塑机制。通过构建数据科学模型,系统分析中美英三国数据并开展多国跨国比较研究。
学术专著包括《社会科学知识发现:数据挖掘方法论》(加州大学出版社)及《转型中的中国婚姻:从父权制到新家庭主义》(罗格斯大学出版社)。研究成果发表于《社会力量》《社会科学研究》《教育社会学》《婚姻与家庭杂志》《社会科学与医学》《社会科学季刊》《性别角色》《幸福研究杂志》《社会》《社会分层与流动研究》等国际权威期刊。曾任美国社会学会亚洲及亚美研究分会主席、国际华人社会学会会长,并主持加州大学戴维斯分校东亚研究中心工作。