教育大数据研究院作为服务全校学术创新与人才培养的科研平台,继推出“大数据+人文社科创新”跨学科协同研究项目外,同时推出“大数据+创新人才培养”高端讲座和课程。在省重点新型智库平台及合作单位支持下,邀请国内外一流专家学者举办“大数据高端讲堂”专题讲座、开设“大数据公开课”短期课程,助力全校相关学科教师的专业发展与科研能力提升,以及本科生、研究生复合型创新素质培养。
“大数据公开课”首期短期课程
讲授专家:北京大学博士生导师 严洁
课程名称:《社会调查:研究设计与数据分析》
讲授时间:10月14日、15日、21日、22日,共4天、24个学时
讲授地点:教育大数据研究院报告厅(视报名人数调整为大型会议室)
欢迎广大师生听课;为便于安排,请以学院或导师为单位,统一联系孙祥广15263366999(报名截至9月22日)。报名人数若超出会议室容纳人数,按照教师、研究生、本科生的顺序依次优先安排;暂不接受校外人员听课。
“大数据公开课”本期专家简介
严洁(女,1972-),在北京大学获得政治学学士、硕士和博士学位,北京大学政府管理学院博士生导师,北京大学中国国情研究中心副主任、中国社会科学调查中心执行团队负责人。主要从事社会科学定量研究方法研究。
在校讲授《社会调查的理论与方法》、《实证研究设计与数据分析》、《应用统计学》、《政治学定量测量方法》、《高级社会统计分析与应用》等课程。
自1995年以来设计并组织实施了百余项大规模抽样调查。作为主要执行者参与了4波《世界价值观调查-中国部分》, 2波《世界精神健康调查-中国部分》,1波《亚洲民主动态调查》, 3波《平等与公正研究》,2波《公共产品、公共服务与政府支持研究》,1波《政府质量调查》,4波《中国家庭追踪调查》、14波《北京地区社会经济发展年度调查》等知名大型抽样调查。在问卷设计、抽样设计、调查执行、调查质量控制、调查数据缺失值处理、调查数据统计分析等方面经验丰富。
与沈明明教授、Pierre F. Landry教授共同创立了“GPS/GIS辅助的区域抽样方法”,该方法的研究成果已在《Political Analysis》、《China Review》上发表。在《社会学研究》、《北京大学学报》、《社会》、《武汉大学学报》等核心刊物上发表多篇文章。主持并完成了国家自然科学基金项目“并行数据与调查数据质量”,并作为主要参与者完成了多项国家社科基金项目。
“大数据公开课”本期课程介绍
课程名称:《社会调查:研究设计与数据分析》
基本目的:培养研究人员及学生设计、执行社会调查项目,并且运用社会调查数据进行统计分析的能力。
内容提要:从讲授实证研究方法的种类开始,介绍不同的数据采集方法的应用对象,不同社会调查方法的适用环境。然后按照社会调查的执行流程依次讲授研究设计(从理论假设到概念的操作化,再到测量方法的选择,再到数据分析框架的设计)、问卷设计(含单项题目、复合量表、问卷结构、辅助工具的设计)、抽样设计、数据采集与质量控制、数据库建立与数据整理(含离群值处理、缺失值处理、综合指数的构建等)、数据质量评估(含抽样误差的计算、测量信度和效度的评估等)、数据分析方法的选择、数据分析结果解读等内容。
教学方式:大班授课24学时+小组课后练习24学时大班授课将以实务操作和快速应用为目标,以典型案例为载体进行讲解,重点关注社会调查各环节的工作规范、常犯的错误和前沿方法的介绍。小组练习将在课后进行,包括选择一个主题、对该主题进行理论假设、设计网络问卷、采集50份-120份数据、建立数据库,对数据评估质量,应用数据做方差分析和回归分析,并解释数据分析的结果。
统计软件:SPSS软件、STATA软件
先修要求:提前准备SPSS和STATA软件,提前学会使用网络调查平台设计网络调查问卷(例如,问卷星等),提前准备一个感兴趣的研究题目。
授课提纲
课时 |
题目 |
内容简介 |
3 |
研究设计 |
不同研究方法的使用环境,不同调查方法的适用性;什么是好的理论假设;如何制定数据分析框架 |
3 |
问卷设计 |
设计问卷的基本原则、方法;单项测量、多项测量(量表和指数)的设计方法;敏感题目、评价指标参照系的设计方法;问卷结构的谋篇布局;问卷的辅助工具的设计。 |
3 |
抽样设计 |
概率抽样和非概率抽样的特点、应用环境;抽样设计的内容和步骤;常用的抽样方案;样本量的估算。 |
1 |
调查实施、质量控制 |
调查实施的流程、质量控制的策略和方法 |
2 |
调查数据整理 |
再编码、整合新变量、识别离群值,缺失值处理 |
小组课后练习一(一周时间,4-6人一个小组) |
选题,提出理论假设,设计网络调查问卷,采用配额抽样选取样本,用微信或QQ或email采集50-120份数据,并建立SPSS数据库,整理出因变量和自变量 |
3 |
调查数据分析的步骤和分析方法的选择 |
数据分析的步骤、各种分析方法的使用环境和主要特点 |
3 |
相关分析、方差分析 |
作为描述数据使用的相关分析、方差分析的使用环境、方法和分析结果的解读 |
3 |
回归分析 |
一般线性回归和逻辑斯蒂回归的基本方法、分析结果的解读 |
3 |
复杂模型 |
多水平模型、结构方程模型、倾向值匹配法的概要介绍和适用环境 |
小组课后练习二(一周时间,4-6人一个小组) |
用相关分析和方差分析对关键变量进行描述、用一般线性回归或者逻辑斯蒂回归分析并解读数据,有条件的学生可应用多水平模型或倾向值匹配法。 |
研究设计与数据分析报告 |
课程结束后的10天内,各小组自愿递交研究设计和数据分析报告给助教,授课教师将反馈审阅意见给助教。 |