清华大学大数据方向硕士学位 公共必修课课程 数据分析学(I) DataAnalytics(I) 开课单位:数据分析学(I)课程组 授课教师:黎波、张楠、郑路、庞珣、苏毓淞、罗昊、王程韡(暂定) 教学目的: 本课是针对社会科学和管理类研究学开设的数据分析基本课程。通过本课的学习,学生将对(大)数据分析的价值、意义和基本原理建立清晰和比较全面的认识,掌握有关数据发掘、处理、建模和解释的基本原理和方法,了解和熟悉数据分析在社会科学研究、商业分析和公共管理等领域的实际案例。 DataAnalytics(I)主要教材: byJohannesLedolter,2013,Wiley byGarethJamesetal,2013,Springer byStephenBorgattietal,2013,SAGE bySophiaRabe-HeskethandAndersSkrondal,2008,Stata 教学软件:R,Stata,UCINET 教学内容: 一、统计分析 1. 数据分析简介 2. 概率论基础 3. 数理统计基础 4. R软件简介,使用R进行探索性数据分析 5. 线性回归模型 6. 多层次、纵贯性数据分析(MultilevelandLongitudinalModeling) 7. 非参数回归 二、机器学习 8. 正则化监督学习(Supervisedlearningwithregularization) 9. 在抽样统计学(Resamplingmethods) 10. 树状模型方法、支持向量机(Tree-basedmethods,Supportvectormachines) 11. 非监督学习:聚类、降维(Unsupervisedlearning:clustering,dimensionreduction) 三、综合应用 12. 文本挖掘和情感分析(TextMiningandSentimentAnalysis) 13. 社会网络分析(SocialNetworkAnalysis) 14. 政策信息学简介(PolicyInformatics) 成绩构成: 平时作业 期中考试 期末考试 学期论文 20% 20% 30% 30% 本文来源:https://www.wddqw.com/doc/8d65263c951ea76e58fafab069dc5022abea4631.html