LOADING

教材预告 | 《数据科学导引》序

2017-11-24 17:20:08
由 admin 发表

1.jpg

数据科学是一门新兴学科。它强调培养具有多学科交叉能力的大数据人才。这样的人才应该具有以下三方面素质:一是理论性的,主要是对算法和模型理解和运用的能力;二是实践性的,主要是处理实际数据的能力;三是应用性的,主要是利用大数据的方法解决具体行业实际问题的能力。培养这样的人才,需要数学、统计和计算机科学等学科之间的密切合作,同时也需要和产业界或其他拥有数据的部门之间的合作。数据科学课程的开设,也需要采用新的模式,即理论课和实践课相结合的模式,就像物理、化学和生物课一样。这就需要提供相应的实验平台。这样的实验平台应该提供实际问题、实际数据和基本的处理工具。

为了应对在师资能力、课程体系建设、教材的研发,以及教学形式的变革等多方面的挑战,北京大数据研究院牵头成立了博雅大数据学院。其目的是整合相关高校的集体力量,用高质量和最有效的方法建立起数据科学和大数据技术人才培养所需要的基础设施。这些基础设施包括课程体系和教材的建设和研发、实验平台的建设、师资培训、专业课程的建设和共享等。几年来,博雅大数据学院已经逐步建立起了一个完整的大数据课程体系。这些课程分成专业基础课、专业核心课和专业选修课三个模块。专业基础课包括大数据分析的数学基础、大数据分析的Python基础和数据存储等。专业核心课包括数据采集与网络爬虫、数据清洗技术与工具、数据可视化、大数据应用导论、数据科学导引、机器学习和分布式概论等。专业选修课包括深度学习、知识图谱、文本分析、健康医疗大数据、交通大数据和金融大数据等。同时,博雅大数据学院也初步建成了“数据嗨客”这个大数据实验和教学辅助平台,并得到了广泛的好评。

本书是博雅大数据学院系列教材的第一本。其目的是从技术的角度,对数据科学涉及的模型和算法进行全面介绍。本书系统地介绍数据科学的基本内容,包括数据预处理,数据分析的基本方法,特殊问题的处理(比方说文本分析),深度学习,以及分布式系统。除了从理论角度系统地介绍数据科学的基本内容,本书还提供了大量的数据分析实践案例。学生可以借助“数据嗨客”(www.hackdata.cn)这一平台进行实际的操作,和数据进行互动,在提高动手能力的同时加深对理论的理解和认识。教师可以将数据嗨客提供的在线实践练习作为实践作业。学生在线完成后教师可以直接得到反馈报表。这大大减轻了教师的工作量。读者可以通过以下网址访问本书配套的案例与实践练习:www.hackdata.cn/book/datascience。

本书是集体创作的成果。欧高炎负责数据预处理、分类模型、集成模型、关联规则挖掘、降维、文本分析、分布式计算和附录章节。朱占星负责回归模型、聚类模型、特征选择、EM算法、概率图模型和深度学习章节。董彬对教材进行审阅并提出了很多宝贵意见。鄂维南负责全书的统筹和组织以及所有章节的修改,同时负责绪论章节。北京大学计算机所邹磊和湖南大学信息科学与工程学院彭鹏撰写了图与网络分析章节的初稿。北京大学数据科学专业姚嘉豪、余欣航、陈嘉和王文佳等同学对本书初稿进行了细致的审读。博雅大数据学院的数据分析师晏晓东和高扬参与了案例与实战部分的撰写和数据嗨客在线案例和练习的整理。博雅大数据学院的UI设计师戴晓彤制作了本书大部分插图。


                                                                                                                                              作    者                  
                                                                                                                                2017年5月于北京大学静园

教材封面

2.jpg




作者介绍

鄂维南
北京大数据研究院院长,北京大学、普林斯顿大学教授,大数据教育联盟理事长,中国科学院院士。主要从事计算数学、应用数学及其在力学、物理、化学和工程等领域中的应用等方面的研究。1996年获首届美国总统青年科学家与工程师奖。2003年获国际工业与应用数学大会科拉兹奖。2009年获美国工业与应用数学学会克莱曼奖。2014年获美国工业与应用数学学会卡门奖。

欧高炎
北京大学北京国际数学研究中心博士后,博雅大数据学院院长,大数据教育联盟秘书长。中国计算机学会数据库专委会委员。大数据教育、服务和竞赛平台“数据嗨客”创始人。

朱占星
北京大学大数据科学研究中心、北京大数据研究员。主要研究方向为机器学习。长期从事人工智能、机器学习、深度学习以及发数据分析方面的研究与应用。

董彬
北京大学北京国际数学研究中心研究员,北京大数据研究院生物医学影像分析实验室副主任,求是杰出青年学者,中组部青年千人。主要研究领域是应用与计算数学及其在图像和数据科学中的应用。

教材目录

图片关键词

图片关键词

1515489293135765.jpg