会议详情 菜单
2019Python和R数据挖掘技术-基于Python和R语言的数据挖掘和统计分析技术(10月上海班)

2019Python和R数据挖掘技术-基于Python和R语言的数据挖掘和统计分析技术(10月上海班)

2019-10-23 09:00 至 2019-10-25 18:00

上海   None

中科院计算所培训中心   

报名截止

推荐会议:2024中国医药医疗CIO年会

发票类型:增值税普通发票 增值税专用发票

-会议介绍-

课程时间:9月25日-9月27日

主讲老师:杨老师

公开课费用:5800元/人

 

对基于Python和R语言进行数据处理、数据探索的基本方法,利用R语言实现模型选择、Logistic回归及决策树算法,以及贝叶斯算法及支持向量机、神经网络等算法原理及实现进行讲解。

课程介绍

随着互联网、移动互联网和物联网的发展,我们已经切实地迎来了一个大数据的时代。如何对海量数据进行挖掘和分析,已经成为一个非常重要且紧迫的需求。

R是一个用于统计计算和统计制图的优秀工具,也是GNU的一个自由、免费、源代码开放的软件。R包括一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统,数组运算工具(其向量、矩阵运算方面功能尤其强大),完整连贯的统计分析工具,优秀的统计制图功能。

Python是一个数据分析和图形显示的程序设计环境,用于统计分析、绘图的语言和操作环境。Python有简便而强大的编程语言:可操纵数据的输入和输入,可实现分支、循环,用户可自定义功能。

培训目标

1、全面了解Python和R语言数据挖掘的相关知识。

2、学习Python和R的数据挖掘核心技术方法以及应用特征。

3、深入使用Python和R在数据挖掘和分析中的使用。

证书

培训结束,颁发中科院计算所职业培训中心“Python和R数据挖掘技术-基于Python和R语言的数据挖掘和统计分析技术”结业证书。

本课程有企业内训形式,授课老师、课程内容、教学方式均依据企业的培训需求灵活设置。

本网站内容包括并不限于课程介绍、课程大纲、上课照片、老师介绍等等资料及信息,未经允许不得抄袭和转载。

适用人群

培训对象

1,系统架构师、系统分析师、高级程序员、资深开发人员。

2,牵涉到数据挖掘和统计分析的数据中心运行、规划、设计负责人。

3,政府机关,金融保险、移动和互联网等大数据来源单位的负责人。

4,高校、科研院所牵涉到数据挖掘与统计分析处理的项目负责人。

学员基础

1,对IT系统设计有一定的理论与实践经验。

2,对数据挖掘和数据处理方法有一定的基础知识。

3,对Hadoop/Spark等大数据技术有一定的了解。

 

-主办方介绍-

中科院计算所培训中心 中科院计算所培训中心

中科院计算所培训中心是权威IT精英培训机构,专注中高端技术人才培养。采用高端公开课、企业内训形式教授大数据,军方软件,软件需求分析,项目管理等高端课程。

课程大纲

第一讲 数据挖掘,Python和R简介

1.1 数据挖掘

1.2 Python语言

1.3 R语言

1.4 Iris数据集

1.5 Bodyfat数据集

第二讲 数据的导入与导出

2.1 R数据的保存与加载

2.2 CSV文件的导入与导出

2.3 通过ODBC从数据库中读取数据

2.4 从Excel中导入与导出数据

2.5 Python的数据操作

第三讲 数据可视化展现

3.1 查看数据

3.2 单个变量展现

3.3 多个变量展现

3.4 更多探索

3.5 将图表保存到文件中

第四讲 决策树与随机森林

4.1 使用party包构建决策树

4.2 使用rpart包构建决策树

4.3 随机森林

4.4 Python中的决策树实现

4.5 Python决策树实例

第五讲 回归分析

5.1 线性回归

5.2 逻辑回归

5.3 广义线性回归

5.4 非线性回归

5.5 Python中的回归实现

5.6 Python回归实例

第六讲 聚类分析

6.1 k-means聚类

6.2 k-medoids聚类

6.3 层次聚类

6.4 基于密度的聚类

6.5 Python中的聚类实现

6.6 Python聚类实例

第七讲 离群点检测

7.1 单变量的离群点检测

7.2 局部离群点因子检测

7.3 用聚类方法进行离群点检测

7.4 时间序列数据的离群点检测

7.5 Python中的孤立点实例

第八讲 时间序列分析

8.1 R中的时间序列数据

8.2 时间序列分解

8.3 时间序列预测

8.4 时间序列聚类

8.5 时间序列分类

8.6 Python中的时间序列实例

第九讲 关联规则

9.1 关联规则的基本概念

9.2 Titanic数据集

9.3 关联规则挖掘

9.4 消除冗余

9.5 解释规则

9.6 关联规则的可视化

9.7 Python中的关联规则实例

第十讲 社交网络分析

10.1 词项网络

10.2 推文网络

10.3 双模式网络

10.4 Python中的社交网络分析实例

-会议门票-

公开课费用:5800元/人,含参会费,住宿交通自理。

会议标签:

培训证书 数据挖掘 数据统计 数据分析 Python

温馨提示
酒店与住宿: 异地参会客户请注意,为防止会议临时变动,建议您先与活动家客服确认参会信息,再安排出行与住宿事宜。
退款规则: 活动各项资源需提前采购,购票后不支持退款,可以换人参加。

相关会议

分享到

QQ好友 QQ空间 微博 ×