会议详情 |
发票类型:增值税普通发票 增值税专用发票
主办单位:全国高校大数据教育创新联盟
泰迪杯数据挖掘挑战赛组委会
承办单位:广东泰迪智能科技股份有限公司
协办单位:人民邮电出版社有限公司
北京泰迪云智信息技术研究院
各有关院校:
国家十三五规划纲要明确提出“实施国家大数据战略,推进数据资源开放共享”,为我国在大数据领域的未来发展绘制了宏伟的蓝图,开启了我国大数据发展的新时代。教育部《高等学校人工智能创新行动计划》及国务院颁布的《新一代人工智能发展规划》,责成科技司、基教司、职成司、高教司、地方各级教育行政部门大力推动人工智能、大数据等新技术在教育教学中的深入应用,推进信息技术与高等教育教学深度融合。从发布对人工智能、大数据等新技术与教育结合的指导性文件到直接扶持建设相关教学项目,为高校进行教学改革和升级教学手段和方式指明了新的方向。
大数据及人工智能产业的发展对人才提出了新的需求,国内各高校在积极进行学术研究的同时,已经将大数据与人工智能教育纳入培养体系。为帮助高校适时调整课程体系、继续深化教学改革,指导数据智能学科建设和跨学科人才培养,进一步提升教学能力和科研能力,全国高校大数据教育创新联盟联合泰迪杯数据挖掘挑战赛组委会将于将于2021年1月19-25日举办“全国高校Python数据分析与挖掘实战师资研修班,本次研修班将以云课堂形式举办,现将有关详细安排通知如下:
一、课程介绍
随着大数据时代的到来,对于数据的要求不仅仅是存储和管理,更重要的是需要对大量数据进行分析、加工最后再决策。数据分析与挖掘可以从海量数据中获得别人看不见的信息,创业者可以通过数据分析来优化产品,营销人员可以通过数据分析改进营销策略,产品经理可以通过数据分析洞察用户习惯,金融从业者可以通过数据分析规避投资风险,程序员可以通过数据分析进一步挖掘出数据价值。
本次培训采用“线下精讲+专家技术现场答疑指导+学员群内实操答疑+助教指导”结合的方式,主要讲解了使用Python进行数据分析与挖掘的相应理论与代码实践,梳理技术框架,从根本上解决如何使用模型、优化模型的问题,通过讲解企业级案例,真正的让各位老师可以了解到所学内容如何和实际结合,做到更好的进行教育教学工作。
二、课程目标及收获
1、本课程全程强调动手实操;内容以代码落地为主,以理论讲解为根,以公式推导为辅,通过讲解企业级案例,真正的让学员把所学内容和工作实际有效结合,做到更好的进行教育教学工作。视频制作精良,讲师真人出镜,系统梳理课程知识框架,全面解析专业必备技能,为相关课程开设和备课、应对科研和项目开发打下坚实基础。
2、核心课程部分由讲师手把手一起进行实操演练,在具体应用场景中全面掌握相关技能,助力实训教学工作、实际动手的能力。通过讲解具体应用,全面解析专业必备技能,为相关课程开设和备课、应对科研和项目开发打下坚实基础。
3、全面实践商务数据分析流程,包括数据处理、数据探索、数据建模等课程提供知识讲解,注重案例实战,提供在线答疑等服务,助力夯实理论基础,掌握核心技术,全面提升专业授课能力。
4.无论是前置学习篇还是案例集训篇,相关代码、源数据、PPT、案例素材全部提供下载,即学即用,教学更轻松!视频内容支持回看(支持六个月内免费回看),以便复习和参考。
三、研修对象
各高等院校大数据、人工智能相关学科、计算机、网络通信、自动化、电子工程、数理统计等专业的科研、教学带头人、骨干教师、博士生、硕士生、本科生、大专生;
从事计算机、云计算、大数据、人工智能、互联网等相关领域项目的科研院所的项目负责人、科研人员、工程技术人员等。
四、时间与方式
培训时间:2021年1月20-25日
培训地点:广州(泰迪科技公司总部)
证书颁发
学员经在线培训并考试合格后,可以获得由工业和信息化部教育与考试中心颁发“高级大数据技术应用职业技术证书”,证书可登录国家工业和信息化部教育与考试中心官网查询。
五、培训内容
基础篇 (报名成功后即可开始学习) |
|||||
时间 |
课程内容 |
学习平台 |
|||
正式培训前 |
Python编程基础 1准备工作 2列表操作 3程序流程控制语句 4字符串操作 4.1字符串及其索引&切片 4.2字符串的常见方法 4.3字典的创建及索引 4.4字典常用操作 4.5字典推导式 5Python文件读取操作 5.1Python读取文件 5.2练习3:统计小说中的单词频次 6函数 6.1Python函数自定义 6.2练习4:自定义求序列偶数个数的函数 7面向对象与模块 7.1Python方法与函数对比介绍 7.2Python面向对象示例 7.3Python模块使用 7.4第三方库的安装与调用 8注意事项 8.1Python工作路径说明 8.2模块命名及存放路径的注意事项 8.3结语 |
泰迪云课堂 |
|||
核心课程篇 |
|||||
时间 |
课程内容 |
学习平台 |
|||
专题讲座 |
|||||
1月19日 18:00-19:00 |
主讲:冯国灿教授 主题内容:计算机视觉技术及其应用 |
泰迪云课堂 |
|||
第一课 Python数据分析与应用 |
|||||
1月19日 19:00-21:30 |
1 Python数据分析概述 1.1认识数据分析 1.2熟悉Python数据分析的工具 1.3安装Python3的Anaconda发行版 1.4掌握Jupyter Notebook常用功能 2 使用Pandas进行数据预处理 2.1合并数据 2.2清洗数据 2.3标准化数据 2.4转换数据 3使用scikit-learn构建模型 3.1使用sklearn转换器处理数据 3.2构建并评价聚类模型 3.3构建并评价分类模型 3.4构建并评价回归模型 |
泰迪云课堂 |
|||
第一课作业 |
个人PC |
||||
在线答疑 |
微信群 |
||||
第二课 Python数据分析实训 |
|||||
1月20日 19:00-21:30 |
1探索Iris鸢尾花数据 1.1 将数据集存成变量iris创建数据框的列名称['sepal_length', 'sepal_width', 'petal_length', 'petal_width', 'class'] 1.2数据框中有缺失值吗? 1.3将列petal_length的第10到19行设置为缺失值。 1.4将petal_lengt缺失值全部替换为1.0。 1.5删除列class。 1.6将数据框前三行设置为缺失值。 1.7删除有缺失值的行。 1.8重新设置索引。 2探索Chipotle快餐数据 2.1将数据集存入一个名为chipo的数据框内 2.2查看前10行内容 2.3数据集中有多少个列(columns)? 2.4打印出全部的列名称 2.5数据集的索引是怎样的? 2.6被下单数最多商品(item)是什么? 2.7在item_name这一列中,一共有多少种商品被下单? 2.8一共有多少个商品被下单? 2.9将item_price转换为浮点数 2.10在该数据集对应的时期内,收入(revenue)是多少? 2.11在该数据集对应的时期内,一共有多少订单? 2.12每一单(order)对应的平均总价是多少? 3探索Apple公司股价数据 3.1读取“appl_1980_2014.csv”数据并存为一个名叫apple的数据框。 3.2查看每一列的数据类型。 3.3将Date这个列转换为datetime类型。 3.4将Date设置为索引。 3.5有重复的日期吗? 3.6将index设置为升序。 3.7找到每个月的最后一个交易日(businessday)。 3.8数据集中最早的日期和最晚的日期相差多少天? 3.9在数据中一共有多少个月? 3.10按照时间顺序可视化Adj Close值。 |
泰迪云课堂 |
|||
第二课作业 |
个人PC |
||||
在线答疑 |
微信群 |
||||
第三课 机器学习实践 |
|||||
1月21日 19:00-21:30 |
1机器学习绪论 1.1引言 1.2基本术语 1.3假设空间&归纳偏好 2模型评估与选择 2.1经验误差与过拟合 2.2评估方法 2.3性能度量 2.4性能度量Python实现 3回归分析(RegressionAnalysis) 3.1线性回归基本形式 3.2线性回归模型的Python实现 3.3波士顿房价预测的Python实现 3.4逻辑回归介绍 3.5研究生入学录取预测的Python实现 4聚类分析(ClusterAnalysis) 4.1聚类分析概述 4.2相似性度量 4.3K.Means聚类分析算法介绍 4.4利用K-Means算法对鸢尾花进行聚类 4.5聚类结果的性能度量 4.6调用sklearn实现聚类分析 |
泰迪云课堂 |
|||
第三课作业 |
个人PC |
||||
在线答疑 |
微信群 |
||||
第四课 机器学习实战案例:市财政收入分析预测 |
|||||
1月22日 19:00-21:30 |
1 背景与案例目标 1.1财政收入预测背景介绍 1.2数据基本情况介绍 1.3分析目标解读 1.4项目流程介绍 2 相关系数分析 2.1求解person相关系数 2.2person相关系数解读 3 Lasso回归特征提取 3.1了解Lasso回归方法 3.2Lasso回归选取关键特征的实现 3.3Lasso回归数据写出及相应解读 4 灰色预测模型 4.1关键特征数据读取及准备 4.2GM11特征值预测 4.3GM11特征数据整理及写出 5 模型训练及预测 5.1数据标准化 5.2模型训练及预测 5.3结果可视化 |
泰迪云课堂 |
|||
操作演练 |
个人PC |
||||
在线答疑 |
微信群 |
||||
第五课 文本挖掘实战 |
|||||
1月23日 19:00-21:30 |
1自然语言处理简介 2开源中文NLP系统介绍 3中文分词介绍 4机械分词法 5机器学习算法分词 6NLP概率图介绍 7jieba分词演示 8文本的one-hot表达 9tf-idf权值策略实现 10文本的TF-IDF表达 11模型训练与预测 |
泰迪云课堂 |
|||
操作演练 |
个人PC |
||||
在线答疑 |
微信群 |
||||
第六课 文本分类案例:垃圾短信智能识别 |
|||||
1月24日 19:00-21:30 |
1 背景与目标 2 数据探索 2.1数据读取 2.2数据抽取 3 数据预处理 3.1去除短信中的x序列 3.2结巴分词 3.3去除停用词 3.4数据预处理函数封装 3.5垃圾短信的词频统计 3.6词云图绘制 4 文本向量的表示 4.1文本数据的向量化表达 4.2获取训练样本的tf-idf权值向量 4.3获取测试样本的tf-idf权值向量 5 模型训练及评价 6 小结 |
泰迪云课堂 |
|||
操作演练 |
个人PC |
||||
在线答疑 |
微信群 |
||||
第七课 综合实战:电商智能推荐--优惠券使用预测 |
|||||
1月25日 14:00-18:00 |
1 背景与目标 2 数据说明 2.1线下训练集数据介绍 2.2线上训练集数据介绍 2.3测试数据介绍 2.4项目流程介绍 3 数据预处理 3.1构建正样本 3.2构建负样本 3.3构建样本标签 4 特征构建 4.1特征构建介绍 4.2处理Discount_rate列 4.3特征1-折扣率 4.4特征2-商户与用户之间的距离 5 模型训练 5.1建模前数据准备 5.2初级模型构建 5.3ROC曲线与AUC值 5.4模型性能评估 5.5训练函数封装 5.6模型预测 5.7预测函数封装 6 特征完善 6.1特征3-优惠券流行度 6.2特征4-用户在商家中的消费次数 6.3如何进行特征拼接 6.4拼接训练集的特征3&4 6.5拼接测试及的特征3&4 7 预测 7.1模型训练 7.2预测 7.3代码整理 7.4结果提交 |
泰迪云课堂 |
|||
操作演练 |
个人PC |
||||
在线答疑 |
微信群 |
||||
第八课 认证考试 |
|||||
1月26日 19:00-21:30 |
工信部教育与考试中心高级大数据技术应用职业技术认证在线考试 |
泰迪云课堂 |
五、培训内容
基础篇 (报名成功后即可开始学习) |
|||||
时间 |
课程内容 |
学习平台 |
|||
正式培训前 |
Python编程基础 1准备工作 2列表操作 3程序流程控制语句 4字符串操作 4.1字符串及其索引&切片 4.2字符串的常见方法 4.3字典的创建及索引 4.4字典常用操作 4.5字典推导式 5Python文件读取操作 5.1Python读取文件 5.2练习3:统计小说中的单词频次 6函数 6.1Python函数自定义 6.2练习4:自定义求序列偶数个数的函数 7面向对象与模块 7.1Python方法与函数对比介绍 7.2Python面向对象示例 7.3Python模块使用 7.4第三方库的安装与调用 8注意事项 8.1Python工作路径说明 8.2模块命名及存放路径的注意事项 8.3结语 |
泰迪云课堂 |
|||
核心课程篇 |
|||||
时间 |
课程内容 |
学习平台 |
|||
专题讲座 |
|||||
1月19日 18:00-19:00 |
主讲:冯国灿教授 主题内容:计算机视觉技术及其应用 |
泰迪云课堂 |
|||
第一课 Python数据分析与应用 |
|||||
1月19日 19:00-21:30 |
1 Python数据分析概述 1.1认识数据分析 1.2熟悉Python数据分析的工具 1.3安装Python3的Anaconda发行版 1.4掌握Jupyter Notebook常用功能 2 使用Pandas进行数据预处理 2.1合并数据 2.2清洗数据 2.3标准化数据 2.4转换数据 3使用scikit-learn构建模型 3.1使用sklearn转换器处理数据 3.2构建并评价聚类模型 3.3构建并评价分类模型 3.4构建并评价回归模型 |
泰迪云课堂 |
|||
第一课作业 |
个人PC |
||||
在线答疑 |
微信群 |
||||
第二课 Python数据分析实训 |
|||||
1月20日 19:00-21:30 |
1探索Iris鸢尾花数据 1.1 将数据集存成变量iris创建数据框的列名称['sepal_length', 'sepal_width', 'petal_length', 'petal_width', 'class'] 1.2数据框中有缺失值吗? 1.3将列petal_length的第10到19行设置为缺失值。 1.4将petal_lengt缺失值全部替换为1.0。 1.5删除列class。 1.6将数据框前三行设置为缺失值。 1.7删除有缺失值的行。 1.8重新设置索引。 2探索Chipotle快餐数据 2.1将数据集存入一个名为chipo的数据框内 2.2查看前10行内容 2.3数据集中有多少个列(columns)? 2.4打印出全部的列名称 2.5数据集的索引是怎样的? 2.6被下单数最多商品(item)是什么? 2.7在item_name这一列中,一共有多少种商品被下单? 2.8一共有多少个商品被下单? 2.9将item_price转换为浮点数 2.10在该数据集对应的时期内,收入(revenue)是多少? 2.11在该数据集对应的时期内,一共有多少订单? 2.12每一单(order)对应的平均总价是多少? 3探索Apple公司股价数据 3.1读取“appl_1980_2014.csv”数据并存为一个名叫apple的数据框。 3.2查看每一列的数据类型。 3.3将Date这个列转换为datetime类型。 3.4将Date设置为索引。 3.5有重复的日期吗? 3.6将index设置为升序。 3.7找到每个月的最后一个交易日(businessday)。 3.8数据集中最早的日期和最晚的日期相差多少天? 3.9在数据中一共有多少个月? 3.10按照时间顺序可视化Adj Close值。 |
泰迪云课堂 |
|||
第二课作业 |
个人PC |
||||
在线答疑 |
微信群 |
||||
第三课 机器学习实践 |
|||||
1月21日 19:00-21:30 |
1机器学习绪论 1.1引言 1.2基本术语 1.3假设空间&归纳偏好 2模型评估与选择 2.1经验误差与过拟合 2.2评估方法 2.3性能度量 2.4性能度量Python实现 3回归分析(RegressionAnalysis) 3.1线性回归基本形式 3.2线性回归模型的Python实现 3.3波士顿房价预测的Python实现 3.4逻辑回归介绍 3.5研究生入学录取预测的Python实现 4聚类分析(ClusterAnalysis) 4.1聚类分析概述 4.2相似性度量 4.3K.Means聚类分析算法介绍 4.4利用K-Means算法对鸢尾花进行聚类 4.5聚类结果的性能度量 4.6调用sklearn实现聚类分析 |
泰迪云课堂 |
|||
第三课作业 |
个人PC |
||||
在线答疑 |
微信群 |
||||
第四课 机器学习实战案例:市财政收入分析预测 |
|||||
1月22日 19:00-21:30 |
1 背景与案例目标 1.1财政收入预测背景介绍 1.2数据基本情况介绍 1.3分析目标解读 1.4项目流程介绍 2 相关系数分析 2.1求解person相关系数 2.2person相关系数解读 3 Lasso回归特征提取 3.1了解Lasso回归方法 3.2Lasso回归选取关键特征的实现 3.3Lasso回归数据写出及相应解读 4 灰色预测模型 4.1关键特征数据读取及准备 4.2GM11特征值预测 4.3GM11特征数据整理及写出 5 模型训练及预测 5.1数据标准化 5.2模型训练及预测 5.3结果可视化 |
泰迪云课堂 |
|||
操作演练 |
个人PC |
||||
在线答疑 |
微信群 |
||||
第五课 文本挖掘实战 |
|||||
1月23日 19:00-21:30 |
1自然语言处理简介 2开源中文NLP系统介绍 3中文分词介绍 4机械分词法 5机器学习算法分词 6NLP概率图介绍 7jieba分词演示 8文本的one-hot表达 9tf-idf权值策略实现 10文本的TF-IDF表达 11模型训练与预测 |
泰迪云课堂 |
|||
操作演练 |
个人PC |
||||
在线答疑 |
微信群 |
||||
第六课 文本分类案例:垃圾短信智能识别 |
|||||
1月24日 19:00-21:30 |
1 背景与目标 2 数据探索 2.1数据读取 2.2数据抽取 3 数据预处理 3.1去除短信中的x序列 3.2结巴分词 3.3去除停用词 3.4数据预处理函数封装 3.5垃圾短信的词频统计 3.6词云图绘制 4 文本向量的表示 4.1文本数据的向量化表达 4.2获取训练样本的tf-idf权值向量 4.3获取测试样本的tf-idf权值向量 5 模型训练及评价 6 小结 |
泰迪云课堂 |
|||
操作演练 |
个人PC |
||||
在线答疑 |
微信群 |
||||
第七课 综合实战:电商智能推荐--优惠券使用预测 |
|||||
1月25日 14:00-18:00 |
1 背景与目标 2 数据说明 2.1线下训练集数据介绍 2.2线上训练集数据介绍 2.3测试数据介绍 2.4项目流程介绍 3 数据预处理 3.1构建正样本 3.2构建负样本 3.3构建样本标签 4 特征构建 4.1特征构建介绍 4.2处理Discount_rate列 4.3特征1-折扣率 4.4特征2-商户与用户之间的距离 5 模型训练 5.1建模前数据准备 5.2初级模型构建 5.3ROC曲线与AUC值 5.4模型性能评估 5.5训练函数封装 5.6模型预测 5.7预测函数封装 6 特征完善 6.1特征3-优惠券流行度 6.2特征4-用户在商家中的消费次数 6.3如何进行特征拼接 6.4拼接训练集的特征3&4 6.5拼接测试及的特征3&4 7 预测 7.1模型训练 7.2预测 7.3代码整理 7.4结果提交 |
泰迪云课堂 |
|||
操作演练 |
个人PC |
||||
在线答疑 |
微信群 |
||||
第八课 认证考试 |
|||||
1月26日 19:00-21:30 |
工信部教育与考试中心高级大数据技术应用职业技术认证在线考试 |
泰迪云课堂 |
报名材料及费用说明
1. 报名材料:报名申请表、身份证复印件、两寸近期正面免冠彩色半身证件照电子版
(要求:背景:白色,格式:JPG,大小:14-20K)。
2. 培训费用: 1980 元/人,包含(报名费、学习费、资料费、证书费)。
3. 本次研修班全部课程内容共计70课时,课程视频内容六个月内面向学员免费开放,可以反复学习。
相关会议