会议详情 |
2019-08-03 09:00 至 2019-08-06 12:00
35人
推荐会议:2025大健康产业技术创新(昆明)论坛 暨中生协特医食品及生物活性肽工作委员会第三届年会
发票类型:增值税专用发票 增值税普通发票
参会凭证:邮件/短信发送参会通知 现场凭电话姓名参会
一,课程目标与特点
1、培训采用理论知识+案例示范+代码练习的workshop项目化教学模式,所有课程将围绕实战案例展开,通过典型案例入手讲解知识点,让学员系统掌握Python语言的基本结构、语法与数据类型,模块,熟悉函数、类设计、包的使用及基本的编程方法;掌握网络信息获取及文本挖掘的基本知识及深度应用,熟练运用使用Python获取网络数据并独立开发常见的爬虫项目,熟练的进行文本分析处理, 适合零基础的初学者,也适合经验较为丰富的操作者
2、课程体系完整科学,可以系统学习并掌握Python数据预处理、分析与挖掘、可视化、机器学习与深度学习等核心算法原理以及全部技术的应用过程;熟悉Python在各种大数据技术产品中的应用;能够根据数据分布选择合适的算法模型并书写代码,对机器学习、数据挖掘运作机制有清晰全面的认识;
3、提供教学现场全程视频及PPT 、数据、程序;额外提供450G、90课时机器学习、深度学习、数据挖掘、网络爬虫与文本挖掘最新教学视频;建立微信交流平台,提供长期的技术支持与咨询服务。
二,技能认证
经培训考核合格,学员可获得通信和信息技术创新人才培养工程项目管理办公室《大数据分析师(高级)》职业技能证书,另可代为申请国家工信化部人才交流中心《数据分析师(高级)》职业技能水平培训证书
三,时间地点
2019年8月2日~8月6日 贵阳(2号报到)
注: 学员自带笔记本电脑,跟随老师示范过程操作练习,讲师可根据学员基础对大纲进行适度调整,欢迎及时反馈相关建议。
中国通信工业协会 (CCIA,以下简称协会)是一九九一年七月经民政部注册登记,由国内从事通信设备和系统及相关的配套设备、专用零部件的研究、生产、开发单位自愿联合组成的非营利的全国性社会团体。协会实行团体会员制度,中国普天信息产业集团、华为技术有限公司、中兴通讯、大唐电信、上海贝尔阿尔卡特、东方通信、康佳集团、方正科技、TCL通讯、海尔通信、宁波波导、申瓯通信、红图嘉和、首信集团、夏新电子、广州金鹏、联想移动、海信通信等国内大型通信工业企业都是协会的重要成员。协会理事会由中国普天信息产业集团公司等30多个单位组成。
培训大纲
模块一 | 第1讲:网络爬虫技术基础与开发环境 | 1. 网络通信基础 2. Web开发与网站分析介绍 3. 开发环境安装与使用 4. Python基础数据结构与语法 5. 常用Python库使用案例分享 |
第2讲:网络爬虫工具库 | 1. 认识正则表达式 2. 基础Python爬虫库(urllib/Requests) 3.“漂亮”的爬虫库-Beautiful Soup 4. 静态网页爬取案例分享(论坛、维基百科、小说网站等) 5. Selenium与无头浏览器 6. Ajax和DHTML网站爬取 7. 动态网页爬取案例分享(图片网站、新闻网站、 | |
第3讲:网络爬虫存储 | 1. 文件读取与保存 2. 关系数据库存储-MySQL 3. 爬虫配合MySQL存储案例分享 4. 分布式存储-NoSQL数据库 5. 爬虫配合MongoDB存储案例分享 6. HDFS简介 | |
模块二 | 第4讲:网络爬虫框架 | 1.Python网络爬虫框架介绍 2.Scrapy基本使用 3.Scrapy进阶使用 4.爬虫框架使用案例分享(评论类网站、二手车网站等) |
第5讲:网络爬虫常用技巧 | 1. 表单处理 2. 模拟登录 3. 爬虫代理池 4. 各类网页内容处理 5. 设计隐蔽的网络爬虫 | |
第6讲:文本挖掘技术基础 | 1. 文本挖掘全流程概述 2. 自然语言处理库(NLTK) 3. TextBlob文本处理库介绍 4. 中文分词介绍(jieba) 5. 词云介绍 | |
模块三 | 第7讲:文本挖掘技术进阶 | 1. 文本挖掘预处理技术 2. 文本特征处理 3. 文本聚类与主题模型 4. 基于深度学习的文本挖掘 5. 文本挖掘案例分享(主题发现、新闻分类、情感分析等) |
第8讲:数据可视化技术基础 | 1. 数据可视化介绍 2常用Python可视化模块(matplotlib,seaborn) 3. 常用统计图绘制: 3.1条形图 3.2直方图 3.3面积图 3.4饼图 3.5箱线图 3.6散点图 | |
第9讲:数据可视化技术进阶 | 1. 交互式数据可视化 1.1更加‘美丽’的表达--pyecharts 1.2让你的图形有‘反馈’—bokeh 2. 地图可视化—basemap 3. 文本可视化--wordcloud 4. 网络图可视化—network 5. 爬虫技术、文本挖掘及数据可视化综合案例 | |
附加模块(视课程整体进度而定)
| 第10讲:Python数据挖掘实战 | Python数据挖掘技术概览: 1.数据挖掘与模型 2.建模流程和步骤 3.常见算法介绍 4.效果评估 |
数据挖掘典型项目流程示范: 1.数据探索性分析 2.数据探索中的可视化 3.特征处理和数据建模、 | ||
代码和案例实践: 1.泰坦尼克号沉船幸存者预测 2.Amazon员工访问需求预测 3.贷款违约风险预测 4.基于titanic数据集预测生存概率 5.演示如何进行绘图探索 | ||
第4天(8月6日) | 培训考核、参观贵阳“国家大数据中心” |
注: 学员自带笔记本电脑,跟随老师示范过程操作练习,讲师可根据学员基础对大纲进行适度调整,欢迎及时反馈相关建议。
主讲教师
尹老师 数据科学家,浙江大学物理学博士,数据科学与大数据技术专业负责人,兼任知名网络科技上市公司大数据总监,受聘担任多家大数据教学机构主讲教师,开发多套Python高级编程、机器学习、网络爬虫与文本挖掘系列课程,10+年Python软件开发数据产品经验,熟悉R \Javascript等多种编程语言,具有丰富的Python统计建模、数据挖掘、大数据技术教学经验,先后为中国交通银行,平安保险公司等数十家知名机构主讲Python课程。
早鸟票:3680元/人,原价:3980元/人
含上课期间专家授课费、教材资料、场地费等
注: 学员自带笔记本电脑,跟随老师示范过程操作练习,讲师可根据学员基础对大纲进行适度调整,欢迎及时反馈相关建议。
元和世纪酒店
相关会议
2025-06-20深圳