会议详情 菜单
python网络爬虫、文本挖掘与数据可视化培训班2019(8月贵阳班)

python网络爬虫、文本挖掘与数据可视化培训班2019(8月贵阳班)

2019-08-03 09:00 至 2019-08-06 12:00

贵阳   元和世纪酒店

中国通信工业协会(CCIA)   

35人

报名截止

推荐会议:2025大健康产业技术创新(昆明)论坛 暨中生协特医食品及生物活性肽工作委员会第三届年会

发票类型:增值税专用发票 增值税普通发票

参会凭证:邮件/短信发送参会通知 现场凭电话姓名参会

部分参会单位:

-会议内容-

一,课程目标与特点

1、培训采用理论知识+案例示范+代码练习的workshop项目化教学模式,所有课程将围绕实战案例展开,通过典型案例入手讲解知识点,让学员系统掌握Python语言的基本结构、语法与数据类型,模块,熟悉函数、类设计、包的使用及基本的编程方法;掌握网络信息获取及文本挖掘的基本知识及深度应用,熟练运用使用Python获取网络数据并独立开发常见的爬虫项目,熟练的进行文本分析处理, 适合零基础的初学者,也适合经验较为丰富的操作者

2、课程体系完整科学,可以系统学习并掌握Python数据预处理、分析与挖掘、可视化、机器学习与深度学习等核心算法原理以及全部技术的应用过程;熟悉Python在各种大数据技术产品中的应用;能够根据数据分布选择合适的算法模型并书写代码,对机器学习、数据挖掘运作机制有清晰全面的认识;

3、提供教学现场全程视频及PPT 、数据、程序;额外提供450G、90课时机器学习、深度学习、数据挖掘、网络爬虫与文本挖掘最新教学视频;建立微信交流平台,提供长期的技术支持与咨询服务。

二,技能认证

经培训考核合格,学员可获得通信和信息技术创新人才培养工程项目管理办公室《大数据分析师(高级)》职业技能证书,另可代为申请国家工信化部人才交流中心《数据分析师(高级)》职业技能水平培训证书

三,时间地点

2019年8月2日~8月6日      贵阳(2号报到

注: 学员自带笔记本电脑,跟随老师示范过程操作练习,讲师可根据学员基础对大纲进行适度调整,欢迎及时反馈相关建议。​​​​​​​

-主办方介绍-

中国通信工业协会(CCIA)

中国通信工业协会 (CCIA,以下简称协会)是一九九一年七月经民政部注册登记,由国内从事通信设备和系统及相关的配套设备、专用零部件的研究、生产、开发单位自愿联合组成的非营利的全国性社会团体。协会实行团体会员制度,中国普天信息产业集团、华为技术有限公司、中兴通讯、大唐电信、上海贝尔阿尔卡特、东方通信、康佳集团、方正科技、TCL通讯、海尔通信、宁波波导、申瓯通信、红图嘉和、首信集团、夏新电子、广州金鹏、联想移动、海信通信等国内大型通信工业企业都是协会的重要成员。协会理事会由中国普天信息产业集团公司等30多个单位组成。

培训大纲

模块一

第1讲:网络爬虫技术基础与开发环境

1. 网络通信基础

2. Web开发与网站分析介绍

3. 开发环境安装与使用

4. Python基础数据结构与语法

5. 常用Python库使用案例分享

第2讲:网络爬虫工具库

1. 认识正则表达式

2. 基础Python爬虫库(urllib/Requests)

3.“漂亮”的爬虫库-Beautiful Soup

4. 静态网页爬取案例分享(论坛、维基百科、小说网站等)

5. Selenium与无头浏览器

6. Ajax和DHTML网站爬取

7. 动态网页爬取案例分享(图片网站、新闻网站、

第3讲:网络爬虫存储

1. 文件读取与保存

2. 关系数据库存储-MySQL

3. 爬虫配合MySQL存储案例分享

4. 分布式存储-NoSQL数据库

5. 爬虫配合MongoDB存储案例分享

6. HDFS简介

模块二

第4讲:网络爬虫框架

1.Python网络爬虫框架介绍

2.Scrapy基本使用

3.Scrapy进阶使用

4.爬虫框架使用案例分享(评论类网站、二手车网站等)

第5讲:网络爬虫常用技巧

1. 表单处理

2. 模拟登录

3. 爬虫代理池

4. 各类网页内容处理

5. 设计隐蔽的网络爬虫

第6讲:文本挖掘技术基础

1. 文本挖掘全流程概述

2. 自然语言处理库(NLTK)

3. TextBlob文本处理库介绍

4. 中文分词介绍(jieba)

5. 词云介绍

模块三

第7讲:文本挖掘技术进阶

1. 文本挖掘预处理技术

2. 文本特征处理

3. 文本聚类与主题模型

4. 基于深度学习的文本挖掘

5. 文本挖掘案例分享(主题发现、新闻分类、情感分析等)

第8讲:数据可视化技术基础

1. 数据可视化介绍

2常用Python可视化模块(matplotlib,seaborn)

3. 常用统计图绘制:

3.1条形图

3.2直方图

3.3面积图

3.4饼图

3.5箱线图

3.6散点图

第9讲:数据可视化技术进阶

1. 交互式数据可视化

1.1更加‘美丽’的表达--pyecharts

1.2让你的图形有‘反馈’—bokeh

2. 地图可视化—basemap

3. 文本可视化--wordcloud

4. 网络图可视化—network

5. 爬虫技术、文本挖掘及数据可视化综合案例

附加模块(视课程整体进度而定)

 

第10讲:Python数据挖掘实战

Python数据挖掘技术概览:

1.数据挖掘与模型

2.建模流程和步骤

3.常见算法介绍

4.效果评估

数据挖掘典型项目流程示范:

1.数据探索性分析

2.数据探索中的可视化

3.特征处理和数据建模、

代码和案例实践:

1.泰坦尼克号沉船幸存者预测

2.Amazon员工访问需求预测

3.贷款违约风险预测

4.基于titanic数据集预测生存概率

5.演示如何进行绘图探索

第4天(8月6日)

培训考核、参观贵阳“国家大数据中心”

注: 学员自带笔记本电脑,跟随老师示范过程操作练习,讲师可根据学员基础对大纲进行适度调整,欢迎及时反馈相关建议。

主讲教师

尹老师  数据科学家,浙江大学物理学博士,数据科学与大数据技术专业负责人,兼任知名网络科技上市公司大数据总监,受聘担任多家大数据教学机构主讲教师,开发多套Python高级编程、机器学习、网络爬虫与文本挖掘系列课程,10+年Python软件开发数据产品经验,熟悉R \Javascript等多种编程语言,具有丰富的Python统计建模、数据挖掘、大数据技术教学经验,先后为中国交通银行,平安保险公司等数十家知名机构主讲Python课程。

-会议门票-

早鸟票:3680元/人,原价:3980元/人

含上课期间专家授课费、教材资料、场地费等

注: 学员自带笔记本电脑,跟随老师示范过程操作练习,讲师可根据学员基础对大纲进行适度调整,欢迎及时反馈相关建议。

-场馆介绍-

元和世纪酒店

元和世纪酒店

会议标签:

Python 网络爬虫 数据挖掘 文本挖掘 python培训

温馨提示
酒店与住宿: 异地参会客户请注意,为防止会议临时变动,建议您先与活动家客服确认参会信息,再安排出行与住宿事宜。
退款规则: 活动各项资源需提前采购,购票后不支持退款,可以换人参加。

相关会议

分享到

QQ好友 QQ空间 微博 ×