会议详情 菜单
2019Python爬虫与文本挖掘核心技术培训班(8月北京班)

2019Python爬虫与文本挖掘核心技术培训班(8月北京班)

2019-08-16 09:00 至 2019-08-19 16:30

北京   北京科技大学

北京软数信息技术研究院   

50人

报名截止

推荐会议:2024PM产品力领航者大会

发票类型:增值税专用发票 增值税普通发票

参会凭证:邮件/短信发送参会通知 电子票

部分参会单位:

乐元素科技(北京)股份有限公司

上海体育学院

-会议内容-

 “Python爬虫与文本挖掘核心技术”培训班通知

随着互联网的发展,网络信息呈现指数式增长,要在短时间内获取大量信息,网络爬虫无疑是一种最适合的方法。通过爬虫获取的海量信息,我们可以对其进行进一步的分析:市场预测、文本分析、机器学习方法等。

Python作为一门脚本语言,它灵活、易用、易学、适用场景多,实现程序快捷便利,早已经成为程序员们的一门编程利器。Python这门编程语言包罗万象,可以说掌握了python,除了一些特殊环境和高度的性能要求,你可以用它做任何事。为提升相关科技工作者的技术水平,北京软数信息技术研究院特举办“Python爬虫与文本挖掘核心技术”培训班,本次培训从爬虫的基本知识入手,使用Python作为实现工具,一步步地讲述网络爬虫的实现,具体内容如下:

【培训目标】

1、让学员快速掌握python语言基础及Python爬虫项目的编写,学会独立开发常见的爬虫项目,并能胜任相关工作;2、解决学员实际工作中的疑难问题。

【时间地点】

2019年08月16日——2019年08月19日   北京

(时间安排:第一天报到,授课三天)

【培训对象】

 各省市、自治区从事为电信、电力、政府、互联网、生产制造、零售、银行、生物、化工、医药等与数据分析、挖掘相关的企事业单位技术骨干、科研院所研究人员和大专院校相关专业教学人员及在校研究生、硕士、博士等相关人员。

【颁发证书】

参加相关培训并通过考试的学员可获得由工业和信息化部通信和信息技术创新人才培养工程颁发《数据挖掘应用》职业水平证书。


北京软数信息技术研究院

2019年07月17日 

-主办方介绍-

北京软数信息技术研究院

python爬虫与文本挖掘核心技术课程大纲

第一天:python基础   与爬虫入门

第一章:Python基础

<1.0>初识Python与Anaconda

<1.1>变量类型、数据结构

<1.2> Python控制流语句

<1.3> Python函数与类

第二章:Python数据分析常用库

<2.0>使用Numpy进行数值计算

<2.1>使用Matplotlib进行数据可视化

<2.2>使用Pandas进行数据分析

<2.3>使用Sci-Kit Learn进行模型构建

第三章:Python爬虫技术入门

<3.0>认识爬虫与反爬虫

<3.1>配置环境变量

<3.2>Python爬虫的基本流程

<3.3>正则表达式

案例1:航空公司客户价值分析

案例2:使用正则表达式提取电话号码

第二天:python爬虫进阶

第四章:Python爬虫核心技术

<4.0> urllib3, requests模块实现HTTP请求

<4.1>网页解析(正则表达式、XPath、BeautifulSoup)

<4.2>数据存储

<4.3>模拟登陆(表单登陆、Cookies登陆)

<4.4>验证码识别

第五章:Python爬虫技术进阶

<5.0>安装Selenium库及浏览器补丁

<5.1>打开浏览器对象并访问网页

<5.2>页面等待

<5.3>页面操作

<5.4>预期条件

<5.5>信息提取

案例1:前程无忧招聘信息提取

案例2:模拟登陆数睿思网站

案例3:《流浪地球》豆瓣影评分析 

第第三天:文本分析基础和进阶

 

第六章:文本挖掘入门

<6.0>文本挖掘概述

<6.1>分词(jieba库)

<6.2>去除停用词

<6.3>词云(WordCloud)绘制

<6.4>文本的向量表示

第七章:文本挖掘进阶

<7.0>文本分类(Text Classifier)

<7.1>文本聚类(Text Clustering)

<7.2>主题模型(Topic Model)

案例1: 基于文本挖掘的垃圾短信识别

案例2:电商评论主题模型构建

【主讲专家】

杨老师:北京软数信息技术研究院特邀讲师,具备丰富的培训经验,曾为多家企业、院校服务过专业培训工作。从事数据挖掘工作五年,擅长文本挖掘及深度神经网络RNN,熟悉常用机器学习算法原理及应用,如神经网络、SVM、决策树、贝叶斯等算法;精通R、Python、Matlab等常用数据挖掘处理工具。具有丰富的实践项目经验。如“京东电商产品评论情感分析”项目;“珠江数码大数据营销推荐应用”项目;“电子商务网站智能推荐服务”项目。

-会议门票-

【培训费用】

A类:¥RMB:3900/人(含报名费、培训费、教材资料费、场地费、午餐费、证书费等)

B类:¥RMB:3500/人(含报名费、培训费、教材资料费、场地费、午餐费、证书费等)

此费用为学生优惠价,需签到时出示学生证;

食宿可统一安排,费用自理。

颁发证书:参加相关培训并通过考试的学员可获得由工业和信息化部通信和信息技术创新人才培养工程颁发《数据挖掘应用》职业水平证书。

-场馆介绍-

北京科技大学 北京科技大学

交通指南:

北京市海淀区学院路30号

北京科技大学(University of Science & Technology Beijing,USTB)是教育部直属全国重点大学,为国家“211工程”、“985工程优势学科创新平台”重点建设院校,入选“2011计划”、“卓越工程师教育培养计划”、“高等学校学科创新引智计划(111计划)“、“国家建设高水平大学公派研究生项目”,设有研究生院,是北京高科大学联盟成员 。

学校于1952年由原北洋大学、清华大学等6所国内著名大学的矿冶科系组建而成,初名北京钢铁工业学院,1960年更名北京钢铁学院,是全国首批成立研究生院的22所高校之一。1988年定名北京科技大学,1997年5月,学校首批进入国家211工程”建设高校行列。2006年,学校成为首批“985工程”优势学科创新平台建设项目高校。2014年,入选国家“2011计划”。现已发展成为一所以工科为主,工学、理学、管理学、文学、经济学、法学等多学科协调发展的研究型重点大学。


会议标签:

人工智能 大数据 云计算 互联网 AI python培训

温馨提示
酒店与住宿: 异地参会客户请注意,为防止会议临时变动,建议您先与活动家客服确认参会信息,再安排出行与住宿事宜。
退款规则: 活动各项资源需提前采购,购票后不支持退款,可以换人参加。

相关会议

分享到

QQ好友 QQ空间 微博 ×