会议详情 |
推荐会议:CDA-L1业务数据分析师认证全年录播培训线上班随报随学
发票类型:增值税普通发票 增值税专用发票
课程介绍
Python是数据分析最常用的语言之一,中文自然语言处理(简称NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。NLP是一门融语言学、机器学习、统计学、大数据以及人工智能等于一体的科学。本课程偏重实战,不仅系统介绍了NLP涉及的知识点,同时也教会大家如何实际应用与开发。
本次培训主要介绍NLP所需要了解的Python科学包、正则表达式以及检索技术的知识。包括NLP相关的各个知识点:词法分析技术、句法分析技术、常用的向量化方法,介绍机器学习的一些基本概念,重点突出NLP常用的分类算法、聚类算法,同时还分享了几个案例。每个部分都有对应源数据和完整代码,供实战使用。
自然语言处理(NLP)属于人工智能与计算机语言学的交叉领域,处理的是计算机与人类语言之间的交互问题。随着人机交互需求的日益增长,计算机具备处理当前主要自然语言的能力已经成为了一个必然趋势。
本培训适合通信、金融、保险、制造、医药、教育科研、市场调研、连锁零售和电子商务等行业的数据分析人员,通过本课程的学习,将对NLP与数据科学领域中的概念有一个充分的了解,并能将这些知识应用到日常工作中。
培训时间及地点
2021年04月11日-04月13日(10日报到)地点:北京
2021年04月25日-04月27日(24日报到)地点:广州
培训对象
1.系统架构师、系统分析师、高级程序员、资深开发人员。
2.牵涉到网络采集、处理和规划的负责人、设计人员。
3.政府机关,金融保险、移动等以互联网信息为数据来源单位的负责人。
4.高校、科研院所牵涉到人工智能与机器学习的项目负责人。
天博信通-中国信息化人才培训中心率先在国内开展高级软件架构等IT高端培训的公开课。多年来持续不断的投入精力创新课程体系,至今已在国内开展公开课培训的课程达十几门,分别涵盖、云计算、大数据、软件架构、软件设计、高级UI设计、项目管理、质量管理、需求工程、运营管理等领域,也根据企事业单位的实用需求, 通过定制培训方案,培训后的技术服务,将企业单位的信息化投资的效益发挥到最高点。目前中心已经与几百家企事业单位建立了长期的培训合作关系, 深得用户信赖和好评。
课程模块 | 课程主题 | 主要内容及案例和演示 |
模块一 | NLP和深度学习发展概况和最新动态 | 1. NLP历史现在及为什么需要学习NLP技术 2. NLP实现机器学习,聊天机器人,情感分析和语义搜索 |
模块二 | NLP与PYTHON编程 | 3. Python环境搭建及开发工具安装 4. NLP常用PYTHON开发包的介绍 5. Jieba安装、介绍及使用 6. Stanford NLP 在Python环境中安装、介绍及使用 7. Hanlp 在Python环境中安装、介绍及使用 |
模块三 | 快速掌握NLP技术之分词、词性标注和关键字提取 | 08. 分词、词性标注及命名实体识别介绍及应用 09. 准确分词之加载自定义字典分词 10. 准确分词之动态调整词频和字典 11. 词性标注代码实现及信息提取 12. 人名、地名、机构名等关键命名实体识别 13. TextRank算法原理介绍 14. 基于TextRank关键词提取 |
模块四 | 句法与文法 | 16. 依存句法与语义依存分析 17. 依存句法树解析(子树遍历,递归搜索,叶子节点提取等) 18. 名词短语块挖掘 19. 自定义语法与CFG |
模块五 | N-GRAM文本挖掘 | 20. N-GRAM算法介绍 21. N-GRAM生成词语对 22. TF-IDF算法介绍应用 23. 基于TF-IDF挖掘符合语言规范的N-GRAM |
模块六 | 表示学习与关系嵌入 | 24. 语言模型 25. 词向量 26. 深入理解Word2vec算法层次sofmax 27. 深入理解Word2vec算法负采样 28. 6.4 基于Word2vec技术的词向量、字向量训练 |
模块七 | 深度学习之卷积神经网络 | 29. BP神经网络 30. 彻底理解深度学习指卷积神经网络 31. CNN文本分类 32. CNN文本分类算法模块 33. CNN文本分类模型详解数据预处理 34. CNN文本分类模型测试与部署 |
模块八 | 深度学习之递归神经网络 | 35. 递归网络 36. LSTM 37. LSTM文本分类原理 38. LSTM文本分类代码架构 39. LSTM文本分类代码详解 40. LSTM文本分类模型预测与部署 |
模块九 | 特定领域命名实体识别NER技术 | 41. 基于深度学习医药保险命名实体识别课题背景介绍 42. 医药保险命名实体和实体关系体系建立和命名实体分类规范 43. 医药保险命名实体识别相关前沿技术和难点 44. 基于深度学习医药保险命名实体识别的算法模块设计 45. 数据的采集,清洗,数据机器自动标注及转化为深度学习格式 46. 模型本地Lib库封装 47. 部署tensorflow训练好的模型为云服务 48. 算法设计及代码实现 49. 代码调试,参数优化及深度剖析(深入理解) |
张老师
阿里大数据高级专家,国内资深的大数据、Python技术专家,在Python技术编程、NLP自然语言处理、CV领域有很深造诣技术进行了多年的深入的研究,更主要的是这些技术在大量的实际项目中得到广泛的应用,曾使用Tensorflow,Caffe,Keras等深度学习框架完成过多项图像,语音,nlp,搜索相关的人工智能实际项目,研发经验丰富。同时具有多年授课培训经验,讲课通熟易懂,代码风格简洁清晰。
培训费用及须知
7800元/人(含教材、培训费、考证费以及学习用具等费用) 食宿统一安排,费用自理。
参加相关培训并通过考试的学员,可以获得:
工业和信息化部颁发的-《NLP自然语言处理证书》。该证书可作为专业技术人员职业能力考核的证明,以及专业技术人员岗位聘用、任职、定级和晋升职务的重要依据。
注:请学员带一寸彩照2张(背面注明姓名)、身份证复印件一张。
相关会议
2024-12-02线上活动
2024-12-01线上活动