会议详情 |
推荐会议:QCon上海2025|全球软件开发大会
发票类型:增值税普通发票 增值税专用发票
培训特色
理解数据挖掘的基本算法,比如决策树,聚类算法,逻辑回归,关联规则。进一步地,从最优化理论的高度解释为何这些数据挖掘的算法要这样设计。最后,从实际数据挖掘案例的角度解释理论中的算法和实际应用场景下的差距,如何在准确率和有限的时间,算法性能上做折中,和实际的事例结合说基本算法的各种变体。
目标收益
课程中的理论和经验来自于对初级数据挖掘工程经常遇问题的归纳、分析与总结,有针对性的给出解决方法,课程将重现这些问题的经典案例,通过实例讲解,并对应到学员的实际工作问题,使学员能够把传授的经验和自己的问题结合起来,有效的启发思路、激发兴趣、提供解决问题需要的新思路新方法。
学员的收获总结起来有3点:
1:了解实际的事例结合说基本算法的各种变体,开阔思路
2:将一次培训深化为深入了解一个细分领域的一个渠道,之后可以接收到培训内容中知识点对应的业界最新更新。
3:加入“数据挖掘”职业圈,学员可以有一个加入职业社交圈的机会,和业内人士相互交流,相互切磋。
培训对象
1:有一定的程序和数学基础,希望对于数据挖掘有个知识体系的梳理,同时深入了解在实际生产过程中数据挖掘的各种算法的应用的,希望从初级走向中级的,数据增值产业的从业者。尤其是想做数据挖掘但是效果不显著,希望在公司内部得到更多重视的团队,派出两三人参加这个课程,效果尤佳。
2:对于数据挖掘,商业智能感兴趣,希望从事类似的工作,但是又感到所谓“大数据”知识体系繁杂,无论是广度还是深度都很难开始的“迷茫”人士。
学员基础
学员学习本课程应具备下列基础知识:
1) 知道统计学的一些基本概念:平均分布,正态分布,方差,置信区间;
2) 知道数据结构的一些基本概念:时间,空间复杂度;
3) 知道计算机体系结构的一些基本概念:GPU,芯片,寄存器,内存寻址,总线传输,内网通信
课程时长
2天
麦思博(msup)有限公司发源美国西雅图,2007年创办,是一家面向技术型组织的培训咨询机构,服务于技术团队的技能提升、软件工程的实际应用和产品品质的创新与超越。强调人员、技术、流程和管理的有机结合,注重角色岗位的技能提升与职业发展,以及技术团队复合管理与协作。每年超过1000家企业续单参与msup旗下公开课、工作坊、案例研究、国际游学等培训项目。
主题 |
内容 |
广义线性分类的原理和应用 |
内容:logistic Regression和计算广告学 n1.二分类问题的例子n2.逻辑回归的数学原理n3.传统广告,计算广告,广告实时交易平台n4.数据预处理和维度提取n5.LR在计算广告中的应用n6.LR的效果测评,模型调优n7.LR模型中理论与工程的折中n8.LR和他的小伙伴们:广义线性模型n9.新情况,基于移动端的广告实时交易平台,LR的各种变体 |
决策树,聚类和异常点检测 |
内容:决策树和异常点检测n1.决策树的原理n2.各种决策树的生成算法n3.决策树在异常点检测中的应用n4.决策树的剪枝n5.其它异常点检测的应用小技巧n6.聚类算法的原理n7.聚类算法的常见问题:初始点选择,n8.聚类算法和决策树在异常点检测中的应用n9.结合计算广告,谈两个异常点检测小例子 |
巨型图挖掘 |
1.复杂网络介绍n2.当前巨型图应用场景n3.随机图,自然图,n4.常用的图计算框架(google的bagel,graphlab的graphx)n5.巨型图上的算法实现原理n6.常用的基于图的算法实现n7.随机游走,pageRank基于图的实现n8.svd介绍以及svd在图框架的实现n9.图挖掘与推荐系统(qzone的广告系统广点通,twitter的内容推荐) |
吴炜
淘宝
资深数据挖掘工程师
曾经任职于盛大,mediav,腾讯,具有多年的计算广告和数据挖掘的经验,理论知识完备,实战经验丰富。曾经主导或参与过多个pv上亿次数据挖掘项目,具体有:1)盛大移动端数据挖掘平台;2)聚胜万合聚效广告平台;3)腾讯移动端社交产品流量增值(微信,手Q);4)淘宝技术部交易日志数据挖掘平台;甚至可以说,80%的网民都直接或是间接使用过他参与过的数据产品。
课程费用:5800元/人
相关会议
2025-10-23上海
2025-04-25深圳