2018Python网络爬虫与文本挖掘技术培训班

朱苗 发布于 2018/06/07 15:57
阅读 366
收藏 0

各科研院所单位:

   随着互联网的发展,网络信息呈现指数式增长,要在短时间内获取大量信息,网络爬虫无疑是一种最适合的方法。通过爬虫获取的海量信息,我们可以对其进行进一步的分析:市场预测、文本分析、机器学习方法等。

  Python作为一门脚本语言,它灵活、易用、易学、适用场景多,实现程序快捷便利,早已经成为程序员们的一门编程利器。Python这门编程语言包罗万象,可以说掌握了python,除了一些特殊环境和高度的性能要求,你可以用它做任何事。为提升相关科技工作者的技术水平,北京博宏科睿教育科技有限公司特举办2018年第二期“Python爬虫与文本挖掘实例技术与应用”培训班,本次培训从爬虫的基本知识入手,使用Python作为实现工具,一步步讲述网络爬虫的实现,具体内容如下:           

【培训目标】

1.让学员尽快掌握python语言的基本结构与语法与数据类型,模块、基本用法,熟悉函数,类设计,包的使用及基本的编程方法;

2.理解python数据挖掘与分析技术在当代各种大数据相关产品中的应用,并掌握该领域最关键技术的原理以及技术应用过程;

3. 能开发出一些实际的应用项目并初步胜任Python的数据挖掘和机器学习工作;

4. 通过紧密结合应用实例,针对工作中存在的疑难问题进行分析讲解和专题讨论,进而有效提升学员解决科研及教学中实际问题的能力同时提升其从数据角度去思考的能力。                 

培训费用

 RMB:3900元/人(含报名费、培训费、教材资料费、场地费、午餐费、证书办理费等)培训期间可统一协助安排食宿,费用自理。

颁发证书:参加相关培训学员可获得由工业和信息化部通信和信息技术创新人才培养工程颁发《数据挖掘应用工程师》职业水平证书。

请学员自备一寸照片一张(背后标注姓名及身份证号)办理证书需要,报到当天交由会务组人员。                                           

时间地点】                                                                   

2018年6月21日----6月24日  北 京*东城区北三环东路                                                  

(时间安排:第一天报到、授课三天)                                              

                               

“Python爬虫与文本挖掘实例技术与应用”培训班事宜

                             

邀请老师

  刘老师:对外经济贸易大学大数据系副教授,海归计算机专业博士,讲授计算机应用基础、数据结构、计算机网络、智能计算、Python与大数据分析等课程。其研究内容涉及:科技金融(基于机器学习的选股策略研究,信用逾期预测)图像分析理解,文本分析,智能硬件,数据挖掘、机器学习、手写识别等内容。曾获得过ImageCLEF2012 Photo annotation task国际图像分类竞赛中获得第一名,ImageCLEF2015 Scalable Concept Image Annotation Task(text-base) 第四名。  

【培训对象】

  从事金、医疗、保险、生态、卫生、计量、统计、银行、通信、环境、基金等与数据分析统计相关的企事业单位技术骨干、科研院所研究人员和大专院校相关专业教学人员及在校研究生、硕士、博士等相关人员,以及广大Python爱好者。

【培训方式 

 (一) 课程讲座;     

(二)专题小组研讨与案例讲解分析结合;

(三)欢迎学员带着在工作中遇到的实际问题与老师一起探讨; 

(四)培训教室提供操作电脑,无需自带笔记本。                                    

  【报名方式                                                                         

  报名表请传真或电子邮件至会务处。传真:010-51702355或邮件:edu@bohongkerui.com 报名成功后会务组将以电话或电子邮件方式通知您,并提前一周发 报到通知(详细会议地点及乘车路线), 具体安排见第二轮通知,名额有限,报名从速。

注:学员于报到当天领取发票和纸质邀请函及上课教材。

 

课程主题

(1)、Python入门基础;              (2)、正则表达式简介;

(3)、Python爬虫技术入门;       (4)、Python爬虫核心技术;

(5)、Python爬虫技术进阶;       (6)、文本挖掘入门;

(7)深度学习入门                   (8)、基于LSTM的文本情感分析;

(9)、疑难问题与答疑                (具体研讨内容见附件2)

                                    

联系方式 

                                                                     

联系人: 朱 苗                                  手 机:173-4652-0915

电话/传真:010-51702355            E-mail: edu@bohongkerui.com 

 

课程安排

课程主题

课程内容

第一天

Python基础与爬虫入门

第一章

Python基础

1.初识Python:开发环境安装与使用

2.基本概念

3.基本数据结构(元组、列表、字符串、字典)

4.Python基本语法:(条件、循环、函数、类、模块)

5.类介绍

6.Python文件操作实战

7.Python异常处理实战

第二章

正则表达式简介

1.正则表达式简介

2.正则表达式应用(re模块,re.compile,re.find,re.search)

3.正则表达式匹配过程

4.利用API进行数据采集

5.正则表达式解释HTML

第三章

Python爬虫技术入门

1.什么是爬虫

2.爬虫的分类和使用范围

3.爬虫基本框架

4.urllib,urllib2模块(urllib2.urlopen,urllib2.Request)

5.手动编写简单爬虫

案例一:爬取葡萄酒品质分析数据,然后对数据进行整理汇总,可视化展示.

案例二:抓取分析手机号码.

案例三:手动编写简单爬虫并实战.

第二天

Python爬虫技术进阶

第四章

Python爬虫技术

1.抓取策略和ULR去重      2.数据存储

3.数据解释和提取        4.模拟登陆及验证码识别

5.爬虫的攻防之道与可视化爬虫

第五章

Python爬虫技术进阶

 

1.著名爬虫框架介绍

(portia,Pyspider,Newspaper,Python-goose)

2.Scrapy爬虫框架

(spider,engine,scheduler,downloader,item   pipeline)

3. Scrapy开发流程

4. Scrapy与Urllib的整合使用

案例一:提取当当书目信息,然后对数据进行整理汇总,可视化展示.

案例二:应用Scrapy爬取名人名言

第三天

文本分析基础和进阶

第六章

文本挖掘入门

1.介绍文本分词的方法

2. 按词性提取关键词

Jieba模块,nltk模块(jieba.cut,jieba.cut_for_search())

第七章

深度学习入门

1.深度学习的前世今生

2.人工神经网络ANN  TensorFlow模块,keras模块

第八章

基于LSTM的文本情感分析

1.什么是LSTM     2.文本的情感分析

3.从用户评价中提取用户对事物的评价

4.分析用户对产品的态度和情感

案例一:手写数字图像识别

案例二:提取用户对事物的评价和对产品的态度和情感

疑难解答

学员可结合自身感兴趣需要解决的疑难问题,可带着相关问题咨询授课老师。

附件三:                                                                  

“Python爬虫与文本挖掘实例技术与应用”培训班回执表

(传真电话:010—51702355)(多人报名此表可复制填写)

 

单   位   信   息

开票抬头

 

所属行业

 

纳税人识别号

 

开票项目

□会议费       □培训费       □资料费      □会务费

选   择

单位地址

 

邮       编

 

联 系 人

 

部    门

 

职       务

 

办公电话

 

手    机

 

邮       箱

 

需求反馈

①   

②   

③   

④   

   员   信   息

姓名

性别

部门

职务/职称

手机

邮箱

传真

             
             
             
             
             

会议费用:

 

万         仟       佰       拾       元

房 间 预 订

□是        □否

()单间()标间

入住时间(      )

入住天数(      )

咨询顾问:  朱 苗                                手    机: 173-4652-0915

咨询热线: 010-51702355                   邮    箱: edu@bohongkerui.com

缴费方式:√        □ 银行转账        □ 缴纳现金      □    现场刷卡                                  

户       名: 北京博宏科睿教育科技有限公司

帐     号:  1100 1094 1000 5300 8453

开  户  行:中国建设银行北京古城支行

加载中
返回顶部
顶部