跳转到主要内容
泰山老虎 提交于 9 February 2014
 基于Drupal的网页数据采集培训班    您有没有这样的需求: 1、定时采集新闻、文章等任何您想采集的内容,并自动发布到您的网站。 2、从指定网站抓取所需数据,通过分析和处理后保存到您的数据库。 3、通过自动采集,可以监控论坛等社区类网站,让您第一时间发现您所关注的内容。 4、可以批量下载PDF、RAR、图片等各种文件,并同时采集其相关信息。 …   还有更多您想到,我们却没有想到的信息抓取功能,等待着您去发掘。      您有没有遇到过这样的困惑: 使用Java开发的采集器、火车头采集器,数据采集下来无法直接发布到CMS系统中去,两者集成真是费事。 您有没有在采集的过程中,遇到这样的问题,无法定时定点的监控对应的信息? 采集下来的数据,发布的时候,需要人工的标引数据,费事费力? 一个企业版的信息监控系统,动辄几十万,上百万,投入大,产出小,还不好用。 。。。     亲,您已经out了。采用Drupal,基于Feeds模块,上面的需求都可以满足,上面的困惑不再有。        亲,我们将在2014.4.5---2014.4.6,在北京举办DRUPAL网页数据采集的培训班,两天学费1500元,单天学费1000元,可以开发票。   亲,面对这些众多棘手的需求和困惑,此次简短的2天讲座会将亲的疑问一一解开,2天的时间,解决的是2个月,2年甚至更长时间所困扰亲的问题。最低的价格,最全讲座,最深的剖析,按照目前的市场价格,花15000也学不到这么多!!      讲师介绍:葛红儒      “Think in Drupal”站长(http://www.thinkindrupal.com/),《Drupal实战》的作者,《Think in Drupal》系列中文资料作者,Field validation,Image URL formatter等知名模块的作者,全球Drupal大会奖学金获得者。     贡献过多个与Feeds相关的模块(https://drupal.org/user/174740),Field collection feeds,Feeds Tamper: Search term by field,Feeds Smart Parser。使用 Feeds,帮助外研社实现几十个网站之间的数据同步。    第一天《Feeds模块基础》 1. 帮助搭建安装两个实例网站: 当当图书抓取,普通网页抓取,让大家学以致用。 2. 讲解Feeds的基本概念,抓取器、解析器、处理器。 3. 使用Feeds导入省市县数据CSV格式,让大家对Feeds的操作有一个初步的认识 4. 使用Feeds抓取RSS数据,让亲们初次体验抓取网上数据资源。 5. 使用Feeds抓取RSS数据,抓全文哦,让亲们初次体验收割别人数据的快感。   第二天《网页数据采集详解》 6. 为大家演示Feeds抓取任意的HTML数据 7. Xpath规则初步 8. feeds crawler + feeds xpathparser + feeds selfnode processor + feeds smartparser详解 9,编码转码揭秘 10. 问题与答疑 报名联系人: 崔克俊  qq:372948992 cuikejun@qq.com 手机 13681445347 13381113196                                北京亚艾元软件有限责任公司                                         2014-02-09  
Drupal 版本