2017.4.24-28成都Drupal采集技术培训班
2017.4.24-28成都Drupal采集技术培训班
一 培训目的
信息的发现 、选择、收藏、组织和分享是图情工作人员最重要的工作之一,尤其是在大数据时代,只有做好这方面的基础工作,才能满足领导的战略决策需要,满足教学科研的需要,满足读者个性化信息服务的需要。
在大数据时代,图书馆员只有快速的向数据科学家和领域专家转变,打破图书馆的传统边界,建立各种数据联盟,才能适应时代的发展。
大数据具有信息种类多,更新速度快,综合价值大等众多特性,如何精选真实、更有价值的信息,更快、更方便的采集、聚合各种信息,进而进行存储、分析是图情工作人员面临的重要挑战。
为此,特举办一系列大数据培训班:虚拟化及云计算、大数据采集、信息可视化、数据挖掘等,首先开办大数据采集培训班。
本次培训班将详细讲解Drupal 、Rss、Xpath 、Offline Explorer 、Youtubebyclick 、Lucidworks等相关技术和专业软件使用。认真参加培训的老师,将能熟练的掌握数据采集的技巧,并熟悉数据挖掘的部分技能,为将来工作带来极大便利。
二 课程概述
主要讲课内容是以为中国大陆两个最顶级的科研机构实施的数据采集项目为例,详细讲解如何对同行机构、行业学会、国际协会、各国相关政府部门、重点综合性科学出版物、重点网站、试验项目和实验设施等的新闻、论文、会议报告、分析评论、预印本、案例研究、多媒体、图书、招聘信息等进行快速的抓取、聚合及整合搜索。
课程特色:
1 经过了实践考验,是成功案例的真心分享
本课程是在给国内最顶尖的科研机构所做信息搜集案例的真心分享,反响强烈,甚至在一家单位多次做同样的分享。
2具有较强的可操作性
大部分软件具有非常便捷的操作性,简单方便。高级操作有写好的运行模版,不懂编程的,也可熟练操作。
3 具有低成本、可持续性
几乎用到的所有软件都是开源或免费软件,而且这些软件更新发展的速度很快,能不断满足信息采集的需求。
三 培训对象
适合对象:凡是从事战略研究、参考咨询、图书馆采编部门等工作的图情工作者都可参加。任何致力于更好数字化生存的机构和个人均欢迎参加。
四 时间、地点和培训费用
地点: 四川省成都市二环路北一段111号 西南交通大学图书馆
附近交通:
九里校区北门
11路 石羊场公交站→火车北站公交站
17路 今日花园→火车北站公交站
59路 美洲花园→五块石客运站
86路 茶店子公交站→北湖公交站
106路 九里堤公交站→成仁公交站
342路 中海国际→建设南路东
802路 双流客运站→北门车站
396路定制班车 电子科大清水河校区→电子科大沙河校区
九里校区西门
3路 城东客运中心→九里堤公交站
17路 今日花园→火车北站公交站
48路 牛王庙→侯家桥
56A路 和平村→九里堤公交站
56路 九里堤公交站→红砂村公交站
93路 石羊场公交站→九里堤公交站
101路 九里堤公交站→成都东客站公交站
105路 东顺路→八里桥公交站
106路 成仁公交站→九里堤公交站
119路 锦园社区→西南交大九里校区
168路 营门口北→大丰公交站
244路 营门口北→九里堤公交站
时间: 2017.4.24-4.28
费用:1500元(含教材费用),食宿自理,欢迎团体报名,价格优惠
五 培训回执
参会请于 年 月 日前填写回执,反馈至QQ或会务联络信箱:cuikejun@qq.com,需要住宿的老师,请在回执上填写注明,可统一提前预定。
联系人:崔克俊 13381113196 QQ:372948992
姓名 |
|
性别 |
|
职务 |
|
||
单位 |
|
电子邮箱 |
|
||||
地址 |
|||||||
发票抬头 |
|||||||
发票项目 |
可开 培训费 会务费 资料费等 |
||||||
联系电话 |
固定电话: 手机: |
||||||
是否住宿 |
|
住宿要求: □合住 □单间 |
|||||
北京亚艾元软件有限责任公司(主办)
2017年3月21日
附件一 讲课提纲
第1天内容
第1天 |
9:00-10:00 |
先睹为快,数据采集的2个成功案例以及如何利用数据采集技术做好学科服务、知识个性化服务 |
第1天 |
10:30 到11:30 |
全球智库排名报告解读以及根据实际情况灵活确定信息采集的类型,制定信息采集策略, |
第1天 |
2:00-3:00 |
VPN设置 如何架设Windows ,LINUX VPN服务器 |
第1天 |
3:30-4:30 |
批量下载youtube的某一频道,某一专题视频 |
第2天内容
第2天 |
9:00-- 10:00 |
利用Offline Explorer下载全部网站,网站某一类型的内容 |
第2天 |
10:30 到11:30 |
Xpath介绍 |
第2天 |
2:00-3:00 |
利用Xpath抓取清华大学建筑学院新闻 |
第2天 |
3:30-4:30 |
利用Xpath抓取CNKI部分内容 |
第3天内容
第3天 |
9:00-- 10:00 |
利用Xpath抓取某外文图书数据库内容 |
第3天 |
10:30 到11:30 |
利用Xpath抓取某外文期刊数据库内容 |
第3天 |
2:00-3:00 |
利用Xpath抓取某外文会议数据库内容 |
第3天 |
3:30-4:30 |
利用Xpath抓取某外文学位论文数据库内容 |
第4天内容
第4天 |
9:00—10:00 |
利用Xpath抓取京东图书信息 |
第4天 |
10:30 到11:30 |
利用Xpath抓取当当图书信息 |
第4天 |
2:00-3:00 |
利用Lucidworks Fusion对数据进行整合搜索和挖掘 |
第4天 |
3:30-4:30 |
利用Lucidworks Fusion对数据进行整合搜索和挖掘 |
第5天内容
第5天 |
9:00-- 10:00 |
数据可视化介绍D3.JS |
第5天 |
10:30 到11:30 |
数据可视化介绍百度 ECharts |
第5天 |
2:00-3:00 |
行业主题词表和分类表在信息组织和挖掘中的重要作用 |
第5天 |
3:30-4:30 |
大数据时代如何更好的进行专题服务、个性化服务以及发表相关论文注意事项(Drupal、PubSubHubbub介绍) |