从品牌网站建设到网络营销策划,从策略到执行的一站式服务
下载VOA英语网站的相关内容,脚本如下
为两当等地区用户提供了全套网页设计制作服务,及两当网站建设行业解决方案。主营业务为网站设计、网站建设、两当网站设计,以传统方式定制建设网站,并提供域名空间备案等一条龙服务,秉承以专业、用心的态度为用户提供真诚的服务。我们深信只要达到每一位用户的要求,就会得到认可,从而选择与我们长期合作。这样,我们也可以走得更远!
要用到 Nokogiri 库。此库相关使用介绍
#!/usr/bin/ruby require 'open-uri' require 'nokogiri' www = 'http://www.51voa.com' pagelist = [] doc = Nokogiri::HTML(open(www + '/Learn_A_Word_1.html')) doc.css('div#pagelist a').each{|x| pagelist << x['href']} def get_child_page(address) list = [] doc = Nokogiri::HTML(open(address)) doc.css('div#list a').each{|x| list << x['href']} list end def download(mp3,file) File.open(file + ".mp3",'wb'){ |f| f.write(open(mp3).read) } end def writefile(txt,file) aFile = File.new(file + ".txt","w") aFile.puts txt aFile.close end pagelist.each do |address| txt, mp3, name = '' list = get_child_page(www + "/" + address) list.each do |result| doc = Nokogiri::HTML(open(www + result)) txt = doc.css('div#content').text #file txt name = doc.css('div#title').text.strip.gsub(' ','_') #name = doc.css('div#title').text.encode("GBK") 如果想保存中文名,就用String#encode方法 begin mp3 = doc.css('div#menubar a')[0]['href'] #mp3 download(mp3,name) writefile(txt,name) rescue end end end
成都网站建设公司地址:成都市青羊区太升南路288号锦天国际A座10层 建设咨询028-86922220
成都快上网科技有限公司-四川网站建设设计公司 | 蜀ICP备19037934号 Copyright 2020,ALL Rights Reserved cdkjz.cn | 成都网站建设 | © Copyright 2020版权所有.
专家团队为您提供成都网站建设,成都网站设计,成都品牌网站设计,成都营销型网站制作等服务,成都建网站就找快上网! | 成都网站建设哪家好? | 网站建设地图