Class: HotPixiv::Download
- Inherits:
-
Object
- Object
- HotPixiv::Download
- Defined in:
- lib/hotpixiv/download.rb
Instance Method Summary collapse
-
#download(list, keyword, &block) ⇒ Object
画像ダウンロード.
-
#download_from(url, keyword) ⇒ Object
画像をダウンロード.
-
#esc(data) ⇒ Object
文字列にダブルクオートが含まれている場合は置換する.
-
#get_url(data) ⇒ Object
画像URLを取得.
-
#query(keyword, page) ⇒ Object
リクエストパラメータを作成.
-
#run(params, &block) ⇒ Object
ダウンロードを開始する.
-
#save_image(url, keyword) ⇒ Object
画像を保存する.
-
#trim(data, i) ⇒ Object
パラメータを整形.
- #valiable_set(params) ⇒ Object
Instance Method Details
#download(list, keyword, &block) ⇒ Object
画像ダウンロード
50 51 52 53 54 55 56 |
# File 'lib/hotpixiv/download.rb', line 50 def download(list, keyword, &block) Runner.parallel(list) do |url| (download_from url, keyword).each do |res| block.call(res.keys.pop, res.values.pop) end end end |
#download_from(url, keyword) ⇒ Object
画像をダウンロード
59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 |
# File 'lib/hotpixiv/download.rb', line 59 def download_from(url, keyword) = [] begin save_image(url, keyword) << {:info => url} # マンガの場合 rescue OpenURI::HTTPError begin 0.upto(Float::INFINITY) do |page| url_with_page = url.gsub(/(\d*)\.[jpg|png|gif]{3}/) do |matched| f = matched.split(/\./) "#{f[0]}_p#{page}.#{f[1]}" end save_image(url_with_page, keyword) << {:info => url_with_page} end rescue SocketError => e << {:error => "#{url} - #{e.}"} rescue OpenURI::HTTPError; end end end |
#esc(data) ⇒ Object
文字列にダブルクオートが含まれている場合は置換する
23 24 25 |
# File 'lib/hotpixiv/download.rb', line 23 def esc(data) data.gsub(/\"\"\"/, "\"'").gsub(/\"\"/, "'") end |
#get_url(data) ⇒ Object
画像URLを取得
34 35 36 37 38 39 40 41 42 43 44 45 46 47 |
# File 'lib/hotpixiv/download.rb', line 34 def get_url(data) point = POINT_BORDER e = [] i = 0 # 文字列にダブルクオートが含まれている場合は置換する esc(data).scan(/\"(.*?)\"/) do |d| e << trim(d[0], i) i += 1 end # 総合点:e[16], 評価回数:e[15], 閲覧回数:e[17] # サーバID:e[4], ユーザID:e[6], 画像ID:e[0], 拡張子:e[2] url = "http://img#{e[4]}.pixiv.net/img/#{e[6]}/#{e[0]}.#{e[2]}" e[16].to_i >= point && !!(URL_REGEXP =~ url) ? url : nil end |
#query(keyword, page) ⇒ Object
リクエストパラメータを作成
9 10 11 12 13 |
# File 'lib/hotpixiv/download.rb', line 9 def query(keyword, page) {:s_mode => "s_tag", :word => keyword, :p => page}.map {|k, v| "#{k.to_s}=#{CGI.escape(v.to_s.encode('UTF-8'))}"}.join("&") end |
#run(params, &block) ⇒ Object
ダウンロードを開始する
93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 |
# File 'lib/hotpixiv/download.rb', line 93 def run(params, &block) valiable_set(params) agent = Mechanize.new agent.read_timeout = DOWNLOAD_TIMEOUT # ぺージ、キーワードのURLリストを作成 page_list = [] 1.upto(@page.to_i) do |page_no| @keywords.each do |keyword| page_list << "#{PIXIV_API_URL}search.php?#{query(keyword, page_no)}" end end # 日付のディレクトリを作成 raise "Invalid save directory path. - #{@save_dir}" unless Utils.directory?(@save_dir) @save_dir = Utils.create_path(@save_dir, DateTime.now.strftime("%Y%m%d")) Utils.create_dir(@save_dir) # 並列ダウンロード開始 puts "Downloading ..." Runner.parallel(page_list) do |page| # URLからキーワードを抽出 keyword = URI.decode($1).encode(Utils.os_encoding) if /word=(.*?)&/ =~ page # キーワードのディレクトリを作成 Utils.create_dir(@save_dir, keyword) url_list = [] site = agent.get(page) lines = (site/ '//body/p').inner_html.split(/\n/) lines.each do |line| url_list << get_url(line) end # nilのデータを削除 url_list.compact! # 画像をダウンロードする download(url_list, keyword, &block) unless url_list.empty? end end |
#save_image(url, keyword) ⇒ Object
画像を保存する
83 84 85 86 87 88 89 90 |
# File 'lib/hotpixiv/download.rb', line 83 def save_image(url, keyword) dir = Utils.create_path(@save_dir, keyword) open(url, "Referer" => REFERER) do |f| open(dir + "/" + File.basename(url), 'wb') do |output| output.write(f.read) end end end |
#trim(data, i) ⇒ Object
パラメータを整形
16 17 18 19 20 |
# File 'lib/hotpixiv/download.rb', line 16 def trim(data, i) return data.split(/\//)[4] if i == 6 return "%02d" % data if i == 4 && i.to_s.length == 1 data end |
#valiable_set(params) ⇒ Object
27 28 29 30 31 |
# File 'lib/hotpixiv/download.rb', line 27 def valiable_set(params) params.each do |k, v| self.instance_variable_set("@#{k.to_s}", v) end end |