UJP - 技術情報1

Life is fun and easy!

不正IP報告数

Okan Sensor
 
メイン
ログイン
ブログ カテゴリ一覧

コマンドラインでWebページのキャプチャーを取る MacOS X 10.4編

コマンドラインでWebページのキャプチャーを取る MacOS X 10.4編


0.改訂履歴

  • 2010.03.30 新規作成

1.はじめに

 このドキュメントでは,コマンドラインでWebページをキャプチャーして画像ファイルに保存するweb2pngのインストールと利用方法の手順を 説明する. web2pngは,Safari等で使われているWebKitのCライブラリにPyObjCというObjective Cとのブリッジを行うライブラリを使用して,Pythonというスクリプト言語でアクセスして動作する.
 今回利用した環境はMacOS X 10.4.11で,Xcodeがインストールされており,PythonはインストールされているがPyObjCは無いのでインストールする.

2.プログラムの入手

  • プログラムを入手する.
  • このページのインストール方法にある,"Download"のキーワードがリンクになっている.
  • ダウンロードする.
ivory:/Users/ujpadmin ujpadmin# curl -O http://www.paulhammond.org/2009/03/webkit2png
-0.5/webkit2png-0.5.txt

% Total % Received % Xferd Average Speed Time Time Time Current
Dload Upload Total Spent Left Speed
100 11656 100 11656 0 0 8797 0 0:00:01 0:00:01 --:--:-- 19795
ivory:/Users/ujpadmin ujpadmin#
  • ダウンロードしたファイルは次の通り.
ivory:/Users/ujpadmin ujpadmin# ls -la webkit2png-0.5.txt 
-rw-r--r-- 1 ujpadmin ujpadmin 11656 Mar 30 11:59 webkit2png-0.5.txt
ivory:/Users/ujpadmin ujpadmin#
  • テキストファイルなので,拡張子を付ける様に名前を変更する.
ivory:/Users/ujpadmin ujpadmin# mv webkit2png-0.5.txt webkit2png.py
ivory:/Users/ujpadmin ujpadmin#
  • インストールする場所はどこでも良い.

3.PythonとPyObjCの環境の確認

  • Pythonのバージョンを調べる.
ivory:/Users/ujpadmin ujpadmin# python -V
Python 2.3.5
ivory:/Users/ujpadmin ujpadmin#
  • pyobjcのバージョンを調べる.
ivory:/Users/ujpadmin ujpadmin# locate pyobjc_core
ivory:/Users/ujpadmin ujpadmin#
  • インストールされてない.

4.PyObjCのインストール












  • カスタマイズボタンを押す.


  • インストールされるモジュールが確認できる.




  • インストールが完了した.OSのリブート等は必要ない.

5.Webページのキャプチャを取る

  • webkit2pngを使用し,キャプチャを取る.
ivory:/Users/ujpadmin ujpadmin# python webkit2png.py http://www.ujp.jp
Fetching http://www.ujp.jp ...
... done

ivory:/Users/ujpadmin ujpadmin#
  • キャプチャを取得したファイルを確認する.
ivory:/Users/ujpadmin ujpadmin# ls -lat *.png
-rw-r--r-- 1 ujpadmin ujpadmin 31013 Mar 30 12:49 wwwujpjp-clipped.png
-rw-r--r-- 1 ujpadmin ujpadmin 1649590 Mar 30 12:49 wwwujpjp-full.png
-rw-r--r-- 1 ujpadmin ujpadmin 219127 Mar 30 12:49 wwwujpjp-thumb.png

ivory:/Users/ujpadmin ujpadmin#
  • 問題なく取得できた.


広告スペース
Google