コマンドラインでWebページのキャプチャーを取る MacOS X 10.4編
コマンドラインでWebページのキャプチャーを取る MacOS X 10.4編
0.改訂履歴
1.はじめに
このドキュメントでは,コマンドラインでWebページをキャプチャーして画像ファイルに保存するweb2pngのインストールと利用方法の手順を
説明する. web2pngは,Safari等で使われているWebKitのCライブラリにPyObjCというObjective
Cとのブリッジを行うライブラリを使用して,Pythonというスクリプト言語でアクセスして動作する.
今回利用した環境はMacOS X
10.4.11で,Xcodeがインストールされており,PythonはインストールされているがPyObjCは無いのでインストールする.
2.プログラムの入手
- プログラムを入手する.
- このページのインストール方法にある,"Download"のキーワードがリンクになっている.
- ダウンロードする.
ivory:/Users/ujpadmin ujpadmin# curl -O http://www.paulhammond.org/2009/03/webkit2png -0.5/webkit2png-0.5.txt % Total % Received % Xferd Average Speed Time Time Time Current Dload Upload Total Spent Left Speed 100 11656 100 11656 0 0 8797 0 0:00:01 0:00:01 --:--:-- 19795 ivory:/Users/ujpadmin ujpadmin#
|
ivory:/Users/ujpadmin ujpadmin# ls -la webkit2png-0.5.txt -rw-r--r-- 1 ujpadmin ujpadmin 11656 Mar 30 11:59 webkit2png-0.5.txt ivory:/Users/ujpadmin ujpadmin#
|
- テキストファイルなので,拡張子を付ける様に名前を変更する.
ivory:/Users/ujpadmin ujpadmin# mv webkit2png-0.5.txt webkit2png.py ivory:/Users/ujpadmin ujpadmin#
|
3.PythonとPyObjCの環境の確認
ivory:/Users/ujpadmin ujpadmin# python -V Python 2.3.5 ivory:/Users/ujpadmin ujpadmin#
|
ivory:/Users/ujpadmin ujpadmin# locate pyobjc_core ivory:/Users/ujpadmin ujpadmin#
|
4.PyObjCのインストール
- 以下のURLからイメージファイルをダウンロードする.
- PyObjC The Python <-> Objective-C Bridge
- インストールが完了した.OSのリブート等は必要ない.
5.Webページのキャプチャを取る
ivory:/Users/ujpadmin ujpadmin# python webkit2png.py http://www.ujp.jp Fetching http://www.ujp.jp ... ... done ivory:/Users/ujpadmin ujpadmin#
|
ivory:/Users/ujpadmin ujpadmin# ls -lat *.png -rw-r--r-- 1 ujpadmin ujpadmin 31013 Mar 30 12:49 wwwujpjp-clipped.png -rw-r--r-- 1 ujpadmin ujpadmin 1649590 Mar 30 12:49 wwwujpjp-full.png -rw-r--r-- 1 ujpadmin ujpadmin 219127 Mar 30 12:49 wwwujpjp-thumb.png ivory:/Users/ujpadmin ujpadmin#
|