今日はtumblrの方はおやすみ。
今日の作業はhtmlの解析。
解析に前にhtmlソースコードをダウンロードするところから開始。

まず、ベースとなるurlを用意する。
次にダウンロード対象のページ数を計算すると、1400件を超えている事が分かった為、対象となるurlを生成する。
生成したurlに下位のパスを指定してあげる。
今日はここまで。
あとは明日以降に作業する。