にっき

2007/10/23 15:15:45

ぁゃιぃすくりぷと捕獲作戦


07/09/14のにっきで logwatch を使ってぁゃιぃりくえすとをりすとあっぷするのを創ったけど・・・
りすとあっぷしたのを目視で確認ってなんだかびみょ〜・・・にう?(´ω`;【みかん
ってことでぁゃιぃあどれすのふぁいるを自動収集までちゃれんぢにう☆ヾ(・ω・。【みかん
でもさ〜ばで自動収集するにはきけんがあぶないふぁいるいっぱいの可能性特大だし・・・
php ふぁいるが置かれでもちょっとはだいじょ〜ぶなろ〜かるで収集しないとかなぁ?



そんなこんなでまずは自動収集するのに便利な sf.net の wget をげっとにう☆ヾ(・x・。【みかん
いんすと〜るはてきとうなとこに置くだけでおっけぃにう d(・x・。【みかん
GUI のだうんろ〜だもいいけどやっぱり他のと連携するにはこまんどらいんで使えるのを☆
いろいろおぷしょんあるけど今回使うのは
-P {path} ←どこに DL するかを指定
-a {file} ←ろぐを指定したふぁいるに追記
-O {file} ←DL したふぁいるを保存する名前
-i {file} ←あどれす一覧ふぁいるのをまとめて取得
-x ←どめいん名毎にでぃれくとりを再現してくれるも〜ど
-nc ←ふぁいる名がばってぃんぐしたときは上書きしないでする〜
-t {num} ←接続失敗時のりとらい回数

こんなとこかなぁ?
細かい使い方が気になるかたはへるぷでも見てくださいなってことで☆

wget の動作を確認できたら次は logwatch のすくりぷとをちょっと変更して
/etc/logwatch/scripts/services/bad-request
#!/usr/bin/perl

my %url;
my $file = "/path/to/anywhere/urllist"; # ←ここにあどれすりすとを出力☆
my %list;

open(IN,"$file");
while(<IN>)
{
    chomp($_);
    $list{$_} = $_;
}
close(IN);

while(<>)
{
    if($_ =~ /=((f|ht)tps?:[^\?]*)\?/ && !exists $url{$1})
    {
        print "    $1\n";
        $url{$1} = true;
        $list{$1} = $1;
    }
}

open(OUT,">$file");
print OUT $_ . "\n" foreach(values(%list));
close(OUT);

ついでに ftp や https,ftps にも対応してこんなかんじかなぁ?
出力ふぁいるは http からあくせすできるとこで .htaccess で IP 制限しとくかんじ?
あとで見たときに暗号化しないようにちょ〜べた描きだけど気にしない気にしない(´ω`;【みかん

れっつちぇっく☆
# /usr/sbin/logwatch -service bad-request -print

 ################### Logwatch X.X.X (XX/XX/XX) ####################
        Processing Initiated: Tue Oct 23 11:14:26 2007
        Date Range Processed: yesterday
                              ( 2007-Oct-22 )
                              Period is day.
      Detail Level of Output: 0
              Type of Output: unformatted
           Logfiles for Host: XXXXXXXX
  ##################################################################

 --------------------- bad request check Begin ------------------------

     http://xxx.xxxxxxxxxx.xxx/r8.txt
     http://xxx.xxxxxx.xx/sc.txt
     ftp://xx.xx.xxx.xx/upload/071011004039p/new
     http://xxxxx.xxxxx.xxx/smile27.gif
     http://xxx.xxxxxxx.xx/userimages/id.txt
     http://xxx.xxxx.xxx.xx/induccion/site/modules/pr.txt
     http://xxxxxxxx.xxxxxxxxxx.xxx/php.txt
     http://xxx.xxxxxxxx.xx/cachesym/safe.txt
     http://xxx.xxxxxxxx.xx/cachesym/about.gif
     http://xxxxxx.xxxxxxxxxx.xx/img155/8616/idly0.gif
     http://xxxxxxx.xxx/id.txt
     http://xxx.xx.xx.xxx/tiki/id
     http://xxx.xxxxxxxxxx.xx.xx/id.txt
     http://xxx.xxxxxxxxxxx.xxx/images/canboy
     http://xxx.xxxxxxxxxxxxxxxxxx.xxx/ringtones-l5
     http://xxxxxx.xxxxxxxxxx.xx/img207/9826/osrunkv9.gif
     http://xx.x.xxx.x/xpl/safe.txt
     http://xxx.xxxxxxxx.xxxxxxx.xx/safe.gif

 ---------------------- bad request check End -------------------------


 ###################### Logwatch End #########################

ftp がすり抜けてるのを見かけて追加したけど今日は大漁・・・にう?(´ω`;【みかん

えら〜もなく無事に指定したとこにふぁいるができてたらそのふぁいるを wget で取得☆
path\to\wget>wget -P ./ {生成したふぁいるの url} -O ./urllist
--14:43:00--  {生成したふぁいるの url}
           => `./{生成したふぁいる名}'
Resolving {さ〜ば}... xxx.xx.xxx.xx
Connecting to {さ〜ば}|xxx.xx.xxx.xx|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: 2,179 [text/plain]

100%[====================================>] 2,179         --.--K/s

14:43:01 (2.08 MB/s) - `./urllist' saved [2179/2179]

こんなかんじで取得できたらさっそく保存されたふぁいるを開いてちぇっく☆
ぁゃιぃあどれすが並んでたらばっちりにう☆ヾ(・x・。【みかん

あどれすりすとの取得ができたららすとはそれを使ってまとめてご〜ご〜☆
path\to\wget>wget -P {保存場所} -i ./urllist -x -nc -t 2
---- >8 ---- 結果がいろいろ ---- >8 ----


でも毎回こんなの入力するのめんど〜だから bat ふぁいるにまとめちゃうってことで・・・
echo off
cd {path\to\wget}
wget -P ./ {生成したふぁいるの url} -a {ろぐふぁいる} -O ./urllist -t 1
wget -P {保存場所} -i ./urllist -x -nc -a {ろぐふぁいる} -t 2

こんなかんじかなぁ?
あとはすた〜とあっぷでもすけじゅ〜らでもおこのみのとこから起動するだけにう d(・x<。【みかん

とりあえずこれであどれすだけめもしたはいいけど見に行ったら消えてるなんてことは減らせるかなぁ?
なんだかおんなじようなすくりぷとがいろんなとこに置いてあるっぽいけど・・・

あっ☆
ここまでめもしといてあれだけど・・・
php を見ると無差別にあどれすを入れて爆撃してくるのなんて基本的にくらっきんぐ用すくりぷとなので,
外部からあくせすできるとこに置くとくらっか〜さんがそれを利用することができちゃいますです☆
php が動かないさ〜ばでもてきすと形式で読めると外部ふぁいるを混入するときに利用できちゃうので
取り扱いにはすてきにちういしてくださいなです☆ヾ(´ω`;【みかん
っていうかよくわかんないひとは wget で遊ぶぐらいまでかなぁ?
これもちゃんと -w おぷしょん使ったりしないとちょ〜迷惑だけど・・・


こめんと

こめんとする?



 
投稿された内容の著作権はこめんとの投稿者に帰属するっぽいです☆
また,現在 IE6 以下で Sleipnir,Lunascape,Donut じゃないゆ〜ざえ〜じぇんとからの描き込みを制限してますです☆
該当しちゃうかたはてきとうにゆ〜ざえ〜じぇんとを偽装しちゃってくださいです(´ω`;【みかん
さぶこんてんつ
前月 2024年 11月 翌月
          1
 
2
 
3
 
4
 
5
 
6
 
7
 
8
 
9
 
10
 
11
 
12
 
13
 
14
 
15
 
16
 
17
 
18
 
19
 
20
 
21
 
22
 
23
 
24
 
25
 
26
 
27
 
28
 
29
 
30
 
             
  • あじ あじ
  • ED ED
  • えでん えでん
  • えれふぃ えれふぃ
  • ぐらぶれ ぐらぶれ
  • etc etc
  • にっき にっき

あわせて読みたい

先頭に戻る
めにう 先頭に戻る