-
Notifications
You must be signed in to change notification settings - Fork 2
/
batch_screen_copy.sh.181114.1108
executable file
·110 lines (64 loc) · 2.06 KB
/
batch_screen_copy.sh.181114.1108
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
#!/usr/bin/env bash
#petit script pour faire une copie d'écran des homes pages d'une liste de sites web qui se trouvent dans un fichier .csv
#zf181113.1336
#source: https://www.cyberciti.biz/faq/unix-linux-bash-read-comma-separated-cvsfile/
zNAME="batch_copy_screen"
echo -e "
Afin de pouvoir garder $zNAME en marche tout en pouvant quitter la console, il serait bien de le faire tourner dans un 'screen' avec:
screen -S $zNAME pour entrer dans screen
./start.sh pour lancer le serveur WEB dans screen
CTRL+a,d pour sortir de screen en laissant tourner le serveur
screen -r $zNAME pour revenir dans screen
screen -x $zNAME pour revenir à plusieurs dans screen
CTRL+d pour terminer screen
screen -list pour lister tous les screens en fonctionement
"
read -p "Appuyer une touche pour démarrer $zNAME"
echo ---------- start
rm -Rf ./images
mkdir ./images
INPUT=./data/liste_sites.csv
#urls_test.csv.181029.1722
#urls_test.csv.181113.1156
#urls_test.csv.181029.1722
#INPUT=./liste_sites.csv
OLDIFS=$IFS
IFS=,
[ ! -f $INPUT ] && { echo "$INPUT file not found"; exit 99; }
nblines=0
while read name ip ; do
echo $nblines
if [ $nblines != "0" ]
then
site=$name".epfl.ch"
echo -e "site: "$site
url="http://"$site
echo -e "url: "$url
# rm tmp.txt
# curl --connect-timeout 1 $url -o tmp.txt 2>/dev/null
# t1=`wc -c tmp.txt |awk '{print $1}'`
# if [ $t1 != 0 ]
# then
# echo -e "t1: "$t1
./screen_copy.sh $url "./images/http_"$site
# fi
url="https://"$site
echo -e "url: "$url
# rm tmp.txt
# curl --connect-timeout 1 $url -o tmp.txt 2>/dev/null
# t1=`wc -c tmp.txt |awk '{print $1}'`
# if [ $t1 != 0 ]
# then
# echo -e "t1: "$t1
./screen_copy.sh $url "./images/https_"$site
# fi
fi
((nblines+=1))
echo ""
done < $INPUT
IFS=$OLDIFS
exit
echo -e "
il y a comme nombre de pages HTML:
"
find ./html |grep '\.html' |wc