-
Notifications
You must be signed in to change notification settings - Fork 1
/
avviaSpider.php~
executable file
·92 lines (73 loc) · 2.84 KB
/
avviaSpider.php~
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
<?php
$idBtnAvvioRicerca = 'avviaRicerca';
$nomeCheckList = 'elencoProfSelezionati';
if(isset($_GET[$idBtnAvvioRicerca])){
$hostname = 'localhost';
$username = 'root';
$password = '';
$database_name = 'dbspider';
try {
/*connessione*/
$dbh = new PDO("mysql:host=$hostname;dbname=$database_name", $username, $password);
/*deselezione di tutti i campi*/
$stmt = $dbh->prepare('UPDATE professori SET selezionato=FALSE, contatore=0'); /*stmt = statement*/
$stmt->execute();
/*seleziono solo i prof che sono stati selezionati dell'utente*/
foreach($_GET['elencoProfSelezionati'] as $professore){ //elencoProfSelezionati è un array contenente le checkbox selezionate
$stmt->closeCursor();
$stmt = $dbh->prepare('UPDATE professori SET selezionato=TRUE WHERE idProf=:idProf'); //stmt = statement
$stmt->bindParam(':idProf', $professore, PDO::PARAM_INT);
$stmt->execute();
}
$stmt->closeCursor();
$stmt = $dbh->prepare('SELECT dominio, urlPartenza FROM indirizzi');
$stmt->execute();
$risultati = $stmt->fetchAll();
echo '<h3>Sto avviando gli spider...</h3>';
$stmt->closeCursor();
$stmt = $dbh->prepare('SELECT * FROM indirizzi'); /*stmt = statement*/
$stmt->execute();
$risultati = $stmt->fetchAll();
/*avvio degli spider*/
/*$cmd = 'scrapy crawl spiderRicerca -a allowed_domain=[';
foreach($risultati as $sitoWeb){
$cmd = $cmd .'"' .$sitoWeb['dominio'] .'"' .',';
}
$cmd = $cmd .'] -a start_url=[';
foreach($risultati as $sitoWeb){
$cmd = $cmd .'"' .$sitoWeb['urlPartenza'] .'"' .',';
}
$cmd = $cmd .']';
$programma = escapeshellcmd($cmd);
echo 'Avviato spider: ' .$cmd .'<br>';
echo shell_exec($programma);*/
echo 'test <br>';
echo 'path: ' .__DIR__ .'<br>';
$cmd = escapeshellcmd('python ' .__DIR__ .'/test.py');
echo "cmd: $cmd <br>";
//echo shell_exec($cmd);
/*$cmd = "";
foreach($risultati as $sitoWeb){
$programma = escapeshellcmd('python ./test.py "scrapy crawl spiderRicerca -a allowed_domain=' .$sitoWeb['dominio'] .' -a start_url=' .$sitoWeb['urlPartenza'] .'"');
echo 'Avviato spider: ' .$programma .'<br>';
echo shell_exec($programma) .'<br>';
//$cmd = $cmd ." && " .$programma;
}*/
//echo (exec($programma) != NULL ? "OK" : "Error") .'<br>';
//shell_exec('scrapy crawl spiderRicerca -a allowed_domain=itiscuneo.gov.it -a start_url=http://www.itiscuneo.gov.it/');
$stmt->closeCursor();
/*disconnessione*/
$dbh = null;
/*redirecting alla pagina dei risultati*/
/*header("Location: classifica.php");
die();*/
}
catch(Exception $e)
{
echo $e->getMessage();
}
}
else{
echo 'Tu non puoi accedere direttamente a questa pagina';
}
?>