-
Notifications
You must be signed in to change notification settings - Fork 0
/
url-extrator.py
60 lines (47 loc) · 1.92 KB
/
url-extrator.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
import re
class ExtratorURL:
def __init__(self, url):
self.url = self.sanitiza_url(url)
self.valida_url()
def sanitiza_url(self, url):
return url.strip()
def valida_url(self):
if self.url == '':
raise ValueError('A URL está vazia')
padrao_url = re.compile('(http(s)?://)?(www.)?bytebank.com(.br)?/cambio')
match = padrao_url.match(self.url)
if not match:
raise ValueError('A URL não é válida')
def get_url_base(self):
indice_interrogacao = self.url.find('?')
url_base = self.url[:indice_interrogacao]
return url_base
def get_url_parametros(self):
indice_interrogacao = self.url.find('?')
url_parametros = self.url[indice_interrogacao + 1:]
return url_parametros
def get_valor_parametro(self, parametro_busca):
indice_parametro = self.get_url_parametros().find(parametro_busca)
indice_valor = indice_parametro + len(parametro_busca) + 1
indice_e_comercial = self.get_url_parametros().find('&', indice_valor)
if indice_e_comercial == -1:
valor = self.get_url_parametros()[indice_valor:]
else:
valor = self.get_url_parametros()[indice_valor:indice_e_comercial]
return valor
def __len__(self):
return len(self.url)
def __str__(self):
return 'URL: ' + self.url + '\n' + 'Parametros: ' + self.get_url_parametros() + '\n' + 'URL Base: ' + self.get_url_base()
def __eq__(self, other):
return self.url == other.url
url = 'https://bytebank.com.br/cambio?quatidade=100&moedaOrigem=real&moedaDestino=dolar'
extrator_url = ExtratorURL(url)
extrator_url_2 = ExtratorURL(url)
valor_quantidade = extrator_url.get_valor_parametro('quantidade')
print(valor_quantidade)
print(len(extrator_url))
print(extrator_url)
print(extrator_url == extrator_url_2)
print(id(extrator_url))
print(id(extrator_url_2))