Проблема с парсингом русских тегов #47

Ivanelgran · 2019-04-30T12:59:08Z

При попытке вызова функции get_media() с числом записей - 1000, для любого тега из кириллицы, например "#коты", выдает ошибку:
File "/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/http/client.py", line 1212, in putheader
values[i] = one_value.encode('latin-1')
UnicodeEncodeError: 'latin-1' codec can't encode characters in position 33-35: ordinal not in range(256)

Проблема решилась изменение кодировки obj из utf-8 в url-encoded, в файле agents.py
Можно ли предусмотреть решение этой проблемы в будущих версиях, или я упустил уже существующее?)

OlegYurchik · 2019-04-30T13:03:51Z

Можно предусмотреть, сделайте, пожалуйста, pull request с Вашими изменениями, и прикрепите максимально возможную информацию об ошибке, мне это очень поможет!

tapakeht · 2020-09-20T13:08:52Z

Можно предусмотреть, сделайте, пожалуйста, pull request с Вашими изменениями, и прикрепите максимально возможную информацию об ошибке, мне это очень поможет!

pyInstagram/instagram/agents.py

Line 140 in de64958

    
           referer="https://instagram.com/" + obj.base_url + getattr(obj, obj.primary_key),

В 140 строке необходимо добавить quote (предварительно импортировав from urllib.parse import quote):

referer="https://instagram.com/" + obj.base_url + quote(getattr(obj, obj.primary_key)),

Это касаемо get_media при использовании WebAgent() для поиска медиа по тегам.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Проблема с парсингом русских тегов #47

Проблема с парсингом русских тегов #47

Ivanelgran commented Apr 30, 2019

OlegYurchik commented Apr 30, 2019

tapakeht commented Sep 20, 2020

Проблема с парсингом русских тегов #47

Проблема с парсингом русских тегов #47

Comments

Ivanelgran commented Apr 30, 2019

OlegYurchik commented Apr 30, 2019

tapakeht commented Sep 20, 2020