The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Индекс форумов
Составление сообщения

Исходное сообщение
"В Chrome началось тестирование третьей редакции манифеста, н..."
Отправлено пох., 04-Ноя-19 10:00 
> Для того что бы спарсировать приемлемо страницу браузер _не нужен_

до первой же страницы, состоящией из document.onload(...) и более ничего.
(если что - так писали пятнадцать лет назад, не рассказывайте мне историй как вы легко и просто победите эту технологию - сейчас одним скриптом не обойдетесь)

> И любой программист, коего начальство заставляет парсить страницы конкурентов,

конкурентов вашей подвальной лавочки? Боюсь, у них сайты уровня опеннета или хуже. Раз даже с вышеприведенной конструкцией вы ни разу не столкнулись. А в 2k19 модно аякс. Обратите внимание, что аякс, разумеется, манипулирует dom.

Вот вам довольно примитивный сайт: https://www.tinkoff.ru/insurance/travel/ - начинайте парсить. Чтоб рекламных блоков по пятнадцать мегабайт не видеть, а кнопку "оформить" - видеть. Вся красота - ради заполнения примитивной формы из десяти полей.

Или, еще один прекрасный образчик вжопереакта где он нахер не нужен - meduza.io - с плейсхолдерами, неназойливым фингерпринтом в css и прочей мелочишкой (врут что они так от DDoS защищаются, но что-то вряд ли).

Потом, как справитесь - перейдем к чему-нибудь действительно интересному. Типа хипстаграмма, который при попытке посмотреть подольше без авторизации загораживает картинки неубираемой заставкой "а ну, скотина, быстро залогинился, мы не можем позволить себе тратить ресурсы на того,кто не хочет пополнять relation graphs!"

 

Ваше сообщение
Имя*:
EMail:
Для отправки ответов на email укажите знак ! перед адресом, например, !user@host.ru (!! - не показывать email).
Более тонкая настройка отправки ответов производится в профиле зарегистрированного участника форума.
Заголовок*:
Сообщение*:
 
При общении не допускается: неуважительное отношение к собеседнику, хамство, унизительное обращение, ненормативная лексика, переход на личности, агрессивное поведение, обесценивание собеседника, провоцирование флейма голословными и заведомо ложными заявлениями. Не отвечайте на сообщения, явно нарушающие правила - удаляются не только сами нарушения, но и все ответы на них. Лог модерирования.



Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру