The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Первый релиз многопоточного HTML-парсера MyHTML, opennews (ok), 13-Июл-16, (0) [смотреть все] +1

Сообщения [Сортировка по времени | RSS]


9. "Первый релиз многопоточного HTML-парсера MyHTML"  –2 +/
Сообщение от Пользователь Debian (?), 13-Июл-16, 21:33 
Ну, вообще-то реальный веб это не HTML5.

Парсер для настоящего (а не сферического в вакууме) браузера, к сожалению, должен поддерживать различные ухищрения чтобы парсить кривой HTML и XHTML различных версий.

Ответить | Правка | Наверх | Cообщить модератору

31. "Первый релиз многопоточного HTML-парсера MyHTML"  +/
Сообщение от Crazy Alex (ok), 14-Июл-16, 08:37 
Это веб пятилетней давности. Сейчас - либо HTML5, либо что-то, где идеальная отрисовка на фиг не нужна.
Ответить | Правка | Наверх | Cообщить модератору

45. "Первый релиз многопоточного HTML-парсера MyHTML"  +3 +/
Сообщение от lastmacemail (?), 14-Июл-16, 10:44 
> Ну, вообще-то реальный веб это не HTML5.
> Парсер для настоящего (а не сферического в вакууме) браузера, к сожалению, должен
> поддерживать различные ухищрения чтобы парсить кривой HTML и XHTML различных версий.

Всё это парсер делает. Всё ровно так же как современные браузеры. Спецификация HTML оговаривает что и как должно происходить в "непонятных" ситуациях.

В спецификации можно посмотреть здесь:
An introduction to error handling and strange cases in the parser:
https://html.spec.whatwg.org/multipage/syntax.html#an-introd...

Adoption agency algorithm:
https://html.spec.whatwg.org/multipage/syntax.html#adoption-...

Ответить | Правка | К родителю #9 | Наверх | Cообщить модератору

59. "Первый релиз многопоточного HTML-парсера MyHTML"  +1 +/
Сообщение от Аноним (-), 14-Июл-16, 12:35 
> Не испытывает проблем если на вход подать бинарный файл или невалидный HTML;
Ответить | Правка | К родителю #9 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру