Компания Yahoo перевела в разряд открытых проектов веб-краулер Anthelion, созданный для парсинга структурированных данных из HTML-страниц.


«Anthelion может быть нацелен на сканирование конкретных страниц. К примеру, содержащих микроразметку для фильмов», — пояснил представитель компании в анонсе на Tumblr.


В прошлом году во время конференции в Шанхае сотрудники Yahoo Labs раскрыли некоторые детали по Anthelion в статье.


«Мы – первые, кто представил идею краулера, основной задачей которого является извлечение семантических данных, встроенных в HTML-страницы с помощью микроразметки», — заявили авторы статьи.


В своей публикации они также показали, как внедрение этой технологии может увеличить число релевантных результатов по конкретным поисковым запросам.


Код проекта доступен на GitHub.


Напомним, что ранее в этом месяце Microsoft объявил о решении открыть исходный код JavaScript-движка Chakra, используемого в браузерах Microsoft Edge и Internet Explorer.




Обсудить  

Читайте также


Комментарии Кто голосовал Похожие новости

Комментарии