Яндекс рассказал о работе над валидатором семантической разметки

2013-01-16 16:51:23

Недавно увидел свет новый валидатор микроразметки в сервисе «Яндекс.Вебмастер», а теперь команда разработчиков рассказала пользователям о том, как и для чего они это сделали. Основное назначение этого инструмента — помочь вебмастерам избегать ошибок при использовании микроразметки. Подобные валидаторы существуют уже не один год, но в большинстве они далеки от универсальности, специалистам же «Яндекса» удалось создать такой, который корректно проверяет самые разные форматы. В итоге новый валидатор понимает все популярные типы микроразметки, помогая проверить даже те, которые пока не поддерживаются «Яндексом».

Источник: Seopult

Вот небольшая выдержка о schema.org из этой статьи:

Со словарем schema.org тоже не всегда удобно работать. В реальном мире микроразметка работает иначе, чем она могла бы работать в идеальных условиях.

Например, для ссылок можно разметить только url. Однако в самом тексте ссылки может содержаться полезная информация. Поэтому наш парсер сейчас сохраняет не только ссылку – как нужно было бы делать по спецификации – но и текст:

<a onclick="(new Image()).src='/rg/title-overview/director-1/images/b.gif?link=%2Fname%2Fnm0000487%2F';" href="/name/nm0000487/" itemprop="director">Ang Lee</a></div> 


Если разбирать этот пример по правилам, то в поле «режиссер» будет расположена только ссылка "/name/nm0000487/", однако в большинстве случаев такой информации недостаточно. Поэтому наш парсер извлечет данные следующим образом:

director
href = /name/nm0000487/
text = Ang Lee