Яндекс рассказал о работе над валидатором семантической разметки
Недавно увидел свет новый валидатор микроразметки в сервисе «Яндекс.Вебмастер», а теперь команда разработчиков рассказала пользователям о том, как и для чего они это сделали. Основное назначение этого инструмента — помочь вебмастерам избегать ошибок при использовании микроразметки. Подобные валидаторы существуют уже не один год, но в большинстве они далеки от универсальности, специалистам же «Яндекса» удалось создать такой, который корректно проверяет самые разные форматы. В итоге новый валидатор понимает все популярные типы микроразметки, помогая проверить даже те, которые пока не поддерживаются «Яндексом».
Источник: Seopult
Вот небольшая выдержка о schema.org из этой статьи:
Со словарем schema.org тоже не всегда удобно работать. В реальном мире микроразметка работает иначе, чем она могла бы работать в идеальных условиях.
Например, для ссылок можно разметить только url. Однако в самом тексте ссылки может содержаться полезная информация. Поэтому наш парсер сейчас сохраняет не только ссылку – как нужно было бы делать по спецификации – но и текст:<a onclick="(new Image()).src='/rg/title-overview/director-1/images/b.gif?link=%2Fname%2Fnm0000487%2F';" href="/name/nm0000487/" itemprop="director">Ang Lee</a></div>
Если разбирать этот пример по правилам, то в поле «режиссер» будет расположена только ссылка "/name/nm0000487/", однако в большинстве случаев такой информации недостаточно. Поэтому наш парсер извлечет данные следующим образом:director
href = /name/nm0000487/
text = Ang Lee