Posted in

Google и Schema.org отвориха статистиката за използването на structured data

Schema.org, съвместно с Google, публикуваха отворен датасет (dataset) със статистика за използването на Schema.org термините в публичната мрежа.

За SEO специалистите това е полезна новина: сега вече може да се види колко често различните видове schema markup се използват реално в сайтовете. При това не на ниво предположения или отделни казуси, а въз основа на агрегирани данни от инфраструктурата за публично уеб crawling на Google (Google public web crawling infrastructure).

Данните са достъпни в официалното GitHub хранилище на Schema.org във формати CSV и JSON. Например във файла 2026_05.csv можете да намерите списък с термините, техния тип и bucket (категория) според броя на домейните, които използват конкретния schema term.

Важен нюанс: Това не е точният брой URL адреси, нито броят на schema обектите на страниците. Данните се агрегират на ниво домейни. Тоест, ако даден сайт използва Product schema на 100 000 страници, той пак се брои като един домейн, който използва този тип.

Освен това Google не показва точни числа. Вместо това се използват диапазони:

  • < 1K;
  • 1K – 10K;
  • 10K – 100K;
  • 100K – 1M;
  • 1M – 10M;
  • 10M+.

Сред най-разпространените schema types в най-горния bucket могат да се видят базови типове, които често се срещат в големите сайтове:

  • WebPage;
  • WebSite;
  • Organization;
  • BreadcrumbList;
  • ListItem.

Защо това е важно за SEO:

  1. Може да се проверява популярността на даден schema type Ако планирате да внедрите нов тип структурирани данни, сега можете да проверите колко разпространен е той в мрежата. Това помага за аргументиране на приоритетите пред клиента, екипа или разработчиците.
  2. Могат да се разграничат масовите от нишовите schema типове Например WebPage, Organization или BreadcrumbList са базови типове, които често се използват в огромен брой сайтове. От друга страна, по-тесните типове за медицина, правителство (government), образование (education) или наука (science) може да имат нисък bucket не защото са „лоши“, а защото се прилагат в по-малък брой ниши.
  3. Може да се изгради бенчмарк (benchmark) за одит на структурирани данни По време на одит вече можете не просто да пишете „добавете schema“, а да обясните кои типове са стандартни за повечето сайтове, кои са необходими конкретно за вашата вертикала (vertical) и кои може да са експериментални или по-малко разпространени.
  4. Полезно е за SEO инструменти и автоматизация Датасетът може да се използва в скриптове, вътрешни SEO чекери или парсери. Например, автоматично да се маркират schema types според нивото им на разпространение, което да помага на SEO специалиста по-бързо да приоритезира внедряването им.
  5. Популярността на дадена schema не е равна на SEO ефект Ако даден schema type се използва в милиони домейни, това не означава, че той сам по себе си осигурява ranking boost. И обратното: ако даден тип е в bucket < 1K, това не означава, че не трябва да се използва. Най-важното е съответствието с контента на страницата, указанията на Google (guidelines) и реалната полза за машинното разбиране (machine understanding).

Какво можете да направите още сега:

  1. Отворете GitHub хранилището на Schema.org.
  2. Изтеглете файла 2026_05.csv.
  3. Проверете schema типовете, които вече се използват на вашия сайт.
  4. Вижте техния Domain Bucket.
  5. Намерете типове, които са подходящи за вашата ниша, но все още не са внедрени.
  6. Проверете маркировката чрез Schema Markup Validator и Rich Results Test.
  7. Добавете това към регулярния одит на структурираните данни (structured data audit).

Основен извод: Структурираните данни стават все по-измерима част от SEO.

Сега можем не само да проверяваме валидността на schema в даден сайт, но и да виждаме как различните schema terms се използват в мащаба на целия уеб. Това не замества SEO логиката, но предоставя по-силен, подкрепен с данни (data-backed) аргумент за приоритезиране на структурираните данни.

Източници:

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

For split screen (more stable clocks and bandwidth than handheld).