Форум портала

Форум портала "Архивы России" (http://forum.rusarchives.ru/index.php)
-   Технологии сайтостроения (http://forum.rusarchives.ru/forumdisplay.php?f=39)
-   -   Зачем нужна индексация сайта? (http://forum.rusarchives.ru/showthread.php?t=5297)

Елена Суслова 09.02.2013 09:17

Зачем нужна индексация сайта?
 
Зачем нужна индексация страниц сайта поисковыми системами?

Если некоторая страница занесена в индекс поисковика, то она может быть показана в результатах поиска. Если страница в индексе отсутствует, то поисковая система ничего не знает о ней, и, следовательно, никак не может использовать информацию с этой страницы.
Простой способ проверить знает ли о вашем сайте или части сайта поисковик, такой как Гугл, надо в поисковой строке набрать
site:ИМЯ сайта.

Приведу примеры:
Архивы России site:www.rusarchives.ru - 734 000
Его поддомены (составляют вышеуказанное количество страниц):
БД Путеводители: site:guides.rusarchives.ru - 591 000
Победа: site:victory.rusarchives.ru - 3 950
Форум: site:forum.rusarchives.ru 16 000
Центральный фондовый каталог: site:cfc.rusarchives.ru – 9

Росархив: site:www.archives.ru – 2 540

Несколько сайтов, которым уделялось внимание в этом направлении:
Сайт ПермГАНИ: site:www.permgani.ru – 104 000
Сайт Архивной службы Ярославской области: site:www.yar-archives.ru – 188 000
Только каталог фондов Архивной службы Пермского края: site:www.agarh.permkrai.ru/af/ - 1 060 000

Для сравнения:
Русская Википедия: site:ru.wikipedia.org – 1 730 000

Проверьте свой сайт!

Andrew 09.02.2013 13:08

Цитата:

Сообщение от Елена Суслова (Сообщение 13573)
Зачем нужна индексация страниц сайта поисковыми системами?

Давайте уточним формулировку: речь ведь идёт не просто о страницах сайта, а об автоматически создаваемых при обращении к различным базам и каталогам (динамических) страницах сайта, не так ли?

Ни у одного из перечисленных сайтов нет ни миллиона, ни ста тысяч статических страниц. Значит, все эти гигантские цифры связаны с индексированием динамических страниц, и сравнивать их с Википедией, в которой страницы делаются "вручную", не совсем корректно :)

Конечно, индексирование динамических страниц дело хорошее и нужное, но большие цифры не всегда являются объективным показателем. Если, например, вместо 100 динамических страниц, создаваемых по отдельным записям в базе, проиндексировать всего одну, в которой есть все эти 100 записей, эффект с точки зрения поиска будет один и тот же, а вот статистика в 100 раз ухудшится.

Елена Суслова 09.02.2013 20:33

Давайте уточним!
Вернее разберемся. Что такое Википедия? Это та же база данных, только пополняется она людьми через Интернет, а при обращении к ней формируется страница. Архивную базу данных так же формируют люди, только в основном оффлайн, а затем она попадает в Интернет.
Статических страниц в классическом понимании (вручную созданный файл html) сейчас почти не осталось. Поисковику без разницы динамические страницы или статические и эффект тут одинаковый.
Страница проиндексирована – значит ее информация доступна для поиска – вот и все.

Большая проблема кроется в том, что информация некоторых баз совсем закрыта, что я пыталась продемонстрировать.

Lateral 11.03.2013 15:16

Елена, это поисковики ещё не научились проникать внутрь таких ресурсов как "Центральный фондовый каталог" или техническая недоработка ЦФК? Каким пряником заманить Гугл в "закрытые" БД?

kareta 12.03.2013 00:30

Цитата:

Сообщение от Lateral (Сообщение 13869)
Елена, это поисковики ещё не научились проникать внутрь таких ресурсов как "Центральный фондовый каталог" или техническая недоработка ЦФК? Каким пряником заманить Гугл в "закрытые" БД?

потому они и закрытые )))

пишешь тег noindex и гугл туда не полезет уже )

На примере обычного интернет-магазина. Всего проиндексировано 13000 страниц, из их в основной выдаче 50%, Это означает что теоретически в результатах поиска половина страниц не появится так как она находится в самплементал ("сопли") выдаче, которая не принимает участия в поиске

Елена Суслова 13.03.2013 12:03

Конечно, это техническая недоработка ЦФК. Чтобы Гугл увидел внутренние, динамически формируемые страницы, он должен найти ссылки на них. А у ЦФК есть только одна страница – с поисковым полем. Здесь могла бы помочь страница с перечнем фондов в виде ссылок.
Сейчас Гугл проиндексировал 9 страниц, из них 5 – это конкретные страницы фондов. Значит, кто-то где-то прописал эти ссылки, их то и увидел Гугл. Мы посмотрели и обнаружили, что ссылки эти размещены как раз в обсуждениях данного форума.
Если принципиально важно устраивать вход в базу только через поиск, то есть «пряник», который сможет оценить Гугл – это создание специальной карты сайта (но не структуры, а страниц базы данных), которая потом передается Гуглу через специальные инструменты.
А пока перейти в ЦФК можно только с сайта «Архивы России» и «Росархива», ну и по баннерам, к сожалению.


Часовой пояс GMT +4, время: 19:36.

Powered by vBulletin® Version 3.8.6
Copyright ©2000 - 2019, Jelsoft Enterprises Ltd. Перевод: zCarot
© Портал "Архивы России", 2008-2015