Como motores de busca - Web Crawlers por Fahrizal Wibowo

itis os motores de busca que finalmente trazer seu site para o noticeof os potenciais clientes. Por isso, é melhor saber como thesesearch motores realmente funcionam e como eles apresentam informações para thecustomer iniciar uma pesquisa.

momento há basicamente dois tipos de motores de busca. A primeira é por crawlers ou aranhas robotscalled.

searchengines

usespiders para indexar sites. Quando você enviar páginas do seu site para asearch motor, completando sua página de envio obrigatório, thesearch motor de aranha índice vontade todo o seu site. Um programa de "aranha" isan automatizado que é executado pelo sistema de motor de busca. Spidervisits um web site, ler o conteúdo no próprio local, as tags site'sMeta e também siga os links que o site se conecta. Thespider seguida, retorna todas as informações de volta para um centraldepository, onde os dados são indexados. Ele vai visitar cada link youhave em seu site e índice esses sites também. Algumas aranhas willonly índice de um determinado número de páginas em seu site, por isso não createa site com 500 páginas!

Thespider voltará periodicamente aos locais para verificar se há anyinformation isso mudou. A frequência com que este happensis determinado pelos moderadores do motor de busca.

Aspider é quase como um livro em que ele contém a tabela de conteúdo, o conteúdo real e os links e referências para toda a websitesit encontra durante sua pesquisa, e pode indexar até um milhão de páginas aday

Exemplo:.. Excite, Lycos, AltaVista e Google

Whenyou perguntar a um motor de busca para localizar informações, é actuallysearching através do índice que criou e não actuallysearching a Web. Diferentes motores de busca produzir differentrankings porque não cada mecanismo de busca usa o mesmo algoritmo tosearch através dos índices.

oneof as coisas que um motor de busca algoritmo para varreduras é A freqüência ea localização das palavras-chave em uma página web, mas pode alsodetect palavra-chave artificial recheio

ou spamdexing.

Em seguida, os algoritmos de analisar a maneira que páginas link para outras páginas Web inthe. Ao verificar como páginas link uns aos outros, um motor pode bothdetermine o que uma página é sobre, se as palavras-chave do pagesare ligada semelhante às palavras-chave na página original.