¿Cómo funciona un motor de búsqueda?



Descargar 110.82 Kb.
Fecha de conversión03.05.2018
Tamaño110.82 Kb.

¿Cómo funciona un motor de búsqueda?


TIC’s TENS 2012 UMAG

Prof: Eduardo Peña J.

Básicamente, los motores de búsqueda (search engines, SE) son bases de datos gigantescas que contienen información sobre el contenido de los sitios web que integran la web. El motor de búsqueda más popular, Google, contiene más de 3.000.000.000 sitios web. Cuando introduces una frase o palabra, el motor buscará en su base de datos y devolverá resultados en un orden que estará determinado por su propio algoritmo.

Así pues, ¿cómo consiguen al principio toda esa información?

Arañas (spiders)


Los motores de búsqueda emplean el uso de arañas para recopilar la información de los sitios web. Las arañas rastrean los sitios web recopilando datos y siguen los enlaces que hay en las páginas. Las arañas rastrean Internet casi continuamente, recolectando las páginas nuevas y actualizadas de la Web para mantener sus resultados al día.

Tratamiento de Datos


Los datos que las arañas extraen son tratados de forma diferente por los diversos motores de búsqueda. Los motores de búsqueda ponen el 'peso' en diferentes componentes de un sitio web y en cómo se integra en la Web . De esta manera determinan el orden en el que los sitios web deben aparecer en los resultados de una búsqueda (las páginas que contienen los resultados de la búsqueda son llamadas comúnmente SERPS- search engine result pages).

Entrando


La mayoría de los motores de búsqueda ponen al día sus bases de datos al menos una vez al mes con la información recopilada por sus arañas. Esto es importante saberlo cuando se tiene un sitio web relativamente nuevo - si pones tu sitio web por primera vez en la red al final de un 'rastreo' y las arañas no lo encuentran, tendrás que esperar hasta la actualización siguiente para entrar a formar parte de la base de datos. Una vez el sitio web entra la base de datos todavía llevará una o dos actualizaciones más antes de que el nuevo sitio web se estabilice en los resultados de las búsquedas.

La mayoría de los SEs, como Google, también tienen lo que se llama listados frescos.


Máquinas de búsqueda en la Web


Se presenta aquí una lista de 135 motores de búsqueda web generales. Estos no incluyen sitios ni motores de búsqueda específicos. La lista presentada aquí está basada en motores de búsqueda que cubren 200 países y regiones y un total de más de 2.000 motores de búsqueda (hasta septiembre de 2004). Si necesita motores de búsqueda basados en país / región, no dude en visitar la página Country Search Engine, [www.philb.com/countryse.htm].

Los motores de búsqueda



A9: Amazon Books, resultados en directo. [www.A9.com]

Abbreviations: Para abreviaturas. [www.abbreviations.com]

Abcsearchengine: Índice basado, bastante pequeño. [www.abcsearchengine.com]

About: Varios artículos sobre un montón de cosas. [www.about.com]

Accoona: Excelente para noticias, bueno para búsquedas enfocadas. [www.accoona.com]

Acronymfinder: Búsqueda de acrónimos. [www.acronymfinder.com]

Aftervote: Motor de búsqueda social. [www.aftervote.com]

Ajaxwhois: Ideal para búsquedas de estadísticas. [www.ajaxwhois.com]

Alexa: Bueno para respaldo de información sobre un sitio. [www.alexa.com]

AllPlus: Buen meta motor, muchas opciones. [www.allplus.com]

Alltheweb: Es parte de la familia de Yahoo. [www.altheweb.com]

Altavista: Antiguo, pero sigue siendo una sorpresa agradable. [www.altavista.com]

Answers: Buena fuente de información de hechos. [www.answers.com]

AOL Search: Google en una forma distinta. [http://search.aol.com/aol/webhome]

Archive, Internet: Bueno para las versiones anteriores de un sitio. [www.archive.org]

Ask: Uno de los cuatro grandes. [www.ask.com]

Azoos: Índice misceláneo de amarillo brillante. [www.azoos.com]

Beaucoup: Basado en índices no impresos. [www.beaucoup.com]

Better Who Is: información acerca de un propietario del sitio web, etc. [www.betterwhois.com]

Blinkx: Motor de búsqueda multimedia. [www.blinkx.tv]

Brainboost: Parte de la familia Answers. [www.brainbost.com]

Buzzle: Basado en índices no impresos. [www.buzzle.com]

ChaCha: Búsqueda con un guía humano. [www.chacha.com]

Clusty: Muy bueno para todo. [www.clusty.com]

Collarity: Motor de búsqueda personalizado. [www.collarity.com]

Complete Planet: Excelente web oculta / invisible. [www.completeplanet.com]

Convert: Para convertir de uno a otro. [www.convert.net]

Country Search Engines: 4.000 motores de búsqueda por país. [www.philb.com/countryse.htm]

Definitions: Bueno para diversas definiciones.

Digital-librarian: Colección de enlaces de un bibliotecario.

DMOZ (Open Directory Project): Buen Índice.

Dogpile: Multi búsquedas GYMA.

Draze: Comparado con GYM en una pantalla.

Ebingbong: Búsqueda social, permite a los usuarios los resultados de tasas.

Eurekster: Bueno para la construcción de su propio motor de búsqueda.

Exalead: Excelente funcionalidad, buenas opciones avanzadas.

Excite: ¿Hay alguien que todavía usan más que todo?

Factbites: Información de hechos.

FaganFinder: Magnífica colección de motores de búsqueda.

Fazzle: Bueno todo el motor de búsqueda de metadatos.

Findsounds: Motor de búsqueda de audio/sonido.

FinQoo: Motor de búsquedas múltiples.

Freesearch: Motor basado en índices en Reino Unido, alcance global.

Galaxy: Basado en índices.

Google: ¿Tengo que decir algo acerca de esto?

Google Blogsearch: El mejor motor de búsqueda de blogs.

Google Directory: Similar al DMOZ.

Google Groups: Bueno para información oculta.

Google Images: Búsqueda de imágenes superior al de Yahoo.

Google Local: Local en Reino Unido.

Google News: Adecuada. Bueno para alertas por correo electrónico.

Google Personalised: Resultados a la medida para sus intereses.

Google Scholar: Para material académico.

Google Trends: Quién está buscando qué?

Healia: Excelente motor de búsqueda de médicos.

Hotbot: Blast from the past!

IAF People search: Búsqueda de personas en Gran Bretaña.

iBoogie: Máquina de búsquedas múltiples, fuerte en clusters.

Icerocket: Bueno para la búsqueda de blog.

Illumirate: Basado en índice.

InfoMine: Recursos de Internet para colecciones académicas.

Infopeople: Búsqueda de personas.
Infoservice Index based, bizarre collection of headings InfoService índice basado, extraña colección de las partidas

Intute Superb directory, very authoritative Intute directorio Superb, con mucha autoridad

Irazoo Social search engine, vote for results Irazoo motor de búsqueda social, la votación de los resultados

Ixquick Excellent meta search engine Ixquick excelente motor de búsqueda de metadatos

Jayde Business to business Jayde Business to business

Jux2 Excellent meta search & compare results Jux2 meta búsqueda Excelente y compara los resultados

Kartoo Visual search engine, good reputation Kartoo motor de búsqueda visual, la buena reputación de

Kazazz Free text search engine, not particularly exciting KaZaZZ motor de búsqueda de texto libre, no es particularmente emocionante

Kidsclick Children's search engine Motor de búsqueda KidsClick infantil

Librarians Internet Index Superb resource Bibliotecarios de Internet Índice de recursos Superb

Linkopedia Index based, not exciting Linkopedia Índice basado no, emocionante

Live Search One of the big 4 Live Search Uno de los 4 grandes

Lycos Almost lost in the midst of time, but still trying Lycos Casi perdida en medio del tiempo, pero sigue intentando

Mahalo Social search engine, some like it, I don't Mahalo motor de búsqueda social, a algunos les gusta, no me

Mamma Multi meta search engine that's been around for years Mamma Multi motor de búsqueda de metadatos que ha estado alrededor por años

Mastersite Calls itself #1 though I can't work out why Pide Mastersite sí # 1 aunque no puedo averiguar por qué

Metacrawler Meta search engine Metacrawler motor de búsqueda de Meta

Monstercrawler Meta search engine Monstercrawler motor de búsqueda de Meta

Mooter Visual search engine Mooter motor de búsqueda visual

MsDewey Microsoft folly; annoying and pointless MsDewey locura Microsoft; molestos y sin sentido

Oaister Emphasis on hidden web academic material OAIster Énfasis en la web oculta material académico

Omnimedicalsearch Excellent medical search engine Omnimedicalsearch excelente motor de búsqueda de médicos

Peerbot Very unusual engine, as it searches for favicons Peerbot motor muy inusual, ya que las búsquedas de favicons

Pepesearch Does not stand out Pepesearch NO LLAMA LA ATENCIÓN

Pinakes Superb collection of Virtual Libraries Pinakes magnífica colección de las Bibliotecas Virtuales

Questfinder Selective web directory Questfinder directorio web selectivo

Quotations for Quotations Cotizaciones de las citas

Quintura First rate, uses clouds of terms. Recommended Quintura tasa Primero, usa las nubes de términos. Recomendados

RedZee Visual search. RedZee búsqueda visual. Awful. Espantoso. Used to be excellent Se utiliza para ser excelentes

References Good all round resource Referencias buena ronda de todos los recursos

Re-quest Index/Directory web search engine Re-quest Indice / motor de búsqueda Directorio Web

Scandoo accurately indicates a level of trustworthiness Scandoo precisión indica un nivel de confiabilidad

Scirus: Búsqueda científica en la web y en revistas seleccionadas.

Scrubtheweb: Motor de búsqueda.

Search-beat: Utilización de bases de datos de Google.

Searchbug: Búsqueda de personas y empresas en los EE.UU.

Search.com: Motor de Meta búsqueda.

Searchhippo: Motor de Meta búsqueda.

Searchy: Búsqueda personalizada.

Searchmash: Banco de pruebas Google.

Search Medica: Excelente motor de búsqueda de medicina.

Searchthe.net: Motor de Meta búsqueda.

Searchtheweb: Indice / Directorio.

Selectsurf: Directorio web selective.

Similicio.us: Encuentra sitios similares.

Silobreaker: Recursos noticiosos.

Slider: Motor de búsqueda de texto completo que busca DMOZ.

Smartlinks: Indice / Directorio.

SMEALSearch: Contenido académico autorizado.

Sproose: Motor de búsqueda social.

Sunsteam: Indice / Directorio

Supercrawler: Index/Directory.

Synonyms: Buena referencia de recursos de sinónimos.

Technorati: Excelente motor de búsqueda de weblog.

Thenet1: Indice / Directorio.

Thunderstone: Indice / Directorio.

Trooker: Motor de búsqueda de video.

Turbo 10: Grande para la web oculto / invisible.

TurboScout: Muy buena motor de búsquedas múltiples.

Ujiko: Motor de búsqueda visual.

Web Brain: Motor de búsqueda visual.

Webcrawler: Motor de Meta búsqueda para GYMA.

Web-search: Motor de Meta búsqueda, uno a la vez.

Webworldindex: Indice / Directorio

Whatuseek: Basado en índices web.

Windseek: Motor de Meta búsquedas.

WWW Virtual Library: Secunda sólo a pinakes.

Yahoo!: Uno de los 4 grandes.

Yahoo Buzz: ¿Qué está pasando?

Yahoo Directory: Yahoo como lo que solía ser.

Yahooligans: Para los niños.

Yahoo Local: Información local de Yahoo.

Yahoo Mindset: Énfasis en la investigación o compras.

YouTube: Motor de búsqueda de vídeo.

Zapmeta: Permite distintos modos de re-clasificación de buscadores.

Zensearch: Usa la base de datos de Google.

Zip codes: Información sobre códigos de áreas postales de EE.UU.


La base de datos está protegida por derechos de autor ©bazica.org 2016
enviar mensaje

    Página principal