Mechanismo de recerca

De Wikipedia, le encyclopedia libere
Saltar a: navigation, cercar

Un mechanismo de recerca o motor de recerca es un programma designate pro adjutar le usator a acceder a files immagazinate in un computator o gruppo de computatores, como le World Wide Web, permittente que le usator specifica certe criterios (typicamente le presentia de un certe parola, collection de parolas, un expression) e recuperante le files que satisface ille criterios. Differentemente de un documento de indice que organisa le files de un maniera predeterminate, un mechanismo de recerca solmente cerca le files post que le usator ha fornite le parolas a cercar.

In le contexto del Internet, le concepto mechanismo de recerca generalmente refere al World Wide Web e non a altere protocollos o areas. Proque le collection de datos es automatisate, illos se distingue de catalogos del web, que es gerite per personas.

Como le mechanismos de recerca functiona[modificar | modificar fonte]

Le mechanismos de recerca del web functiona immagazinante information super un grande numero de paginas del web que illos recupera del Web mesme. Iste paginas es recuperate per un web crawler — un navigator del web automatisate que seque tote le ligamines que illo trova. Le contento de cata pagina es analysate pro determinar como illo debe esser addite al indice (per exemplo, parolas es extrahite del titulo de fenestra, del titulos del pagina e de campos special de metainformation). Iste datos super le paginas del web es immagazinate sub alcun forma de base de datos e servira de indice in consultas futur. Alcun mechanismos de recerca, tales como Google, immagazina un copia total o partial del codice-fonte (que illo denomina cache) in addition al information super le pagina.

Quando un usator visita le mechanismo de recerca e face un consulta, le mechanismo examina le indice e forni un lista del paginas que melio satisface le criterios specificate, generalmente con un breve summario que ha al minus le titulo del documento e eventualmente extractos del texto.

Pro le majoritate del personas le utilitate de un mechanismo de recerca se basa super le relevantia del resultatos que illo produce. Malgrado le existentia de milliones de paginas del web que include un parola o expression particular, generalmente certe paginas es plus relevante, popular, o digne de confidentia. Le majoritate del mechanismos de recerca emplea methodos de classificar le resultatos pro fornir primo le "melior" resultatos. Le maniera como un mechanismo de recerca decide qual paginas satisface melio le criterios e in qual ordine illo debe presentar le resultatos, varia amplemente de un mechanismo al altere. Le methodos tamben se cambia in le curso del tempore a mesura que le uso del Internet se cambia e le technologias se meliora.

Le majoritate del mechanismos de recerca del web es interprisas commercial financiate per receptas publicitari, e per consequente alcunos emplea le practica controverse de permitter que le annunciatores paga pro haber lor paginas classificate in un position plus alte in le resultatos del recerca.

Chronologia in Internet[modificar | modificar fonte]

Le prime mechanismo de recerca esseva Lycos que se initiava al Carnegie Mellon University como un projecto de recerca in 1994.

Tosto depost, multe mechanismos de recerca competeva pro popularitate e ganiava e perdeva le posto maxime, tales como Lycos, WebCrawler, HotBot, Excite, Infoseek, Inktomi e AltaVista. De certe maniera illos competeva con catalogos popular tal como Yahoo!. Posteriormente le catalogos integrava o adjungeva technologias de mechanismos de recerca pro meliorar lor functionalitate.

Le mechanismos de recerca esseva tamben cognite como alcunes del plus brillante stellas in le phrenesia de investimentos que occurreva in le fin del annos 1990. Varie companias entrava in le mercato spectacularmente, registrante ganios record durante lor offertas initial de actiones al publico.

Ante le Web, il habeva mechanismos de recerca pro altere protocollos o usos, tales como le mechanismo de recerca Archie pro sitos de FTP anonyme e le mechanismo de recerca Veronica pro le protocollo Gopher.

Le articulo de Osmar R. Zaïane "Del discoperta de ressources al discoperta de cognoscentia in le Internet (1998)" es un bon historia pre-Google del technologia de mechanismos de recerca. (Recommendation: Clicca "PDF" in the angulo superior dextere.)

Recente additiones al lista de mechanismos de recerca es Ask Jeeves, Ez2Find, Vivísimo, Gigablast e Kartoo.

Google[modificar | modificar fonte]

Circa 2001—2002, the mechanismo de recerca Google ascendeva al prominentia. Su successo se basava partialmente super le concepto de popularitate del ligamines e PageRank. Cata pagina es classificate secundo le quantitate de paginas que se liga con illo, sub le premissa que le paginas bon o desirabile recipe plus ligamines que le alteres. Le quantitate de paginas colligate e le quantitate de ligamines in ille paginas contribue al PageRank de un pagina. Isto rende possibile que Google presenta primo paginas que es altemente ligate per sitos del web de alte qualitate.

Recercatores al NEC Research Institute assere haber meliorate le technologia PageRank patentate per Google usante web crawlers pro trovar "communitates" de sitos del web. In vice de classificar paginas, iste technologia usa un algorithmo que seque ligamines a un pagina del web pro trovar altere paginas que se liga retro al prime e assi successivemente de pagina a pagina. Le algorithmo "memora" le paginas que illo ha visitate e registra in su indice le numero de ligamines cruciate e los aggruppa. De iste maniera se trova communitates virtual de paginas del web. [1]

Defias al mechanismos de recerca[modificar | modificar fonte]

  • Le web cresce multo plus rapide que un mechanismo de recerca hodierne pote possibilemente registrar in su indice (vide registration distribuite del web).
  • Multe paginas web es actualisate frequentemente, lo que obliga le mechanismo de recerca a revisitar los periodicamente.
  • Le consultas possibile actualmente se limita a cercar parolas-clave, que pote resultar in multe resultatos irrelevante.
  • Sitos que se genera dynamicamente, que pote esser lente o difficile a registrar, o pote resultar in resultatos excessive de un singule sito.
  • Alcun mechanismos de recerca non classifica le resultatos per relevantia, mais per quanto le sitos ha pagate.

Vide etiam[modificar | modificar fonte]

Ligamines externe[modificar | modificar fonte]