Mirago  
LIENS ASSOCIÉS
Technologie
Le système de requête
Le Robot
Mirago Media Manager
Langage Naturel
Connaissances techniques
Infrastructure









Accueil > Société > Technologie > Q3
Q3 - The Mirago Query System

La technologie de recherche de Mirago a énormément changé au cours de ces dernières années. A présent dans sa troisième génération, la technologie a parcouru un long chemin depuis son lancement, continuera certainement à évoluer puisque le monde dynamique d'Internet va de l'avant.

Comme le font les autres moteurs de recherche majeurs, Mirago fait plus qu'indexer les mots des pages web. Presque sans exception, les principaux moteurs de recherche utilisent les liens entre les pages ainsi que le texte de ces liens pour déterminer l'importance des pages web. Ce modèle de citation améliore considérablement la capacité des moteurs de recherche à déterminer le thème d'une page. Les liens utilisent des phrases courtes précises telles que 'Contact Gadget Sarl' à partir desquelles les moteurs de recherche sont en mesure de déduire que la page visée contient les coordonnées d'une société imaginaire appelée Gadget Sarl.

Query Server
Mirago pousse ce modèle plus loin en regardant également le thème des pages d'où les liens partent et en comparant celui-ci au thème de la page vers laquelle les liens pointent. En quoi est-ce pertinent ou avantageux? Les liens entre pages de thème similaire sont plus utiles lors de la détermination de l'importance relative des pages. Beaucoup de webmasters mettent sur leur site des liens pour télécharger la dernière version de Microsoft Internet Explorer. Les liens entre sites ayant le même sujet sont bien plus utiles. Les clubs de propriétaires de chiens qui ont un site internet peuvent très bien avoir des liens vers d'autres sites contenant des informations sur une race spécifique. De tels liens sont de plus grande importance que les liens vers la dernière version du navigateur nécessaire à la visualisation des pages web.

Bien entendu, la technologie de Mirago prend également en compte d'autres facteurs lors de la construction des pages de résultats répondant à une requête. Ces facteurs comprennent le niveau auquel se trouve l'information dans l'architecture du site la place de la page dans l'architecture du site, la fréquence de mise à jour et la date des dernières modifications d'une page.

Le facteur le plus important pour toute page web est l'authenticité des informations qu'elle contient. Il y a malheureusement des individus et sociétés qui sont tentés de pervertir la nature impartiale des moteurs de recherche en manipulant artificiellement le texte des pages indexées par les moteurs de recherche. Cette pratique est généralement connue sous le nom de spamming. Mirago a développé une série de technologies de pointe permettant de détecter et traiter le spam. Des exemples évidents de spam sont les textes cachés, pages satellites redirigeant automatiquement l'internaute vers une page différente. Les pages web utilisant de telles pratiques ne profitent pas de leur méfait!

La principale ligne directrice qui guide Mirago dans le développement de sa technologie est de faire en sorte que la technologie évalue le mérite relatif des pages de la même manière qu'un humain effectuant la même tâche.

Q3, the Mirago Query System, est utilisé pour chercher des informations extraites des pages web; il s'agit de recherches organiques. Il est également utilisé pour rechercher des informations issues de bases de données, également connues sous le nom de programme Trusted Feed. Un index est créé à partir de chacune de ces sources d'informations. Le premier type d'index est créé par Henri, Le Robot Mirago et le second par un flux de données XML provenant des partenaires Trusted Feed de Mirago...

Trusted Feeds

Toutes les informations utiles ne sont pas accessibles via des pages web statiques. En effet de larges quantités d'informations sont stockées dans des bases de données. Ces bases de données sont très fréquemment accessibles par des systèmes de requêtes propriétaires. Conséquemment les robots tels que Henri, Le Robot Mirago, sont incapables de lire ces informations et donc de les intégrer dans les index web Mirago.

Pour surmonter cela, Mirago opère un programme de Trusted Feed. Ce programme est géré par un réseau de revendeurs choisis et permet aux sites contenant d'importantes quantités d'informations de soumettres ces informations automatiquement pour leur insertion dans les index Mirago. Les revendeurs gérent les données pour le compte des sites et les présentent à Mirago sous la forme d'un flux XML.

Mirago dispose d'un robot spécial qui lit uniquement ces flux et produit des index similaires à ceux d'Henri. Etant indépendant, la fréquence de mise à jour de ces index n'est pas liée à celle des cycles normaux. Ainsi le programme de Trusted Feed actualise les informations chaque jour.

 
 

Annoncer sur Mirago Partenariat