Comment structurer une requête de recherche avancée

Pour optimiser la collecte d'informations sur Internet, il peut être intéressant de s'éloigner des traditionnels moteurs de recherche grand public pour s'intéresser aux moteurs spécialisés, qui offrent de nombreuses possibilités de recherche dites "avancées". Filtres, exclusions, limitations, choix des sources ou encore utilisation d'opérateurs logiques booléens, ces moteurs de recherche avancés proposent de nombreux outils facilement utilisables par les chercheurs ou collecteurs d'informations. Ils pourront s'en servir pour leurs différentes veilles informatiques et mettre cette optimisation à profit de leur entreprise. Mais encore faut-il savoir structurer une recherche avancée. Car contrairement à nos habituels moteurs de recherche, ici les mots-clés ne suffisent pas.
Avantages de bien structurer une requête de recherche
Les avantages de l'utilisation de la recherche avancée sur Internet ou les bases de données concernent surtout les entreprises à la recherche d'informations pour leurs veilles réglementaires, technologique ou concurrentielle. Elle permet en effet de gagner du temps, d'optimiser les ressources informatiques et surtout d'avoir accès à des informations de meilleure qualité à côté desquelles la concurrence pourrait passer.
Avantage 1 – Gagner du temps dans l’analyse de l’information
Même si effectuer une recherche avancée demande plus de temps de préparation pour renseigner les outils du moteur de recherche, cette méthode permet in fine de gagner du temps. En effet, les informations délivrées par la recherche seront plus pertinentes, plus fiables, et l'opérateur s'économise donc la tâche fastidieuse de trier manuellement les données en séparant les informations qu'il recherchait vraiment de celles qui lui sont inutiles voire totalement hors propos. En effet, les moteurs de recherche traditionnels ont pour vocation de proposer le maximum de contenu possible, quitte à élargir la recherche par similitude de sujets, d'orthographe ou de contexte. Le résultat est une centaine de pages dont le contenu doit être étudié une par une afin de sélectionner individuellement les plus pertinentes. La réactivité étant essentielle dans le contexte économique actuel, les entreprises peuvent donc concentrer leurs efforts sur la portion congrue des informations et libérer leurs ressources.
Avantage 2 – Améliorer la qualité des décisions stratégiques
En plus du gain de temps considérable lors de la recherche en elle-même, maîtriser la recherche avancée offre à une entreprise l'accès à des sources d'informations plus fiables, mieux ciblées et qui sortent parfois de l'information mainstream. La qualité des informations étant essentielle pour bâtir une stratégie et prendre des décisions, cette qualité se répercute donc sur celle des actions de management et de direction. Il devient plus aisé d'anticiper et de prévoir, et par là, plus facile de prendre des décisions sereines. De plus, l'accès à des informations fiables par des canaux rarement utilisés peut ouvrir sur des opportunités intéressantes, surtout si la concurrence n'y a pas accès ou si l'information est noyée dans le flot de données habituelles.
Avantage 3 – Optimiser l’utilisation des outils numériques et des bases de données
D'un point de vue purement informatique, le recours aux recherches avancées permet entre autres de ne pas saturer ses bases de données avec des informations de second ordre. Mais selon le moteur de recherche, il est aussi possible de collecter les données dans un format ou sur une forme choisie, qui correspond avec celle de notre structure de data, pour faciliter leur implémentation et donc leur analyse par les systèmes informatiques de l'entreprise, comme les modèles prédictifs et les intelligences artificielles.
Techniques pour élaborer une requête de recherche avancée
La recherche avancée, si elle est à portée de tous même sans connaissances spécifiques, nécessite cependant de connaître quelques astuces et techniques pour être optimisée. Notamment en ce qui concerne la précision des mots-clés recherchés, les signes logiques de programmation de la recherche ou encore l'utilisation d'opérateurs booléens.
Opérateurs booléens
L'utilisation d'opérateurs booléens est la base et le mode d'entrée dans le monde de la recherche avancée d'informations. Ce sont des mots logiques et des symboles qui permettent de programmer la recherche en élargissant, limitant ou excluant certains termes. Il s'agit tout d'abord des opérateurs AND, OR et NOT. Les majuscules sont importantes pour ne pas que le moteur de recherche les confonde avec des mots de liaison qu'il se mettra à rechercher, conduisant à l'effet inverse. En plus de ces trois opérateurs de base, de nombreux autres peuvent être utilisés, comme "site:" qui permet d'indiquer au moteur de recherche sur quel site web la recherche doit être effectuée. Cet opérateur est très utile une fois que l'on a sélectionné les sources fiables à utiliser. En utilisant correctement ces opérateurs, il est donc possible d'effectuer des recherches très précises en excluant des mots, des phrases, ou en limitant la recherche à une suite de mots bien précise à la lettre, la casse, et la typographie près.
Mots-clés spécifiques et exclusions
Pour autant, il n'est pas forcément besoin de connaître la liste des opérateurs par cœur pour se lancer dans la recherche avancée. En vérité, celle-ci commence quand l'on commence à affiner le sens des mots en soi avant de lancer la recherche. En effet, la majorité des recherches s'effectue avec les mots du quotidien, plus naturellement utilisés et donc naturellement plus recherchés par simple habitude. Se conformer à cette habitude revient à se priver d'une multitude d'informations plus pertinentes, mais rangées sous des mots-clés plus spécifiques. La précision dans l'utilisation du vocabulaire est donc la première chose à laquelle faire attention lorsque l'on effectue une recherche avancée, avec ou sans opérateurs. Dans l'idéal, une recherche préalable des mots-clés issus d'un lexique spécifique au domaine d'activité de l'entreprise s'impose donc pour maximiser la probabilité de trouver des informations pertinentes.
Utilisation des guillemets et des recherches fines des moteurs de recherche traditionnels
La plupart des moteurs de recherche grand public proposent eux aussi leurs outils de recherche affinée, même s'ils sont souvent difficiles à trouver dans les options. Ils offrent en effet la possibilité de filtrer par langue, type de document ou date de publication. Mais ils permettent aussi d'utiliser les guillemets directement dans la barre de recherche dans le but de rechercher une expression exacte. Si cette méthode n'est pas aussi précise et restreinte que l'utilisation d'opérateurs booléens ou de moteurs spécialisés, elle permet en revanche de cibler une expression particulière, comme une citation ou un évènement dont on connaît le nom composé. De plus, il est possible de faire des recherches d'image inversées à partir d'images ou de documents.
Outils pour affiner les requêtes de recherche
Ces méthodes, bien qu'utiles pour le grand public ou pour les recherches classiques, sont cependant limitées et pas assez ciblées. Pour se libérer de ces contraintes, il est recommandé d'utiliser des moteurs spécifiques, des logiciels de recherche ou encore des scripts d'automatisation.
Moteurs de recherche spécialisés
Les moteurs de recherche spécialisés sont adaptés à la recherche par secteur ou domaine d'intérêt. Il existe des moteurs spécifiques pour les recherches scientifiques, statistiques, juridiques... ce qui permet d'avoir accès non pas à la totalité des pages web, mais à une sélection rigoureuse et ciblée de sources, la plupart mises en ligne et contrôlées par des experts. Couplés à des filtres adaptés aux types d'informations recherchées, ces moteurs permettent de cibler la recherche de manière très précise tout en ayant accès à des informations non disponibles sur le web de manière générale. Google Scholar met par exemple à disposition des chercheurs de nombreuses publications scientifiques exclusives. Mais de nombreux autres moteurs existentent, comme LexisNexis pour la recherche juridique ou l'INSEE pour les statistiques.
Scripts et API
Sans être un expert informatique, il est possible d'utiliser de petits programmes simples pour automatiser de nombreuses tâches de recherche. C'est le cas des scripts et des API. Ils permettent d'extraire automatiquement des données, de les organiser et surtout d'automatiser la répétition de la recherche en boucle pour participer à une veille permanente. Le langage de programmation dans lequel ces scripts sont conçus est relativement simple à maîtriser, comme Python et JavaScript. Certaines intelligences artificielles peuvent fournir des scripts simples aux débutants qu'il suffira de copier-coller dans la console pour commencer à programmer des recherches avancées en quelques minutes seulement. Pour améliorer ses compétences, de nombreuses formations incluent la conception de scripts dans leurs programmes, comme une formation en collecte d'information et en due diligence. En ce qui concerne les API, pour interfaces de programmation d'application, ils permettent de mettre en relation plusieurs logiciels, plateformes ou applications et de mettre en commun leurs bases de données pour pouvoir en extraire de nombreuses informations utiles. De cette manière, on peut par exemple collecter des données sur les réseaux sociaux ou sur des applications mobiles. Avec quelques compétences en programmation, il est possible d'automatiser une recherche programmée ciblée sur des données économiques publiées sur un réseau social en particulier, en filtrant en amont les données qui ne sont pas pertinentes.
Pour assurer une veille permanente et pertinente dans tous les domaines, de nombreuses entreprises s'intéressent à la formation de leurs salariés en informatique et en programmation de base pour leur permettre de maîtriser des outils à la fois simples et puissants pour se tenir à jour des dernières réglementations, de l'avancée de la concurrence, mais surtout conduire leurs stratégies sur la base d'informations fiables que seules des recherches ciblées peuvent fournir.