Skip to content

Latest commit

 

History

History
74 lines (52 loc) · 2.46 KB

20250107.md

File metadata and controls

74 lines (52 loc) · 2.46 KB

réunion du 7 janvier 2025

IA de confiance

problématique = usage raisonné de l'IA dans la recherche et dans l'enseignement?

  • usages safe de l'IA => ce qui relève du brainstorming ou de la page blanche
  • cela peut amener à un argumentaire, une réflexion
  • chat GPT c'est un stagiaire, bonne volonté, temps mais..
  • avoir un regard critique sur la production et que ce ne soit pas 100% du travail
  • proposition de ce à quoi on n'a pas pensé

Comment est-ce qu'on cite?

  • débat: le processus/la reflexion ne se cite généralement pas.

Travail en cours sur les sorties structurées

  • réponse doit respecter une grammaire de réponse
  • ex trouve moi une bibliographie et sort là au format bibtex mais la fiabilité du contenu reste en question
  • c'est la syntaxe quie est vérifiée
  • à plugger à un outil de vérif des références

=> comment on incorpore dans un process ou on reste critique

  • l'entrée n'est pas fiable mais la sortie de la recherche doit l'être

=> mettre des contraintes sur le format de sortie (ex bibtex) + outils automatiques de vérifications derrière

=> pas de garantie de ne pas avoir de trou

Proposer un atelier lors de la sur cet exemple

  • état de l'art?
  • générer du code?

Compétences:

  • capacité à prompting
  • mais aussi
  • capacité à apporter ton corpus (apporter du contexte informationnel)

(faire un retour auprès des collègues de la bib)

voir le RAG

voir vector search et vector indexing

sur un corpus, pour retrouver info

  • mettre des critères (requetes classiques) dépend de la structure et des métadonnées
  • full text search avec ranking
  • semantic search (proximités sémantiques, réseaux de neurones et llm) maintenant efficace.

RAG utilise semantic serach dans les bdd et les refaçonne

rend plus efficace le langage naturel

notebook rech.data.gouv

Présentation de Sébastien d'analyse du contenu de l'entrepot recherche.data.gouv via l'API.

  • dimension et importance de la plateforme
  • positionnement de la plateforme

=> La bibliothèque doit documenter les entrepots à conseiller pour le machine learning

  • quelle démarche complémentaire par rapport à hugging face par exemple?

DATA retour sur le guide

débat principalement orienté vers la dissémination et les entrepôts (rech.data.gouv)

Pour une prochaine réunion

  • notebook rech.data.gouv

  • MARP ppt en .md