réunion du 7 janvier 2025
problématique = usage raisonné de l'IA dans la recherche et dans l'enseignement?
- usages safe de l'IA => ce qui relève du brainstorming ou de la page blanche
- cela peut amener à un argumentaire, une réflexion
- chat GPT c'est un stagiaire, bonne volonté, temps mais..
- avoir un regard critique sur la production et que ce ne soit pas 100% du travail
- proposition de ce à quoi on n'a pas pensé
Comment est-ce qu'on cite?
- débat: le processus/la reflexion ne se cite généralement pas.
Travail en cours sur les sorties structurées
- réponse doit respecter une grammaire de réponse
- ex trouve moi une bibliographie et sort là au format bibtex mais la fiabilité du contenu reste en question
- c'est la syntaxe quie est vérifiée
- à plugger à un outil de vérif des références
=> comment on incorpore dans un process ou on reste critique
- l'entrée n'est pas fiable mais la sortie de la recherche doit l'être
=> mettre des contraintes sur le format de sortie (ex bibtex) + outils automatiques de vérifications derrière
=> pas de garantie de ne pas avoir de trou
Proposer un atelier lors de la sur cet exemple
- état de l'art?
- générer du code?
Compétences:
- capacité à prompting
- mais aussi
- capacité à apporter ton corpus (apporter du contexte informationnel)
voir le RAG
voir vector search et vector indexing
sur un corpus, pour retrouver info
- mettre des critères (requetes classiques) dépend de la structure et des métadonnées
- full text search avec ranking
- semantic search (proximités sémantiques, réseaux de neurones et llm) maintenant efficace.
RAG utilise semantic serach dans les bdd et les refaçonne
rend plus efficace le langage naturel
Présentation de Sébastien d'analyse du contenu de l'entrepot recherche.data.gouv via l'API.
- dimension et importance de la plateforme
- positionnement de la plateforme
=> La bibliothèque doit documenter les entrepots à conseiller pour le machine learning
- quelle démarche complémentaire par rapport à hugging face par exemple?
débat principalement orienté vers la dissémination et les entrepôts (rech.data.gouv)
-
notebook rech.data.gouv
-
MARP ppt en .md