40k images
Trained to find images. beaucoup plus de résultat.
Un modèle qui analyse des images et users, modifie les données liées et améliore les performances.
Possibilité de chercher par le texte, sélection d’une image, accès à des images par similarité. Toutes les version titanesques, etc. Zoom qui permet de visualiser par proximité. Genre de visualisation très efficiente car œil humain très efficace pour repérer des motifs.
Compréhension immédiate des éléments.
Possibilité de sélectionner des ensembles, et à partir de la vision computationnelle seulement possible de relancer la requête. Possibilité de créer des éléments négatifs. Et encore itérer la requête.
L’application offre aussi la possibilité de sélectionner une zone ou un détail d’une image et accéder à d’autres images très léonardesques. En sélectionnant une image.
Important pour nous que l’utilisateur puisse donner des feedback à l’utilisateur. Possibilité de créer des liens pour réutilisation pour d’autres entrainements.
Take away
- L’interface design important et directement liée aux algorithmes
- toujours conserver l’humain dans la boucle
- le diable est dans les détails
dh2017
Journaux illustrés 19e. Images à l’échelle massive.
Phase 1, harvest toutes les images depuis les journaux. Segmentation.
Dès les années 20 usage massif de l’image aux PB. Parallèlement augmentation progressive des numéros.
Logos des journaux, marqués dans les quantités.
Présence des images variables selon les titres.
2e phase, appliquer ces techniques à notre base de données pour classifier les images.
Voir comment peut être adapté pour grandes bases de données.
- Ratio pixel (quantité information dans l’image)
- Entropy
Ge, 2006 [algorithme]
Changement brutal dans les demi-tons.
Baisse de qualité dans les années 10, deviennent alors difficiles à détecter car classificateurs pas entraînés sur ce genre d’objet. Pour ces images, besoin d’un autre classificateur ou d’autres méthodes.
Phase 3 OpenCV et inception, tensors flow pour créer des modèles
Identifier jeux échecs, cartes météos, baromètres, bds, etc. Très efficaces pour ce genre d’images. Pas de benchmatch
Nombreuses images inconnues ou non classifiées. Essayer de faire de nouveaux modèles pour classer plus loin les images.
met en lumière de vieille questions ou permet répondre à des questions historiques.
lab.kb.nl
illustratednewspictures.tumblr.com
Visual similarité n’est pas une similarité de conception
Computer vision ouvre des champs énormes. pas seulement classification et recherche, mais processer l’information visuelle.
Manovich, composition des films.
distance entre explinatory aspect et performances
Pas de pb dans mon cas si cela ne fonctionne pas.
Kaplan : Relaxer. Système pour chercher des choses trouver des choses aucun de ces choses ne produit du savoir. Décide si ces éléments ont similarités et peuvent être liés. Cela va impacter les disciplines
Comme ce qui est arrivé avec les moteurs de recherche. Nouvelle manière de penser à la culture visuelle.
Travail Underwood sur le prestige. Quand ces modèles statistiques échouent, comment le font-ils ? Comment identifier ces paramètres et expliquer les échecs.
Alison Hedley Ryerson
1er octobre pour le prochain 1er octobre.
Kaplan très précautionneux sur le fait que mise en cause du fait que pas reproductible et donne des résultats aléatoires. Suggère plutôt de commencer par l’utiliser et voir ce que cela fait. Comprendre comment l’utiliser. Se concentrer sur l’accès et la recherche car très efficace. Devient évidemment beaucoup plus problématique lorsque l’on aborde la quantification, etc. Questions d’épistémologie viennent ensuite. Visiblement craint critique.
Getty veut travailler
appliquer à corpus porn