Skip to content

Latest commit

 

History

History
98 lines (49 loc) · 3.93 KB

crDH2017-08-11c.md

File metadata and controls

98 lines (49 loc) · 3.93 KB

Computer vision DH2017

40k images

Trained to find images. beaucoup plus de résultat.

Un modèle qui analyse des images et users, modifie les données liées et améliore les performances.

Possibilité de chercher par le texte, sélection d’une image, accès à des images par similarité. Toutes les version titanesques, etc. Zoom qui permet de visualiser par proximité. Genre de visualisation très efficiente car œil humain très efficace pour repérer des motifs.

Compréhension immédiate des éléments.

Possibilité de sélectionner des ensembles, et à partir de la vision computationnelle seulement possible de relancer la requête. Possibilité de créer des éléments négatifs. Et encore itérer la requête.

L’application offre aussi la possibilité de sélectionner une zone ou un détail d’une image et accéder à d’autres images très léonardesques. En sélectionnant une image.

Important pour nous que l’utilisateur puisse donner des feedback à l’utilisateur. Possibilité de créer des liens pour réutilisation pour d’autres entrainements.

Take away

  • L’interface design important et directement liée aux algorithmes
  • toujours conserver l’humain dans la boucle
  • le diable est dans les détails

http://replica.dhlabdev.org

dh2017

Thomas Smits

Journaux illustrés 19e. Images à l’échelle massive.

Phase 1, harvest toutes les images depuis les journaux. Segmentation.

Dès les années 20 usage massif de l’image aux PB. Parallèlement augmentation progressive des numéros.

Logos des journaux, marqués dans les quantités.

Présence des images variables selon les titres.

2e phase, appliquer ces techniques à notre base de données pour classifier les images.

Voir comment peut être adapté pour grandes bases de données.

  • Ratio pixel (quantité information dans l’image)
  • Entropy

Ge, 2006 [algorithme]

Changement brutal dans les demi-tons.

Baisse de qualité dans les années 10, deviennent alors difficiles à détecter car classificateurs pas entraînés sur ce genre d’objet. Pour ces images, besoin d’un autre classificateur ou d’autres méthodes.

Phase 3 OpenCV et inception, tensors flow pour créer des modèles

Identifier jeux échecs, cartes météos, baromètres, bds, etc. Très efficaces pour ce genre d’images. Pas de benchmatch

Nombreuses images inconnues ou non classifiées. Essayer de faire de nouveaux modèles pour classer plus loin les images.

met en lumière de vieille questions ou permet répondre à des questions historiques.

lab.kb.nl

illustratednewspictures.tumblr.com

discussion

Visual similarité n’est pas une similarité de conception

Computer vision ouvre des champs énormes. pas seulement classification et recherche, mais processer l’information visuelle.

Manovich, composition des films.

distance entre explinatory aspect et performances

Pas de pb dans mon cas si cela ne fonctionne pas.

Kaplan : Relaxer. Système pour chercher des choses trouver des choses aucun de ces choses ne produit du savoir. Décide si ces éléments ont similarités et peuvent être liés. Cela va impacter les disciplines

Comme ce qui est arrivé avec les moteurs de recherche. Nouvelle manière de penser à la culture visuelle.

Travail Underwood sur le prestige. Quand ces modèles statistiques échouent, comment le font-ils ? Comment identifier ces paramètres et expliquer les échecs.

Alison Hedley Ryerson

1er octobre pour le prochain 1er octobre.

Kaplan très précautionneux sur le fait que mise en cause du fait que pas reproductible et donne des résultats aléatoires. Suggère plutôt de commencer par l’utiliser et voir ce que cela fait. Comprendre comment l’utiliser. Se concentrer sur l’accès et la recherche car très efficace. Devient évidemment beaucoup plus problématique lorsque l’on aborde la quantification, etc. Questions d’épistémologie viennent ensuite. Visiblement craint critique.

Getty veut travailler

Idée :

appliquer à corpus porn