Vision par ordinateur (computer vision )



Dans sa forme la plus simple, la vision par ordinateur est ce qui permet aux ordinateurs de «voir» et de traiter les données visuelles .

Les données visuelles peuvent être très difficiles à comprendre pour les ordinateurs. Les humains donnent un sens à ce que nous voyons en fonction de nos expériences et de nos souvenirs. Nous formons nos cerveaux depuis le jour de notre naissance, ce qui désavantage les ordinateurs lorsqu'il s'agit d'interpréter les informations visuelles.

«Tout comme entendre, ce n'est pas la même chose qu'écouter, prendre des photos n'est pas la - Fei-Fei Li, informaticien et directeur du Stanford Vision Lab

Et c'est là qu'intervient le génie de la vision par ordinateur. Avec le soutien de l'intelligence artificielle, des réseaux neuronaux, de l'apprentissage en profondeur, de l'informatique parallèle et de l'apprentissage automatique, la vision par ordinateur aide à combler le fossé entre la vision des ordinateurs et la compréhension de ce qu'ils voient par les ordinateurs .

segmentation sémantique (Semantic segmentation)

  1. segmentation sémantique 
  2. segmentation tumorale
  3. segmentation sémantique en temps réel
  4. segmentation sémantique 3D
  5. segmentation de scène

classification par image (Image classification)

  1. classification d'image 
  2. classification d'image peu prises
  3. classification d'image semi-supervisée
  4. classification d'image a grain fin 

détection d'objets( Object detection)

  1. détection d'objets
  2. détection d'objets 3D
  3. détection d'objets saillants RVB
  4. détection d'objets saillants RVB-D

Génération d'image (image generation)

  1. génération d'image 
  2. traduction d'image en image 
  3. image inpainting 
  4. génération de visage 

Adaptation de domaine (Domain adaptation) 

  1. Adaptation de domaine 
  2. Adaptation de domaine non supervisée 
  3. généralisation du domaine  

Estimation de la pose

  1. Estimation de la pose
  2. Estimation de la pose humaine en 3D
  3. Estimation de la pose 3D
  4. Estimation de la pose de la main
  5. Détection des points clés

Super-résolution

  1. Super-résolution
  2. Super-résolution d'image 
  3. Super-résolution vidéo
  4. Super-résolution multi-images
  5. Super-résolution d'objects 3D

Véhicules autonomes

  1. conduite autonome
  2. véhicules autonomes
  3. Voitures autonomes
  4. localisation et cartographie simultanées
  5. Navigation autonome

Débruitage 

  1. Débruitage 
  2. Bruitage d'image 

Augmentation de données

  1. Augmentation de données
  2. Augmentation d'image
  3. Augmentation de texte

Vidéo

  1. Suivi d’objets
  2. Segmentation d'objets vidéo
  3. Prédiction vidéo
  4. Classification des actions
  5. Classification vidéo

Localisation d'action temporelle 

  1. Reconnaissance des actions 
  2. Localisation d'action basée sur le squelette
  3. Localisation d'action 3D
  4. Localisation d'action faiblement supervisée 

Reconnaissance d'activité

  1. reconnaissance des actions
  2. reconnaissance d'activité
  3. reconnaissance d'activité multimodale
  4. reconnaissance d'activités égocentriques

Reconnaissance faciale et modélisation 

  1. reconnaissance de visage 
  2. reconnaissance Détection faciale 
  3. Alignement du visage 
  4. vérification du visage 
  5. reconnaissance des expression 

Estimation de la profondeur 

  1. Estimation de la profondeur 
  2. Estimation de la profondeur monoculaire
  3. Estimation de la profondeur stéréo
  4. Estimation de la profondeur 3D

Reconnaissance des actions

  1. Reconnaissance des actions
  2. Reconnaissance d'action 3D
  3. Reconnaissance d'action fine

Apprentissage Zero-shot

  1. Localisation d'action temporelle 
  2. Apprentissage Zero-shot
  3. Apprentissage compositionnel Zero-shot

Segmentation d'image médicale

  1. Segmentation d'image médicale
  2. segmentation des lésions
  3. Segmentation des tumeurs cérébrales
  4. Segmentation du cerveau 
  5. Segmentation d'imagerie 3D

3D

  1. reconstruction 3D
  2. Estimation de la pose 3D
  3. Classification des formes 3D
  4. reconstruction de forme 3D
  5. représentation de forme 3D

Reconnaissance gestuelle 

  1. Reconnaissance d'action basée sur le squelette 
  2. Reconnaissance gestuelle
  3. Reconnaissance des gestes de la main 

Reconnaissance des émotions

  1. Reconnaissance des émotions
  2. Reconnaissance multimodale des émotions
  3. Reconnaissance des émotions dans la conversation 
  4. extraction de paires émotion cause

Segmentation d'objets vidéo

  1. Segmentation d'objets vidéo
  2. Détection d'objet saillants vidéo
  3. Segmentation d'objets vidéo semi-supervisée
  4. Segmentation d'objets vidéo non-supervisée

Détection d'action 

  1. Détection d'action 
  2. Reconnaissance d'action basée sur le squelette 

Traduction d'image en image 

  1. Traduction d'image en image en vue croisée
  2. Traduction d'image-image multimodale non supervisée 
  3. traduction synthétique vers réel