“Dans ce projet, le problème de la classification supervisée et non supervisée des transitions graduelles de vidéos est traité. On dispose d’une collection de 36 transitions vidéos réparties en 19 étiquettes dissolve, 11 étiquettes wipe et 6 autres transitions réparties en 4 étiquettes différentes qu’on regroupe ensemble. Une transition vidéo est une suite d’images indexée par le temps.
Ainsi, en amont de toute analyse, une première étape consiste à extraire des caractéristiques chiffrés de ces images.
Trois méthodes d’extraction de caractéristiques ont été explorées, à savoir la variance des intensités des pixels, la différence d’histogrammes de couleur et le nombre de contours.
Chaque méthode produit une collection de courbes. La deuxième étape du travail s’est attelée à partitionner en trois classes chaque collection de courbes selon le partitionnement par Dbscan, par agglomération et par les K-means. Ici, l’objectif principal est de savoir si la simple formation apportée par une courbe permet de la discriminer par rapport à une autre courbe de label différent. Il en ressort que pour chaque méthode, les trois classes formées contiennent chacune soit majoritairement du dissolve soit majoritairement du wipe et qu’aucune classe n’est pure.
La troisième et dernière partie du travail consiste à mettre en place une procédure de classification supervisée. Deux méthodes ont été mises en oeuvre à savoir une méthode intuitive basée sur une décomposition du processus de la classification supervisée et le KNN-DTW. Ce dernier qui est une méthode de classification de séries temporelles a été appliquée en prenant comme mesure de dissimilarité la DTW.
Les meilleurs résultats, pour toutes les méthodes, ont été obtenues avec l’approche d’extraction de caractéristiques basée sur la variance des intensités des pixels. En revanche, le classifieur ne parvient pas à bien discriminer la classe autres de wipe et dissolve.
Mots clés : classification supervisée, classification non supervisée, série temporelle, transition vidéo, DTW, Dbscan, CAH, K-means, KNN-DTW.”