Este tipo de pluguins existe desde hace tiempo en video (motion perfect y otros). Lo que hacen es un "morphing" (aquello que se puso tan de moda como protagonista en los 90 en videoclips y hoy es una herramienta mas). Se inventa los frames suplementarios y depende bastante de la toma para que pueda reconocer las formas y hacer su trabajo bien.
Por ejemplo hay que usar velocidades altas para que los fotogramas esten bien definidos y no salgan artefactos y movimientos raros.
JavierML, no saca de donde no hay, no hara mejor lo que dices que interpolar tu mismo a mano dos fotogramas "de base" del mismo video.
Por ejemplo, en ese video, fijate que en los momentos que se ralentiza al maximo,las areas de imagen que se mueven son pequeñas en comparacion con el frame entero, eso hace que se tenga que inventar menos pixels y el efecto sea mas aparente.