Stemningsmusik med Stablefusion og spectogrammer
Stemningsmusik er så meget sagt, men med Riffusion kan man skabe riffs ud fra tekstinput. Der er ikke tale om en egentligt tjeneste, men mere om en demonstration af hvordan man også kan bruge billedskabelsesalgoritmen Stable Diffusion. En slags eksperiment, men et spændende et af slagsen og meget veldokumenteret.
Kort fortalt anvendes et spektogram – en visuel repræsentation af frekvenser over tid. Den kunstige intelligens til billedskabelse er så trænet på spektogrammer og laver nye spektogrammer ud fra den tekstmæssige forespørgsel. Endelig bliver de forskellige forespørgsler lavet i en række varianter som der skiftes mellem ved at bruge nogle metoder til at smelte billeder sammen (som man kender fra morphing).
Selve tjenesten er simpel. Lidt sjov at lege med og kan i sin nuværende form ikke så meget. Det kan dog være meget sjovt at lave forespørgsler hvor man blander stilarter så man kan starte dagen med banjo og kirkeklokker banjo og kirkeklokker.