Per Natale ho realizzato una serie di video un po’ particolari: selfie realistici inseriti dentro scene iconiche di film, collegati tra loro da brevi clip in movimento.
Il bello è che non è una cosa limitata alle feste: lo stesso metodo può essere usato per storytelling, contenuti social, branding personale o semplicemente per sperimentare.
In questo articolo ti spiego il processo, in modo semplice e replicabile.
Si parte sempre da una buona immagine (il selfie)
Il primo step non è il video, ma l’immagine statica.
Io parto sempre così:
- preparo una o più immagini di riferimento (una mia foto reale + eventuali reference)
- chiedo a ChatGPT di aiutarmi a scrivere un prompt preciso per Nano Banana Pro (su Leonardo.ai o Higgsfield)
L’obiettivo è uno solo:
👉 ottenere un selfie realistico, coerente nei lineamenti, nell’espressione e nello stile.
ChatGPT in questa fase è utilissimo perché:
- ti aiuta a vincolare l’identità (fondamentale se usi volti reali)
- evita errori comuni (cambi di outfit, espressioni strane, stile cartoon non voluto)
- trasforma un’idea vaga in un prompt chiaro e utilizzabile

Questo è un esempio di prompt che mi ha generato ChatGPT per la realizzazione del Selfie qui sopra. Ovviamente puoi correggerlo come preferisci in base al tuo generatore di immagini AI.
Photorealistic cinematic selfie taken from a high-angle top-down perspective, as if shot with an outstretched arm above the subjects.
The main subject is the same man shown in the provided reference photo: same facial features, beard, hairstyle, hairline, skin tone, and proportions. He is looking directly into the camera, holding the phone, with realistic perspective distortion typical of a selfie taken from above.
Next to him is an actor portraying Jim Carrey as the Grinch from the film "How the Grinch Stole Christmas". The Grinch is also looking into the camera, fully aware of the selfie, with a mischievous, sarcastic expression consistent with the character.
The Grinch appears exactly as in the movie:
– green fur texture, expressive face, prosthetic makeup style
– sharp grin, playful and slightly menacing expression
– hunched but relaxed posture typical of the character
Setting: an authentic scene inspired by the Grinch’s cave on Mount Crumpit, whimsical Christmas environment, warm and colorful lighting, strange gadgets, lights, and decorations visible in the background, slightly out of focus.
Lighting: cinematic warm lighting mixed with soft shadows, cozy yet dramatic Christmas atmosphere.
Camera feel: 35mm film photography, subtle grain, mild color fading, early-2000s cinematic look.
Mood: ironic, playful, surreal but realistic, as if an impossible selfie taken inside a real movie scene.
Ultra-realistic photography, no illustration, no stylization, no caricature.
Una volta ottenuto il prompt giusto, non lo tocchi più. Diventa la base di tutto.

Questo sopra era uno dei primi selfie fatti e non avevo ancora specificato la coerenza dell’abbigliamento. Come vedi più si è precisi dall’inizio, meno errori si fanno successivamente.
Dal selfie al video, ma prima…
Prima ancora di creare i video, conviene mettere nero su bianco la sequenza dei selfie che vuoi ottenere. È un passaggio banale, ma ti salva tempo perché ti fa lavorare con metodo.
Io ad esempio mi ero scritto qualcosa del genere e volontariamente ho voluto alternare un film italiano con uno straniero.
- Una Poltrona per Due (selfie con Dan Aykroyd + Eddie Murphy)
- Vacanze di Natale 95 (selfie con Massimo Boldi)
- Mamma ho perso l’aereo (selfie con Macaulay Culkin)
- Vacanze di Natale 91 (selfie con Alberto Sordi + De Sica + Boldi)
- Grinch (selfie col Jim Carrey)
- La banda dei Babbi Natale (selfie con Aldo Giovanni e Giacomo)
- Love Actually (selfie con Bill Nighy)
- Merry Christmas (selfie con De Sica + Enzo Salvi)
- Nightmare Before Christmas (selfie con Jack)
- Vacanze di Natale 83 (selfie con Guido Nicheli)
- …e chiusura del cerchio tornando al primo set
Tu puoi scegliere i tuoi passaggi come meglio credi, l’importante è ricordarseli per eseguire bene tutte le mini clip.
Realizzazione delle clip: Start Frame e End Frame
Arrivati a questo punto, entra in gioco la parte video vera e propria. Io utilizzo Kling perché permette una cosa fondamentale: lavorare con Start Frame ed End Frame.
Cosa sono Start Frame ed End Frame
- Start Frame – È l’immagine da cui il video parte. Nel mio caso è quasi sempre il selfie appena creato con Nano Banana Pro.
- End Frame – È l’immagine verso cui il video deve arrivare. E quindi un altro selfie, ambientato in una scena diversa.
In pratica stai dicendo al modello: “Parti da questa immagine e arrivaci a quest’altra, creando un movimento credibile nel mezzo.” In questo modo l’AI non deve inventare nulla, deve solo partire ed arrivare visivamente a qualcosa che ha già “visto”.
Usare Start Frame ed End Frame ti permette di mantenere coerenza dei personaggi, evitare che il modello inserisca volti o ambienti e controllare meglio la narrazione. Senza questi due punti di riferimento, l’AI tende a cambiare outfit, spostare i soggetti o creare scene non richieste.
Prompt template per un passaggio (Start frame → End frame)
Qui viene la parte più comoda: invece di inventarti ogni volta un prompt da zero, puoi chiedere a ChatGPT di generarlo partendo da un template stabile.
Io ho usato questa base (la trovi qui sotto): è pensata per far fare al personaggio una corsa verso destra, con telefono in mano, e cambiare set “durante il movimento”, senza tagli. La corsa è solo una delle tante azioni possibili, ma è semplice e molto stabile per questo tipo di transizioni. Il prompt deve essere chiaro su alcune cose, ambienti che cambiano in modo naturale, il personaggio principale resta coerente, con un movimento continuo e, soprattutto, senza nessun “teletrasporto” (E, credimi, ho visto cose che voi umani…).
(questo è il prompt che poi cambi solo nei nomi e nei set)
Cinematic video with continuous action.
At the beginning, the main character wearing a red Christmas sweater is taking a selfie together with [START_CHARACTER] inside a setting inspired by [START_MOVIE]. Both are clearly visible and looking into the camera.
IMPORTANT: The main character keeps the SAME clothing throughout the entire video. No hat, no headwear, no new accessories, no outfit changes at any moment.
The main character lowers the phone and immediately starts running toward the right side of the frame. The handheld camera follows him closely from the side.
While he keeps running to the right, the surrounding environment changes naturally into a setting inspired by [END_MOVIE].
[END_CHARACTER] is already present in the new environment, visible on the right side of the frame, standing still and facing the camera, dressed consistently with the film.
The main character runs toward [END_CHARACTER], stops next to them, raises the phone again, and takes a selfie together with them.
Continuous physical movement, no cuts, no teleportation, no invented scenes.

Come chiederlo a ChatGPT (testo pronto da copiare)
Quando avevo già lo start frame e l’end frame, incollavo a ChatGPT una richiesta così (copiala e cambia solo i nomi):
Scrivimi un prompt per Kling (start frame / end frame) usando questo stile e questa struttura.
START: [descrizione precisa dello start frame e personaggi]
END: [descrizione precisa dell’end frame e personaggi]
Vincoli:
- il protagonista mantiene sempre lo stesso outfit
- corre verso destra
- camera handheld che lo segue
- l’ambiente cambia durante la corsa
- nel set finale i personaggi sono già presenti
- niente tagli, niente teleport, niente scene inventate
Restituiscimi solo il prompt finale (in inglese).
Se vuoi puoi aggiungere anche “personaggi esterni” del set cinematografico come fanno in molti (cameramen, registi, truccatori, microfonisti etc) , ma io ho preferito una versione più realistica.
Clip brevi, controllo totale
Ultimo consiglio pratico: meglio clip brevi (4–6 secondi) che video lunghi.
Io preferisco tante clip controllate da montare poi insieme piuttosto che un unico video complesso difficile da correggere.
Non serve esagerare: meglio pochi secondi fatti bene che clip lunghe e confuse.
Il montaggio finale: dare continuità a tutto
Una volta generate tutte le clip, il lavoro più “creativo” è praticamente fatto.
Il montaggio finale è la parte più semplice di tutto il processo, a patto di aver fatto una scelta fondamentale prima: il formato del video. Questo va deciso all’inizio, quando crei i selfie statici, perché quelle immagini saranno la base di tutto il lavoro successivo. Verticale, orizzontale o quadrato: una volta scelto, va mantenuto coerente in ogni immagine e in ogni clip.
Quando arrivi al montaggio, infatti, il formato è già “chiuso”. Non devi adattare nulla, ma solo mettere in sequenza ciò che hai già costruito correttamente a monte.
Io non utilizzo nulla di complesso: va benissimo qualsiasi software di editing video, da CapCut a Filmora, fino a Premiere o Final Cut. La cosa importante non è lo strumento, ma l’approccio. Le clip vanno semplicemente posizionate in sequenza, rispettando l’ordine che avevi scritto all’inizio nella tua scaletta.
In questa fase conviene intervenire il meno possibile. I passaggi funzionano già da soli, quindi il montaggio serve più che altro a rifinire i punti di contatto tra una clip e l’altra, tagliando eventuali attimi morti all’inizio o alla fine. Spesso basta anche mezzo secondo in meno per rendere il tutto più fluido.
Se vuoi aggiungere una musica, il consiglio è di sceglierne una continua, che accompagni tutto il video dall’inizio alla fine. In questo modo i cambi di scena risultano ancora più naturali e l’effetto “collage” scompare. Anche qui, meno si tocca e meglio è: niente effetti invasivi, niente transizioni elaborate. Il vero effetto wow è già nel contenuto.
A questo punto il lavoro è praticamente concluso. Il montaggio non è il momento in cui “salvi” il progetto, ma quello in cui lo rispetti: se il processo a monte è stato fatto bene, qui serve solo ordine, pulizia e un minimo di ritmo.

Il risultato finale non è un semplice video, ma una piccola storia visiva costruita per step. E soprattutto è qualcosa che puoi rifare, migliorare e adattare ogni volta che vuoi, cambiando tema, personaggi o contesto.
Questo metodo non è una formula magica, ma un modo ordinato di lavorare con strumenti che oggi abbiamo già a disposizione. Separare le fasi – immagine, video, montaggio – permette di mantenere il controllo creativo senza farsi trascinare dall’AI, che altrimenti tende sempre a fare “di testa sua”.
Il punto non è replicare esattamente i video che ho fatto io per Natale, ma capire la logica che c’è dietro: una sequenza pensata prima, immagini solide come base, passaggi semplici e coerenti, montaggio essenziale. Una volta interiorizzato il processo, il tema diventa quasi irrilevante.
Che sia un progetto personale, un racconto visivo o un esperimento creativo, il metodo resta lo stesso. Cambiano solo le immagini, le storie e il contesto.
Se questo approccio ti incuriosisce e vuoi approfondirlo, oppure se stai cercando qualcuno che ti aiuti a sviluppare contenuti di questo tipo in modo professionale, puoi contattarmi direttamente tramite il sito. Sarò felice di parlarne, sia per semplice confronto sia per lavori più strutturati.


