Prompt Engineering
Cómo escribir prompts efectivos para Seedance 2.0
ℹ Mentalidad de Director
Seedance 2.0 se "dirige", no solo se describe. Estructura tus prompts como un guion técnico: asigna roles a los assets, describe la escena por beats y controla cámara/luz/audio explícitamente.
Longitud ideal del prompt
La longitud óptima es de 30-200 palabras (idealmente 60-100). Muy corto = falta información y el modelo "alucina" detalles. Muy largo = satura la ventana de contexto del LLM de planificación y causa pérdida de consistencia.
Para trabajos "directables", la longitud efectiva suele ser moderada pero estructurada (roles + 2-4 beats). Los prompts largos no son problemáticos si están bien organizados.
La Fórmula de 6 Pasos
El orden no es arbitrario — define la topología de la escena desde lo más denso hasta lo más volátil:
Sujeto (Subject/Character)
Quién o qué ancla la escena. Siempre en la primera línea. El modelo pesa más los tokens iniciales. Si mencionas múltiples sujetos al inicio, la atención se divide.
Acción / Movimiento
Qué hace el sujeto. Verbos específicos en presente, cuantificando intensidad. Un verbo de acción por plano — múltiples verbos confunden al modelo.
Entorno / Escenario
Geometría de fondo y contexto espacial. Ayuda al modelo a calcular escala relativa y oclusión.
Estilo visual / Estética
Un "ancla visual" clara: nombre de película, técnica fotográfica o material. Evita listas largas de adjetivos abstractos.
Movimiento de cámara
Tipo de plano + movimiento. Configura la lógica del encuadre para que el modelo no "re-decida" la distancia focal cada pocos segundos.
Iluminación / Audio / Restricciones
Luz volumétrica, instrucciones de sonido, y constraints ("maintain face consistency, no distortion").
Sistema de etiquetas @
Al subir archivos, Seedance asigna etiquetas automáticas: @Image1,
@Video1,
@Audio1.
Debes referenciarlas explícitamente en el prompt con un rol asignado.
Haz que el hombre baile como el video
El personaje de @Image1 realiza los movimientos de baile de @Video1, sincronizando labios con @Audio1
Patrones de asignación de roles:
- ▸ Identidad: "La apariencia del personaje se basa en @Image2"
- ▸ Escenario: "El entorno replica las estructuras de @Image3"
- ▸ Motion: "Replica el movimiento de cámara de @Video1"
- ▸ Reemplazo: "Reemplaza el frasco en @Video1 con el reloj de @Image1"
- ▸ Ritmo: "Alinea los cortes con el compás de @Audio1"
⚠ Etiqueta sin función = caos
Una etiqueta @ referenciada sin un rol declarado es la principal causa de resultados impredecibles. Siempre especifica qué función cumple cada asset.
Timeline Prompting (timestamps)
Técnica avanzada para controlar qué pasa en cada momento del video:
(0-5s) Interior close-up on driver, hand tightens on gear shift, dashboard lights glowing. Warm amber practicals. (5-10s) Over-the-shoulder shot, road ahead stretching into neon-lit city, engine vibration building. SFX: engine hum crescendo. (10-15s) Extreme close-up on finger pressing button, instant acceleration. Cinematic 4K, film grain, anamorphic, warm shadows and cool highlights.
Reglas del timeline prompting:
- ▸ Divide en 2-3 beats (no más)
- ▸ Cada beat: 2-3 oraciones máximo
- ▸ Entre beats, instrucción conectiva de cámara o cambio de escena
- ▸ Termina con nota estética global
Keywords que funcionan
El modelo responde a vocabulario cinematográfico estándar. Estos descriptores mejoran resultados consistentemente:
Cámara
low-angle, handheld, tracking, push-in, pan, fast-panning, slow motion, ultra-slow motion, dolly zoom, rack focus
Ritmo / Transiciones
quick pans, cut abruptly, seamless transition, hard cut, one continuous tracking shot
Iluminación
warm soft lighting, golden light, rim light, backlighting, neon, motivated practicals, film noir
Audio
ambient sound only, voiceover, background music, synchronized with visual rhythm, foley
✕ Palabras peligrosas
Adjetivos vagos como "cinematográfico" (solo), "épico", "asombroso" o "hermoso" no dan dirección al modelo y causan resultados genéricos. Usa descriptores concretos.
Sufijos de calidad
Añade un bloque al final del prompt para forzar renderizado superior:
4K, Ultra HD, rich details, sharp clarity, cinematic texture, natural colors, soft lighting. No blur, no ghosting, no flicker, stable image. Maintain face and clothing consistency, no distortion, high detail.
Reglas clave
| Regla | Detalle |
|---|---|
| Longitud | 30-200 palabras. Sweet spot: 60-100 |
| Tokens iniciales | El modelo pesa más el inicio. Sujeto en primera línea |
| Una acción por plano | Múltiples verbos de movimiento confunden al modelo |
| Max 1-2 personajes | Más de dos = pérdida de consistencia |
| No hay negative prompts | Usa restricciones positivas: "no blur, stable image" |
| Subtítulos | Añade "Generate video without subtitles" si no los quieres |
Ejemplos: efectivo vs inefectivo
A woman walking in a forest
Slow dolly push forward, a woman in a red coat walking through a misty autumn forest, leaves falling around her, golden diffused morning light, cinematic color grade, shallow depth of field. Maintain face and clothing consistency, no distortion, high detail.
0-5s: Wide shot of a rain-soaked street at night, neon reflections in puddles. Camera: smooth lateral tracking at waist level. Light: magenta and cyan neon, high contrast, volumetric haze. Audio: urban ambience (soft rain, distant traffic), no voice. 5-10s: Medium shot of subject with umbrella, walks 6 steps and stops beneath a sign. Camera: slow push-in. Audio: subtle beat enters, synced with the stop. 10-15s: Close-up, micro-expression of relief. Camera: rack focus from sign to face. Constraint: maintain wardrobe and color continuity; avoid flicker and facial distortion.