
Fundamentos que vão te tornar expert em criação de prompts, independente da IA que você estiver usando.
Let's cook
Um prompt bem construído é como uma receita detalhada para um chef: quanto mais específico você for, melhor será o resultado final. Na criação de imagens com inteligência artificial, cada palavra importa e cada detalhe omitido se torna uma decisão que a IA tomará por você - nem sempre da forma que você imaginou.
Coloque na ordem
Um prompt bem construído é como uma receita detalhada para um chef: quanto mais específico você for, melhor será o resultado final. Na criação de imagens com inteligência artificial, cada palavra importa e cada detalhe omitido se torna uma decisão que a IA tomará por você - nem sempre da forma que você imaginou.
Modelos como CLIP (usado pelo Midjourney e Stable Diffusion) processam prompts dando maior “atenção” aos primeiros elementos mencionados. É como se a IA lesse da esquerda para a direita, dedicando mais recursos neurais às primeiras informações - exatamente como nosso olho humano varre uma fotografia, focando primeiro no sujeito principal antes de processar detalhes secundários.
Anatomia do prompt
A construção de um prompt eficaz segue uma hierarquia específica de elementos, espelhando como as redes neurais foram treinadas para interpretar descrições visuais:
SUJEITO
AÇÃO/POSE
EXPRESSÃO
AMBIENTE
LUZ
ÂNGULO
ENQUADRAMENTO
EQUIPAMENTO
ESTILO
QUALIDADE
PARÂMETROS TÉCNICOS
Sujeito
Idade e gênero:
Mulher de 30 anos, homem maduro de 45 anos, adolescente de 16 anos, executiva de meia-idade
Etnia e origem:
Homem afro-brasileiro, mulher asiática, executivo latino-americano, modelo nórdica
Estrutura facial:
Rosto angular com maçãs marcantes, feições delicadas, mandíbula quadrada, rosto oval harmônico
Cabelos – textura e comprimento:
Cabelo cacheado até a cintura, corte pixie platinado, cabelo liso até os ombros, chanel bob reto
Cabelos – cores:
Loiro mel, castanho chocolate, ruivo cobre, grisalho prateado
Olhos – cor e formato:
Olhos amendoados cor de mel, olhos azul-acinzentados, olhos verdes esmeralda, olhos grandes e redondos
Características únicas:
Cicatriz na sobrancelha, tatuagem no antebraço, sardas pelo rosto, covinha pronunciada
Ação
Pose
Expressão
Linguagem corporal:
Braços cruzados, mãos nos quadris, braços relaxados, uma mão no bolso
Poses profissionais:
Postura ereta e confiante, inclinado para frente, sentado elegantemente, pose de liderança
Poses casuais:
Relaxado e natural, encostado na parede, caminhando naturalmente, rindo autenticamente
Interação com objetos:
Segurando xícara de café, digitando no laptop, usando smartphone, ajustando gravata
Direção do olhar:
Olhando para câmera, olhar de soslaio, olhando pensativo, olhar misterioso
Expressões faciais:
Sorriso autêntico, meio sorriso, expressão séria, semblante pensativo, assustada, apavorada
Ambiente Cenário
Ambientes internos corporativos:
Escritório moderno, sala de reunião, coworking contemporâneo, loft empresarial
Ambientes internos casuais:
Café parisiense, loft industrial, apartamento minimalista, biblioteca clássica
Ambientes externos urbanos:
Rooftop com vista, rua de paralelepípedos, praça movimentada, terraço urbano
Ambientes externos naturais:
Praia ao nascer do sol, campo de lavanda, floresta tropical, lago cristalino
Elementos de fundo – texturas:
Parede de tijolos expostos, concreto aparente, vidraças do chão ao teto, madeira ripada
Elementos de fundo – objetos:
Estante com livros, quadros abstratos, plantas pendentes, poltrona design
Atmosfera emocional:
Ambiente aconchegante, cenário dinâmico, atmosfera misteriosa, ambiente sereno
Iluminação
Tipos de luz natural:
Golden hour, blue hour, luz natural difusa, luz de janela lateral
Qualidade da luz:
Luz suave, luz dramática, iluminação difusa, contraluz artístico
Direção da iluminação:
Luz frontal suave, luz lateral, backlight, rim light
Temperatura de cor:
Luz quente 3200K, luz fria 5600K, luz dourada, luz azulada
Iluminação artificial:
Luz de estúdio, neon urbano, luz de vela, iluminação LED
Efeitos especiais de luz:
Volumetric lighting, god rays, lens flare sutil, sombras projetadas
Ângulo Enquadramento
Distância da câmera:
Extreme close-up, close-up, medium close-up, plano médio, plano americano, plano geral, plano conjunto, plano detalhe
Altura da câmera:
Eye level, low angle, high angle, bird’s eye view, worm’s eye view, dutch angle, câmera na altura do peito, ground level shot
Composição clássica:
Rule of thirds, composição centralizada, leading lines, simetria, diagonal composition, triangular composition, golden ratio, spiral composition
Técnicas de enquadramento:
Framing within frame, negative space, tight crop, loose composition, off-center subject, balanced composition, dynamic framing, minimalist framing
Perspectiva:
Linear perspective, atmospheric perspective, forced perspective, wide angle perspective, telephoto compression, fisheye distortion, macro perspective, architectural perspective
Orientação:
Formato retrato, formato paisagem, composição quadrada, panorâmica, formato vertical 9:16, formato cinema 21:9, formato Instagram 4:5, formato ultra-wide
Movimento da câmera:
Static shot, handheld movement, camera tilt, rotation movement, zoom in perspective, pull back shot, tracking movement, cinematic movement
Equipamento Configurações
Câmeras:
Canon 5D Mark IV, Leica M10, Sony A7R IV, Hasselblad medium format
Lentes:
85mm f/1.4, 50mm f/1.8, 24-70mm f/2.8, macro 100mm
Configurações técnicas:
Shallow depth of field, f/2.8, bokeh cremoso, tudo em foco
Estilo fotográfico
Gêneros fotográficos:
Portrait style, fashion shoot, lifestyle capture, street photography, documentary approach, fine art style, commercial shoot, editorial style, corporate headshot, beauty portrait, conceptual art, architectural photography
Movimentos e estilos artísticos:
Vintage aesthetic, retro style, modern minimalism, classic elegance, contemporary look, avant-garde style, surreal imagery, dramatic noir, soft romantic, urban contemporary, rustic charm, bohemian aesthetic
Referências de fotógrafos famosos:
Annie Leibovitz style, Helmut Newton inspired, Peter Lindbergh aesthetic, Mario Testino fashion, Richard Avedon portrait, Irving Penn elegance, Steven Meisel editorial, Bruce Weber lifestyle, Paolo Roversi romantic, Tim Walker
Técnicas de processamento:
Film look, analog feel, modern color grading, black and white, sepia tones, cross-processing, vintage film grain, HDR processing, soft focus, high contrast, matte finish, glossy finish
Qualidade visual específica:
Cinematic style, magazine editorial look, high fashion aesthetic, commercial advertising style, artistic fine art approach, photojournalistic feel, glamour style, natural documentary approach
— Nota: Em meus testes, percebo que o Midjourney responde melhor em relação aos estilos, principalmente quando é citado uma referência de fotógrafos conhecidos. Essa competência sugere uma de base de treinamento rica em portfolios de fotógrafos renomados, arte editorial de alta qualidade e uma vasta coleção de imagens categorizadas por estilo e autoria.
Parâmetros técnicos
Qualidade de imagem:
Hyperrealistic, sharp focus, crystal clear
Qualidade profissional:
Professional photography, commercial quality, award-winning photograph, magazine quality
Estética:
Cinematic look, editorial style, natural skin tones, professional color grading
O peso das palavras
Quando uma IA processa seu prompt, ela não trata todas as palavras com igual importância. Existe um sistema de atenção weighted (ponderada) que funciona assim: imagine que a IA tem 100 pontos de “atenção” para distribuir entre todas as palavras do seu prompt. As primeiras palavras podem receber 20-30 pontos cada, enquanto as últimas podem receber apenas 2-3 pontos.
Os percentuais de impacto que apresento neste guia são baseados em observação empírica de milhares de testes práticos, não em estudos científicos formais. Eles representam o impacto relativo que cada elemento demonstrou ter nos resultados finais durante minha experiência com diferentes ferramentas de IA. Essa hierarquização reflete tanto princípios fotográficos tradicionais quanto a forma como as IAs processam linguagem natural - priorizando informações contextuais principais antes de refinamentos técnicos.
SUJEITO PRINCIPAL
AÇÃO E POSE
AMBIENTE E CENÁRIO
ILUMINAÇÃO
ÂNGULO E ENQUADRAMENTO
EQUIPAMENTO E CONFIGURAÇÕES
ESTILO FOTOGRÁFICO
Como as IAs de imagem são treinadas
Imagine que você está ensinando uma criança a reconhecer diferentes tipos de fotografias. Você mostraria milhões de fotos para ela, explicando: “isso é um retrato”, “isso é uma paisagem”, “isso é luz dourada”, “isso é um close-up”. É exatamente assim que as inteligências artificiais de imagem aprendem.
Uma biblioteca gigantesca
As IAs como Midjourney e Visual Electric foram treinadas com bilhões de imagens coletadas da internet, cada uma acompanhada de descrições textuais. Essa base de dados funciona como uma biblioteca imensa onde a IA aprende a associar palavras com elementos visuais específicos.
Por exemplo, quando a IA vê milhares de fotos acompanhadas da descrição “golden hour”, ela começa a entender que essa expressão se refere àquela luz dourada e suave do final da tarde. Quando encontra “bokeh”, aprende que se trata daquele fundo desfocado e cremoso típico de lentes abertas.
Como a base de treinamento molda a personalidade visual das IAs
Cada ferramenta de IA generativa de imagens desenvolve uma “personalidade fotográfica” única baseada em como e com quais dados foi treinada. É como se cada IA tivesse frequentado uma escola de fotografia diferente e desenvolvido seu próprio estilo visual característico.
A origem determina o destino
Quando falamos de Midjourney e Visual Electric, estamos comparando duas filosofias visuais completamente distintas, forjadas por bases de treinamento fundamentalmente diferentes. O Midjourney foi nutrido principalmente por portfolios de artistas conceituais e digitais, fotografia cinematográfica e editorial de alta produção, arte fantástica e sci-fi, além de imagens de plataformas criativas como Behance e ArtStation.
Em contraste, o Visual Electric cresceu alimentado por bancos de imagens comerciais como Getty, Shutterstock e Adobe Stock, fotografia publicitária e corporativa, bancos de mockups, retratos comerciais e lifestyle profissional, e material editorial de revistas e campanhas.
O reflexo no resultado final
Essa diferença na “educação visual” se traduz em comportamentos razoavelmente distintos entre as duas plataformas. O Midjourney funciona como um fotógrafo conceitual que me parece, muitas vezes, ter dificuldade em gerar uma foto “simples”. Mesmo quando você pede um headshot corporativo básico, ele automaticamente adiciona iluminação dramática, composições cinematográficas, elementos visuais inesperados.
É uma IA que “pensa grande” visualmente, sempre buscando impacto estético. Por outro lado, o Visual Electric opera como um fotógrafo comercial experiente que entende exatamente o que o cliente precisa. Quando você pede um headshot corporativo, ele entrega iluminação profissional mas natural, composições comercialmente viáveis, resultado limpo e utilizável, e um aesthetic que funciona no mundo real dos negócios.
O diferencial técnico do Midjourney
Além das diferenças estilísticas fundamentais, o Midjourney oferece um arsenal de controles de refinamento que o Visual Electric ainda não possui. Entre os parâmetros de controle avançado, destacam-se o stylize que controla o nível de interpretação artística, o weird que introduz elementos surreais e únicos numa escala, e o style raw que oferece um modo mais literal e menos interpretativo. Além disso, possui recursos como Moodboard e Global Profile que permitem controlar os resultados objetivos. Isso torna o Midjourney a ferramenta perfeita quando você não sabe muito bem o que quer e precisa fazer a IA pensar por você, te dando sugestões através do caos e da imprevisibilidade. Abaixo, uma exemplo prático dessa diferença:

Midjourney

Visual Electric
O mesmo prompt foi aplicado e a ideia foi simular atmosfera de um filme de terror. Note que o Midjourney gerou uma imagem mais artística sem se preocupar exatamente com o fato da pessoa ser bonita ou a imagem ser agradável. Já o Visual Electric, apesar de trazer essa atmosfera de filme de terror, gerou uma modelo, digamos, mais “padrão”.
A importância prática dessa compreensão
Compreender essas diferenças fundamentais permite escolher a ferramenta certa para cada tipo de projeto, adaptar seus prompts à personalidade específica de cada IA, aproveitar os controles únicos de cada plataforma e gerenciar expectativas sobre o tipo de resultado que cada uma produzirá naturalmente.
O Midjourney brilha em projetos que demandam impacto visual e criatividade artística, como campanhas conceituais, material editorial de alta produção e qualquer trabalho onde o drama visual seja bem-vindo. Seus controles avançados permitem refinar o nível de interpretação artística, desde resultados mais literais até criações completamente surreais e experimentais.
O Visual Electric, por sua vez, se destaca em aplicações comerciais diretas, branding, projetos de identidade visual e qualquer projeto onde a naturalidade e a utilidade prática sejam prioritárias sobre o impacto artístico.
Eu costumo usar a seguinte analogia: o Visual Electric é um cavalo domado. É dócil e compreensível. Não é preciso muito pra se chegar a bons resultados. Ele entrega boas imagens de primeira, te dando maior previsibilidade. O Midjourney é um cavalo selvagem. Pra conseguir o que você precisa, é necessário saber domá-lo e muitas vezes vai te trazer resultados inesperados. Porém, se você precisa de algo mais visceral, intenso, dramático, verossímil, desordenado, caótico, ele é a ferramenta perfeita para exploração.
A colaboração consciente
Não se trata de uma ferramenta ser superior à outra, mas sim de cada uma ter sido moldada por diferentes escolas visuais durante seu treinamento. É como ter um fotógrafo artístico e um fotógrafo comercial na sua equipe, cada um brilhando em contextos específicos e trazendo suas próprias referências e sensibilidades visuais para o projeto.
O segredo está em entender que você não está apenas usando uma “IA que faz imagens”, mas sim colaborando com personalidades visuais distintas, cada uma com suas próprias referências, preferências e pontos fortes herdados de seu processo de treinamento único. Essa consciência transforma o uso dessas ferramentas de uma tentativa e erro aleatória para uma parceria criativa direcionada e eficiente.
O problema com negações
As IAs de imagem têm uma dificuldade fundamental em processar negações. Quando você escreve “homem sem barba”, a IA foca nas palavras “homem” e “barba”, frequentemente ignorando o “sem”. Isso acontece porque durante o treinamento, ela aprendeu associações entre palavras e elementos visuais, mas não desenvolveu uma compreensão robusta de ausências ou negações.
Exemplos
Problema
Possível solução
Homem sem barba
Provavelmente vai gerar um homem com barba
Homem com rosto limpo e barbeado
Mulher sem óculos
Provavelmente vai gerar uma mulher com óculos
Mulher com olhos visíveis e descobertos
Ambiente sem pessoas
Provavelmente vai gerar um ambiente com muitas pessoas
Ambiente vazio e deserto
Midjourney
No Midjourney, use o parâmetro —no seguido dos elementos que você quer evitar. Para gerar um hamburguer sem alface, meu prompt ficaria mais ou menos assim:
professional food photography of a gourmet burger, sesame bun, beef patty, cheese, tomato, pickles, studio lighting, 85mm lens —no lettuce, vegetables, greens
Nesse caso, eu estou não só especificando item por item, mas também negativando a palavra alface.
Visual Electric
O Visual Electric possui uma funcionalidade própria para a negativação, que fica no canto inferior da área onde você insere seu prompt
Ainda assim, é importante manter a especificação dos itens para um melhor resultado.
Nem sempre você precisa ser específico.
Uma das abordagens mais poderosas para trabalhar com ferramentas de IA é não tentar controlar cada detalhe da imagem. Às vezes, a magia acontece quando deixamos lacunas propositais para que a IA preencha com sua própria interpretação criativa.
Onde deixar as lacunas estratégicas
Detalhes físicos específicos:
Em vez de definir cor exata dos olhos, tipo de cabelo ou etnia, deixe que a IA escolha características que se harmonizem naturalmente com o conceito geral.
Elementos de fundo:
Mencione apenas o tipo de ambiente (“escritório moderno”, “café aconchegante”) sem especificar cada objeto, permitindo que a IA adicione elementos que enriqueçam a composição.
Pose e expressão:
Descreva a energia desejada (“confiante”, “relaxado”, “pensativo”) ao invés de poses específicas, permitindo interpretações mais naturais.
Os benefícios dessa abordagem
Essa colaboração criativa com a IA frequentemente resulta em:
Surpresas positivas:
Combinações inesperadas que você não teria pensado
Naturalidade:
Poses e expressões mais orgânicas
Coerência visual:
A IA tende a criar elementos que se complementam
Eficiência:
Menos iterações necessárias para chegar a um resultado satisfatório.
Quando ser específico vs. quando deixar livre
Seja específico quando:
O conceito visual for essencial para a mensagem (branding, produto específico, estilo fotográfico particular).
Deixe livre quando:
Buscar autenticidade, explorar possibilidades criativas ou quando os detalhes específicos não impactam o objetivo principal da imagem.
A parceria criativa
Lembre-se: você não está perdendo controle criativo, está ganhando um parceiro colaborativo. A IA pode sugerir soluções visuais que expandem sua visão inicial, criando resultados que combinam sua direção criativa com a capacidade generativa da tecnologia.
Essa abordagem transforma o processo de criação de uma instrução rígida em uma conversa criativa, onde cada prompt se torna uma nova oportunidade de descoberta visual.
E diferença entre gerar com e sem intenção.
Quando você desenvolve um projeto de marca, cada imagem precisa ser um embaixador visual da sua identidade. A diferença entre gerar imagens com e sem intenção aqui é a diferença entre construir uma marca coerente ou criar uma colcha de retalhos visual.
Embora o tema central seja o mesmo – uma executiva em seu escritório – a primeira imagem foi criada com intenção, focando em uma persona específica. O prompt foi criado preenchendo todas as especificações. Não que a segunda seja uma imagem ruim, mas não é específica, portanto, não há controle algum sobre as variáveis.
Parabéns!
Você acabou de descobrir os elementos fundamentais que separam um prompt básico de uma criação verdadeiramente profissional. Com essas técnicas em mãos, você já pode criar imagens com a precisão de um diretor de fotografia experiente.
Mas aqui está o segredo: conhecer os elementos técnicos é apenas o primeiro passo. O que realmente transforma uma boa foto em uma obra memorável é a direção de fotografia - a capacidade de contar histórias através da linguagem visual, criar atmosferas envolventes e transmitir emoções através de cada escolha técnica. Preparamos uma página especial onde você vai descobrir como aplicar os conceitos de direção de fotografia aos seus prompts. Você vai aprender a pensar como um diretor, combinando técnica com narrativa visual para criar imagens que não apenas impressionam, mas que realmente comunicam e emocionam. [Acesse nossa página sobre direção de fotografia →]
CNPJ: 24.286.053/0001-89








