Midjourney é uma plataforma de inteligência artificial (IA) gerativa que permite aos usuários gerar obras de arte únicas, como personagens, imagens e representações, por meio de prompts de texto.

Uma plataforma de IA gerativa é um sistema de inteligência artificial capaz de gerar novos e únicos conteúdos, frequentemente em imagens, textos ou outras saídas criativas. Diferente de sistemas tradicionais de IA baseados em regras e projetados para tarefas específicas, plataformas de IA gerativa usam algoritmos avançados, tipicamente baseados em técnicas de aprendizado profundo, para produzir de forma autônoma conteúdos novos e contextualmente relevantes.

Midjourney AI é uma dessas inovadoras plataformas de IA gerativa que abre novas possibilidades para expressão criativa e pode produzir resultados que vão além do que foi explicitamente programado, introduzindo um elemento de imprevisibilidade e criatividade no cenário de IA. Isso pode ser aplicado a vários domínios de arte para criar imagens realistas que não existem no mundo real.

Este artigo discute o que é Midjourney AI, como o Midjourney funciona, prompts eficazes, como o Midjourney é diferente do Dall-E 2 e os benefícios das obras de arte Midjourney. Também aborda a questão persistente: É ético usar arte gerada por IA? Além disso, há um guia passo a passo para usar o Midjourney por artistas para criar obras de arte únicas geradas por IA.

O que é Midjourney AI?

Midjourney é um programa e serviço de IA gerativa da equipe de pesquisa Midjourney, Inc. A equipe do Midjourney é liderada por David Holz, co-fundador da Leap Motion. Como o DALL-E da OpenAI e a Stable Diffusion da Stability AI, o Midjourney cria visuais usando descrições de linguagem natural chamadas prompts.

O site do Midjourney se descreve como "um laboratório de pesquisa independente explorando novos meios de pensamento e expandindo os poderes imaginativos da espécie humana."

Está em beta aberto desde 12 de julho de 2022, e os usuários podem criar obras de arte de alta qualidade com o Midjourney usando prompts baseados em texto em comandos de bot do Discord. Não é necessário hardware ou software especializado para usar o Midjourney. No entanto, para acessar o serviço, é necessário ter uma conta no Discord.

Como funciona o Midjourney?

O Midjourney opera por meio da sofisticada interação de duas tecnologias de aprendizado de máquina: modelos de linguagem de grande escala e modelos de difusão. Quando os usuários inserem prompts, um modelo de linguagem de grande escala decifra o significado das palavras e as transforma em um vetor numérico.

Este vetor é fundamental para guiar o processo de difusão, onde o Midjourney usa um modelo de difusão para transformar ruído aleatório em arte visualmente atraente. Modelos de difusão envolvem adicionar gradualmente ruído aleatório a um conjunto de dados de treinamento de imagens. O modelo se torna habilidoso em gerar imagens totalmente novas ao aprender a reverter esse ruído ao longo do tempo.

Por exemplo, se um usuário insere um texto como “Mineração de Bitcoin com cores vivas e aparência animada”, Midjourney começa com um campo de ruído visual. Através da difusão latente, um modelo de IA treinado sistematicamente subtrai ruído, revelando progressivamente uma imagem que incorpora a essência dos objetos e temas especificados no prompt original.

A sinergia entre compreensão de linguagem e modelagem de difusão capacita Midjourney a criar obras de arte geradas por IA cativantes e diversas com base nas entradas ou prompts dos usuários.

Como começar com Midjourney — Um guia passo a passo

O beta de Midjourney só pode ser acessado através de uma conta no Discord. Aqui está um tutorial passo a passo sobre como usar Midjourney para criar imagens únicas geradas por IA:

Etapa 1: Junte-se ao Discord do Midjourney

Usuários existentes do Discord podem visitar Midjourney.com, clicar no botão “Join the Beta”, ou ir diretamente para o Discord do Midjourney. Para aqueles que não têm uma conta no Discord, registre-se para criar uma conta gratuita no Discord primeiro e depois junte-se ao servidor Discord do Midjourney. Você pode acessar o Discord do Midjourney de qualquer lugar — aplicações web, móveis e desktop.

Etapa 2: Selecione um plano de assinatura

Quando o serviço foi lançado em julho de 2022, qualquer pessoa poderia usá-lo para gerar 25 imagens gratuitamente. No entanto, isso mudou em abril de 2023, com Midjourney pausando o programa de teste gratuito. Midjourney não está mais disponível gratuitamente, exceto por alguns períodos promocionais breves. O plano de preços pode ser encontrado na tabela abaixo.

Etapa 3: Use o comando “/imagine” para gerar arte

Para começar, você pode ir ao canal “#newbies”, seguido de um número no servidor Discord do Midjourney. Existem muitos canais assim, e você pode escolher qualquer um deles. No canal para iniciantes, digite “/” seguido de “imagine” e o prompt para Midjourney gerar as imagens necessárias.

Por exemplo, /imagine prompt: “Mineração de Bitcoin em cores vivas com aparência animada.”

Outro exemplo de um prompt /imagine, “Elementos da blockchain Ethereum em um cenário de tecnologia moderna”, resultou no seguinte:

Quanto tempo Midjourney leva para gerar uma imagem?

Em média, Midjourney leva cerca de um minuto para gerar quatro opções de arte. No entanto, isso não é fixo, e o tempo pode aumentar se alguém quiser uma imagem ampliada ou uma saída de proporção de aspecto não quadrado.

Os planos de assinatura de Midjourney têm modos rápidos e relaxados, que alteram a velocidade de geração conforme o plano assinado. No modo rápido, não é necessário esperar na fila atrás de outros. No entanto, mesmo os planos pagos mais caros têm um limite mensal no número de imagens geradas no modo rápido.

No modo relaxado, os pedidos de imagem são enviados para uma fila. A geração pode levar entre um e 10 minutos para ser concluída. Além disso, Midjourney tem um modo “Turbo” caro que pode ser ativado com o comando “/turbo”. O modo Turbo gera novas imagens quatro vezes mais rápido, mas consome o dobro do tempo de sua cota mensal do plano de assinatura.

Como eu salvo imagens do Midjourney, e quem as possui?

Para salvar a imagem gerada no Midjourney, clique na imagem para abri-la em tamanho completo e, em seguida, clique com o botão direito e escolha a opção “Salvar imagem”. No celular, pressione e segure a imagem e, em seguida, toque no ícone de download no canto superior direito.

Midjourney permite que os usuários vejam todas as imagens criadas anteriormente, incluindo os prompts usados para gerá-las. Para acessar imagens do Midjourney criadas anteriormente no Discord, vá para a aba “Mention” da Caixa de Entrada do Discord e baixe imagens anteriores.

As imagens do Midjourney estão no domínio público, e a propriedade é de código aberto. Midjourney se descreve como uma comunidade aberta que permite que outros usem e remixem imagens e prompts quando postados em um ambiente público. Por padrão, todas as imagens no Midjourney são publicamente visíveis e remixáveis. Portanto, elas podem ser acessadas e modificadas por qualquer pessoa. Isso torna questionável a venda de obras de arte do Midjourney.

Qual é a diferença entre Midjourney e Dall-E 2?

Dall-E 2 é um modelo de texto para imagem e o sucessor de Dall-E construído pelo laboratório de pesquisa OpenAI que lançou o ChatGPT. Em 2019, a OpenAI recebeu mais de US$ 1 bilhão em financiamento da Microsoft e Khosla Ventures e, em janeiro de 2023, após o lançamento do Dall-E 2 e ChatGPT, recebeu um adicional de US$ 10 bilhões em financiamento da Microsoft. Midjourney é autofinanciado e construído por um laboratório independente, Midjourney Inc.

Enquanto Dall-E 2 e Midjourney são baseados em descrições de linguagem natural que geram imagens a partir de prompts, o uso depende de requisitos e preferências específicas. Algumas das diferenças são as seguintes:

  • Acesso: Midjourney pode ser acessado via Discord, enquanto Dall-E 2 está disponível apenas no site da OpenAI.
  • Resolução de imagem: Midjourney pode gerar uma imagem com 1792x1024, enquanto Dall-E 2 gera resolução de 1024x1024.
  • Assinatura: Ambos têm planos de assinatura, e os usuários podem verificar as taxas atualizadas nos respectivos sites para ver qual lhes convém melhor.

Benefícios e como aproveitar o Midjourney

Midjourney permitiu que artistas explorassem vários estilos artísticos, temas e conceitos, fomentando a criatividade e expandindo os limites das formas de arte tradicionais. Artistas podem experimentar com múltiplos parâmetros e técnicas, resultando em saídas versáteis que variam de composições abstratas a representações realistas. É economizador de tempo devido à rápida virada de IA para gerar imagens.

Além disso, a integração com plataformas como o Discord realça os aspectos colaborativos do Midjourney, permitindo que artistas compartilhem ideias, técnicas e criações dentro de uma comunidade de indivíduos com interesses semelhantes.

Besides artistic expression, Midjourney is beneficial for creating product images, illustrations, social media creatives, marketing collaterals, projetos de arte em token não-fungível (NFT), visualizações arquitetônicas e mais.

A arte de IA é legal e ética?

Embora a arte de IA seja legal, suas implicações éticas são multifacetadas e envolvem considerações relacionadas à criatividade, propriedade, viés e impacto social. A contenda comum é que, embora as ferramentas de IA contribuam para a criação, a entrada e orientação vêm dos humanos. Diretrizes claras sobre atribuição e propriedade são essenciais para abordar essas questões.

O uso comercial de arte gerada por IA levanta questões sobre compensação justa e o potencial de plágio. Artistas devem estar cientes das implicações éticas de vender trabalhos gerados por IA e como isso se alinha com as normas estabelecidas no mundo da arte.

Modelos de IA são treinados em conjuntos de dados que podem conter viéses presentes nos dados — viéses de gênero, raciais ou culturais. Isso pode inadvertidamente levar a saídas tendenciosas, reforçando estereótipos ou preconceitos existentes. Artistas e desenvolvedores precisam estar conscientes desses vieses e trabalhar para mitigá-los.

Os recursos computacionais necessários para treinar e executar modelos avançados de IA como Midjourney e Dall-E 2 levantam preocupações ambientais. O discurso ético deve considerar a pegada de carbono associada a operações de IA em grande escala.

VEJA MAIS: