AI, eller Artificiell Intelligens, erbjuder otaliga möjligheter för mänskligheten. Samtidigt innebär AI en förändring av arbetsmarknaden, där vissa yrkesroller riskerar att minska i betydelse. Som formgivare kan vi till exempel undra om våra designkunskaper alltid kommer att vara lika efterfrågade i en AI-driven framtid.
En av de mest imponerande användningsområdena för AI inom design är möjligheten att skapa bilder baserat på textbeskrivningar. Jag testade detta med Pixlr AI Image Generator och gav följande beskrivning: ”Marilyn Monroe sitter i röd klänning på ett kontor framför en laptop.” Resultatet var överraskande och visade hur avancerad tekniken har blivit.
För att förstå hur detta fungerar konsulterade jag också ”Chat” (min personliga benämning på ChatGPT), och som vanligt fick jag ett snabbt och detaljerat svar.
Min fråga till ChatGPT:
Hej ”Chat”! Jag testade att skapa bilder med AI och undrar hur tekniken fungerar. Kan du också förklara vad som ligger bakom denna förmåga?
Svar från ChatGPT:
AI som skapar bilder utifrån textbeskrivningar använder generativa modeller. Dessa är en typ av artificiell intelligens som tränas på stora mängder data för att producera nya, liknande data. Här är de två huvudsakliga teknikerna:
1. Generative Adversarial Networks (GANs):
GANs består av två neurala nätverk – en generator och en diskriminator. Generatorn skapar bilder som försöker efterlikna riktiga bilder, medan diskriminatorn avgör om en bild är genererad eller autentisk. Genom denna dynamiska träning förbättras generatorn för att skapa allt mer realistiska bilder.
2. Transformer-modeller:
Dessa modeller är designade för att hantera sekvenser av data, såsom text. GPT-3.5 (som ChatGPT bygger på) är en transformer-modell som kan generera bilder genom att analysera textbeskrivningar och använda tidigare inlärd kunskap för att skapa en visuell representation.
1. Datainsamling:
Modellen tränas på ett omfattande dataset som kopplar textbeskrivningar till matchande bilder. Till exempel kan texten ”en brun hund som springer i en park” kopplas till flera bilder som matchar beskrivningen.
2. Modellträning:
Under träningen lär sig modellen att identifiera mönster och samband mellan text och bild. Den justerar sin förmåga att generera bilder som stämmer överens med givna textbeskrivningar.
3. Bildgenerering:
När modellen är färdigtränad kan den skapa nya bilder baserat på textbeskrivningar. Resultatet beror på modellens träning och på hur detaljerad textbeskrivningen är.
Det är viktigt att notera att AI-genererade bilder inte alltid blir perfekta. Kvaliteten kan variera beroende på träningsdatan och beskrivningens komplexitet. I vissa fall kan bilderna vara mer fantasifulla än realistiska, vilket kan vara både en styrka och en begränsning.
Vill du prova själv? Besök Pixlr AI Image Generator och låt din kreativitet flöda!
Källa: https://openai.com/chatgpt