Így nézünk ki a Mesterséges Intelligencia szerint

May 17, 2023

Néhány napja elég masszívan magával húzott a Midjourney. Ez egy generatív mesterséges intelligencia program és szolgáltatás, amelyet egy San Francisco-i székhelyű független kutatólaboratórium hozott létre és üzemeltet. A Midjourney természetes nyelvi leírásokból (másnéven "prompt-okból") állít elő szinte bármilyen képet. Ezt úgy kell elképzelni, hogy egy chat ablakban néhány gondolatot leírva, szinte pár másodpercen belül megkapjuk az eredményt.


A rendszer működéséről röviden annyit, hogy az interneten fellelhető több millió fotókat, képeket, grafikákat és az ezeket leíró szövegeket használja tanulásra, melyekből generálja a felhasználó által leírt parancsoknak megfelelő képeket. Részletesebben itt tudtok olvasni.


Néhány óra használat után, olyan ötletem támadt, megnézem, hogyan képzeli el a mesterséges intelligencia a nagy átlagot és milyen általánosításokat végez a rendszer. Kíváncsi voltam milyen portréfotókat "készítene" hétköznapi emberekről anélkül, hogy a parancssorokban bármit is definiálnék. Egyes esetekben tudatosan és direkt nem adtam meg az adott szereplő nemét, vagy épp hangulatát. A kísérlet valahogy így nézett ki;


"Generálj nekem portréfotót egy apáról, nőről, 3 éves kisfiúról, asztalosról, tanárnőről, fodrászról, elítélt bűnözőről, villanyszerelőről..."


Következtetéseket én most itt nem szeretnék levonni, azt majd Rátok bízom, mindenesetre elgondolkoztat, hogy a képeken egyik arc sem mosolyog.