Microsoft onthult grote stap richting 'algemene' AI

Microsoft onthulde eerder deze week Kosmos-1 in een paper, een vroege stap in de richting van algemene AI. Het 'multimodale model' kan volgens de onderzoekers contextueel denken en op deze manier tekst begrijpen en genereren, maar ook afbeeldingen analyseren, van commentaar voorzien en vragen op basis van visuele informatie beantwoorden. Naar eigen zeggen wil Microsoft het model binnenkort met ontwikkelaars delen voor verdere ontwikkeling.

Algemene AI is een hypothetisch ideaal voor kunstmatige intelligentie waarbij het model een beetje zoals de mens alle vormen van 'denken' kan uitvoeren. Momenteel maakt men vanwege de beperkingen van AI vooral hele doelgerichte modellen die één taak heel goed kunnen uitvoeren. ChatGPT is in principe een taalmodel, wat wil zeggen dat de revolutionaire chatbot alleen goed is in het verwerken en genereren van taal.

Kosmos-1 is een AI in een andere richting geprogrammeerd. Er is een onderliggen taalmodel om tekst te kunnen begrijpen en genereren, maar tegelijkertijd verwerkt de kunstmatige intelligentie beelden en moet het contextueel deze beelden verwerken. Kosmos-1 werd daarnaast blootgesteld aan een visuele IQ-test, maar de resultaten waren in dit geval wat twijfelachtig; in grofweg een kwart van de gevallen was het model in staat om een antwoord te genereren.

Kortom, zoals altijd bij dergelijke op papier baanbrekende onderzoeken is er vooral meer onderzoek nodig. Kosmos-1 lijkt goed contextueel te kunnen 'zien', maar kan dit alleen met bepaalde visuele stimuli. In andere gevallen kan het model simpelweg niet verwerken wat het ziet, wat mogelijk enigszins bijgestuurd kan worden door middel van meer training, aanpassingen aan het model of verdere input van andere knappe koppen.

Bron: Microsoft (.pdf)

« Vorig bericht Volgend bericht »
0