Nove alternative modelov AI – kako izbrati pravega? (2. del)
Razvoj modelov, ki poganjajo umetno inteligenco, korenito posega v načine, kako komuniciramo s stroji, dešifriramo obsežne podatke in celo zaznavamo prihodnost ustvarjalnosti in reševanja problemov. Od začetkov poenostavljenega napovedovanja besedil do prefinjenih zmogljivosti današnjih modelov je pot zaznamovala vrsta pomembnih mejnikov, ki so vsak po svoje uvedli globlje razumevanje in bolj niansirane komunikacijske sposobnosti.
V tej preobrazbi digitalne krajine, ki jo poganja umetna inteligenca, je ključno razumeti izzive in ovire teh novodobnih modelov. V tem delu bloga bom predstavil nekaj manj znanih modelov, ki bodo v bodoče zagotovo dobili bolj vidno mesto med velikimi jezikovnimi modeli.
Grok – nekonvencionalnost in drznost podjetja xAI
Grok-1, model LLM, razvit s strani podjetja xAI, ki ga je ustanovil Elon Musk, poganja klepetalnega robota Grok, ki izstopa zaradi svoje sposobnosti, da se spoprijema z drznimi vprašanji, ki jih drugi modeli morda zavrnejo, in dodaja humor v odgovore. Ta pristop prinaša svežino v interakcije AI, vendar lahko postavlja izzive pri ohranjanju ustreznosti in preprečevanju nesporazumov. Po navedbah podjetja Grok-1 presega zmogljivost GPT-3.5 in primerljivih modelov umetne inteligence, skupaj s kančkom humorja. Grok omogoča razvejane pogovore, v katerih lahko uporabniki prehajajo med različnimi temami. Poleg tega imajo uporabniki edinstveno možnost, da spremenijo kateri koli del Grokovega rezultata, kot da bi bil prvotni odgovor.

MGIE – Applov odprtokodni model umetne inteligence
Model, imenovan MGIE-Guided Image Editing, je Apple razvil v sodelovanju s kalifornijsko univerzo v Santa Barbari, specializiran pa je, da izvaja ukaze za urejanje slik na podlagi besedila. MGIE lahko izvaja različna opravila urejanja slik, kot so obrezovanje, spreminjanje velikosti in vrtenje ter prilagajanje svetlosti, barvnega ravnovesja in kontrasta – vse to na podlagi besedilnih pozivov uporabnikov.
MGIE bistveno izboljša učinkovitost urejanja slik po različnih metrikah in ohranja konkurenčno učinkovitost sklepanja. Tehnologija je uporabljena za izvajanje sprememb v slogu Photoshopa, optimizacijo fotografij in lokalno urejanje. Spletni mediji napovedujejo, da bo Apple na svoji Svetovni razvijalski konferenci (WWDC 2024) predstavil revolucijo na trgu umetne inteligence (v sodelovanju z Googlom), samo jedro rešitve pa bo Siri.

Mistral AI – francoski prebojnik za razvijalce
Mistral.ai s svojimi modeli Mistral Large, Mistral Small in Mistral Embeddings postavlja nove mejnike v umetni inteligenci, poudarjajoč izjemno zmogljivost in raznoliko uporabnost. Modeli so zasnovani z namenom zmanjševanja pristranskosti in zagotavljanja modularnega nadzora, s čimer odgovarjajo na širok nabor potreb uporabnikov. Njihova tehnologija je odprta in prenosljiva, kar omogoča prilagodljivo uvajanje in prilagajanje po meri. Ta pristop ne samo da spodbuja inovacije v AI, ampak omogoča tudi integracijo naprednih rešitev AI v poslovne sisteme, s čimer Mistral.ai cilja predvsem na razvijalce in podjetja, ki želijo vključiti umetno inteligenco v svoje aplikacije ali storitve.

ERNIE – kitajska alternativa za ChatGPT
Ernie, kratica za Enhanced Representation through Knowledge Integration, je pogovorni klepetalni robot z umetno inteligenco, ki ga je ustvarilo kitajsko podjetje Baidu in je kitajski ekvivalent ChatGPT-ja podjetja OpenAI. Temelji na Baidujevem lastnem internem velikem modelu (LLM), imenovanem Ernie 3.0-Totan, in predhodno treniranem modelu za ustvarjanje pogovora (PLATO). Ernie se ponaša z večmodalnimi zmožnostmi, ki uporabnikom omogočajo, da s storitvijo umetne inteligence sodelujejo z besedilom in slikami v pozivih in odgovorih. Glavna prednost je njegova integracija raznolikih vrst podatkov, vendar lahko specifičnost in lokalizacija za kitajski trg predstavljata izzive za svetovno uporabo.

Primerjava velikih jezikovnih modelov
Podjetje | Ime aktualnega modela | Klepetalnik | Brezplačna različica | Jezik | |
---|---|---|---|---|---|
GPT | OpenAI | Brezplačen: GPT 3.5, Plačljiv: GPT 4.0 | ChatGPT | Da | 95, vključno s slovenščino |
Gemini | Brezplačen: Gemini Pro, Plačljiv: Gemini Ultra 1.0 | Google Gemini (prej Bard) | Da | 40, vključno s slovenščino | |
Claude | Anthropic | Brezplačen: Claude Sonnet, Plačljiv: Claude Opus | Claude | Da | angleščina, japonščina, španščina, francoščina |
Grok | xAI | Grok-1 | Grok anything | Ne, enterprise | 200+ |
Llama | Meta | Llama 2-70B | Llama2.ai | Da | angleščina |
Mistral | Mistral AI | Mistral Small, Mistral Large, Mistral Embedding | Le Chat Mistral | Ne, enterprise | angleščina, francoščina, italijanščina, nemščina, španščina in odličen v kodiranju |
Ernie | Baidu | Ernie 3.0-Totan | Ernie bot | Ne, enterprise | kitajščina |
Vsak model LLM ima svoje prednosti in slabosti. Učinkovitost vsakega modela je odvisna od konteksta, prilagojena posebnim potrebam uporabnikov in scenarijem uporabe. To je le kratka predstavitev nekaj svetovno znanih modelov, novi pa se rojevajo praktično vsak dan. Med bolj poznanimi razvojnimi projekti so še BloombergGPT, AlexaTM, Bloom in Koala. Potem so tu še tudi video (SORA) in grafični modeli (DALL-E 3, Adobe Sensei), ki so usmerjeni v ustvarjanje videa oziroma slike.
Umetna inteligenca velja za panogo, ki ima ogromen potencial rasti tako z vidika inovacij kot tudi naložb, ki se stekajo v to tehnologijo. Zato lahko v prihodnosti pričakujemo številne nove inovacije, tudi nove velike jezikovne modele oziroma kar velike akcijske modele (LAM), ki predstavljajo naslednjo evolucijo v modeliranju. O tem pa več v prihodnjih blogih.