Nove alternative modelov AI – kako izbrati pravega? (2. del)

Rok Naraks, vodja razvoja rešitev z umetno inteligenco • 14. maj 2024

Razvoj modelov, ki poganjajo umetno inteligenco, korenito posega v načine, kako komuniciramo s stroji, dešifriramo obsežne podatke in celo zaznavamo prihodnost ustvarjalnosti in reševanja problemov. Od začetkov poenostavljenega napovedovanja besedil do prefinjenih zmogljivosti današnjih modelov je pot zaznamovala vrsta pomembnih mejnikov, ki so vsak po svoje uvedli globlje razumevanje in bolj niansirane komunikacijske sposobnosti.

V tej preobrazbi digitalne krajine, ki jo poganja umetna inteligenca, je ključno razumeti izzive in ovire teh novodobnih modelov. V tem delu bloga bom predstavil nekaj manj znanih modelov, ki bodo v bodoče zagotovo dobili bolj vidno mesto med velikimi jezikovnimi modeli.

Grok – nekonvencionalnost in drznost podjetja xAI

Grok-1, model LLM, razvit s strani podjetja xAI, ki ga je ustanovil Elon Musk, poganja klepetalnega robota Grok, ki izstopa zaradi svoje sposobnosti, da se spoprijema z drznimi vprašanji, ki jih drugi modeli morda zavrnejo, in dodaja humor v odgovore. Ta pristop prinaša svežino v interakcije AI, vendar lahko postavlja izzive pri ohranjanju ustreznosti in preprečevanju nesporazumov. Po navedbah podjetja Grok-1 presega zmogljivost GPT-3.5 in primerljivih modelov umetne inteligence, skupaj s kančkom humorja. Grok omogoča razvejane pogovore, v katerih lahko uporabniki prehajajo med različnimi temami. Poleg tega imajo uporabniki edinstveno možnost, da spremenijo kateri koli del Grokovega rezultata, kot da bi bil prvotni odgovor.

MGIE – Applov odprtokodni model umetne inteligence

Model, imenovan MGIE-Guided Image Editing, je Apple razvil v sodelovanju s kalifornijsko univerzo v Santa Barbari, specializiran pa je, da izvaja ukaze za urejanje slik na podlagi besedila. MGIE lahko izvaja različna opravila urejanja slik, kot so obrezovanje, spreminjanje velikosti in vrtenje ter prilagajanje svetlosti, barvnega ravnovesja in kontrasta – vse to na podlagi besedilnih pozivov uporabnikov.

MGIE bistveno izboljša učinkovitost urejanja slik po različnih metrikah in ohranja konkurenčno učinkovitost sklepanja. Tehnologija je uporabljena za izvajanje sprememb v slogu Photoshopa, optimizacijo fotografij in lokalno urejanje. Spletni mediji napovedujejo, da bo Apple na svoji Svetovni razvijalski konferenci (WWDC 2024) predstavil revolucijo na trgu umetne inteligence (v sodelovanju z Googlom), samo jedro rešitve pa bo Siri.

Mistral AI – francoski prebojnik za razvijalce

Mistral.ai s svojimi modeli Mistral Large, Mistral Small in Mistral Embeddings postavlja nove mejnike v umetni inteligenci, poudarjajoč izjemno zmogljivost in raznoliko uporabnost. Modeli so zasnovani z namenom zmanjševanja pristranskosti in zagotavljanja modularnega nadzora, s čimer odgovarjajo na širok nabor potreb uporabnikov. Njihova tehnologija je odprta in prenosljiva, kar omogoča prilagodljivo uvajanje in prilagajanje po meri. Ta pristop ne samo da spodbuja inovacije v AI, ampak omogoča tudi integracijo naprednih rešitev AI v poslovne sisteme, s čimer Mistral.ai cilja predvsem na razvijalce in podjetja, ki želijo vključiti umetno inteligenco v svoje aplikacije ali storitve.

ERNIE – kitajska alternativa za ChatGPT

Ernie, kratica za Enhanced Representation through Knowledge Integration, je pogovorni klepetalni robot z umetno inteligenco, ki ga je ustvarilo kitajsko podjetje Baidu in je kitajski ekvivalent ChatGPT-ja podjetja OpenAI. Temelji na Baidujevem lastnem internem velikem modelu (LLM), imenovanem Ernie 3.0-Totan, in predhodno treniranem modelu za ustvarjanje pogovora (PLATO). Ernie se ponaša z večmodalnimi zmožnostmi, ki uporabnikom omogočajo, da s storitvijo umetne inteligence sodelujejo z besedilom in slikami v pozivih in odgovorih. Glavna prednost je njegova integracija raznolikih vrst podatkov, vendar lahko specifičnost in lokalizacija za kitajski trg predstavljata izzive za svetovno uporabo.

Primerjava velikih jezikovnih modelov

	Podjetje	Ime aktualnega modela	Klepetalnik	Brezplačna različica	Jezik
GPT	OpenAI	Brezplačen: GPT 3.5, Plačljiv: GPT 4.0	ChatGPT	Da	95, vključno s slovenščino
Gemini	Google	Brezplačen: Gemini Pro, Plačljiv: Gemini Ultra 1.0	Google Gemini (prej Bard)	Da	40, vključno s slovenščino
Claude	Anthropic	Brezplačen: Claude Sonnet, Plačljiv: Claude Opus	Claude	Da	angleščina, japonščina, španščina, francoščina
Grok	xAI	Grok-1	Grok anything	Ne, enterprise	200+
Llama	Meta	Llama 2-70B	Llama2.ai	Da	angleščina
Mistral	Mistral AI	Mistral Small, Mistral Large, Mistral Embedding	Le Chat Mistral	Ne, enterprise	angleščina, francoščina, italijanščina, nemščina, španščina in odličen v kodiranju
Ernie	Baidu	Ernie 3.0-Totan	Ernie bot	Ne, enterprise	kitajščina

Vsak model LLM ima svoje prednosti in slabosti. Učinkovitost vsakega modela je odvisna od konteksta, prilagojena posebnim potrebam uporabnikov in scenarijem uporabe. To je le kratka predstavitev nekaj svetovno znanih modelov, novi pa se rojevajo praktično vsak dan. Med bolj poznanimi razvojnimi projekti so še BloombergGPT, AlexaTM, Bloom in Koala. Potem so tu še tudi video (SORA) in grafični modeli (DALL-E 3, Adobe Sensei), ki so usmerjeni v ustvarjanje videa oziroma slike.

Umetna inteligenca velja za panogo, ki ima ogromen potencial rasti tako z vidika inovacij kot tudi naložb, ki se stekajo v to tehnologijo. Zato lahko v prihodnosti pričakujemo številne nove inovacije, tudi nove velike jezikovne modele oziroma kar velike akcijske modele (LAM), ki predstavljajo naslednjo evolucijo v modeliranju. O tem pa več v prihodnjih blogih.

< Older Post

Newer Post >

Nove alternative modelov AI – kako izbrati pravega? (2. del)

PRIJAVA NA NOVICE

Contact Us

PRIJAVA NA NOVICE