Halucinacije umetne inteligence

Tako kot profesor Ethan Mollick sem tudi jaz sem čakal, da nekdo preizkusi in ugotovi, ali lahko več agentov umetne inteligence, ki drug drugemu preverjajo podatke in dejstva, zmanjša halucinacije?

Odgovor se zdi pritrdilen – uporaba treh agentov s strukturiranim postopkom pregleda je zmanjšala stopnjo halucinacij za 96 % v 310 testnih primerih.

Več v članku https://lnkd.in/dpc8XCzp

 

halucinacije umetne inteligence

 

 

Spomnim se, kako sem »dolgo nazaj« s ChatGPT pripravil LinkedIn objavo, ki je med drugim vsebovala podatek o 32,4 % deležu nečesa. Na palec sem rekel, da je ta podatek verjetno točen. A ne vem zakaj mi nekaj ni dalo miru in naslednji dan sem ChatGPT vprašal: kje si dobil teh 32,4%, daj mi vir in povezavo na spletno stran. Odgovoril mi je v smislu: »Oh, to sem si pa malce izmislil, za potrebe priprave tega članka.« Takrat me je to še presenetilo, danes nikakor.

Ali obstaja boljša rešitev za halucinacije LLM modelov AI kot preverjanje natančnosti med AI agenti?

LLM-ji so izjemno zmogljivi pri določenih nalogah, kot so obdelava naravnega jezika, povzemanje in ustvarjanje kreativnih vsebin. Vendar niso optimalni tam, kjer je ključna absolutna natančnost in zanesljivost informacij.

Namesto da AI agenti preverjajo natančnost eden drugega in tako skušajo zmanjšati halucinacije, lahko kot alternativo uporabimo grafe znanja. Graf znanja je strukturirana predstavitev podatkov, ki organizira resnične entitete (npr. osebe, kraje, pojme) in njihove odnose v obliki grafa. To omogoča boljše kontekstualno razumevanje, sklepanje in integracijo podatkov med različnimi domenami.

Pomembno je razlikovati med bazami znanja (kot jih poznamo iz po meri narejenih GPT-jev v ChatGPT) in grafi znanja, saj služijo različnim namenom.

Vendar je treba upoštevati, da so nekatere rešitve za zmanjšanje halucinacij v LLM modelih UI izjemno drage in dostopne le redkim. Poleg tega je gradnja grafov znanja pogosto zahteven in kompleksen proces, ki zahteva obsežne in natančno strukturirane podatke.

0 replies

Leave a Reply

Want to join the discussion?
Feel free to contribute!

Dodaj odgovor

Vaš e-naslov ne bo objavljen. * označuje zahtevana polja

This site uses Akismet to reduce spam. Learn how your comment data is processed.