ChatGPT dobil odprtokodno konkurenco Dolly 2.0

Databricks je izdal svoj veliki jezikovni model (LLM), ki ni zgolj klon ChatGPT-ja, temveč prinaša pomembno prednost. Ker je naučen na podatkovni zbirki, ki je izdana pod licenco Creative Commons, je takšna tudi njegova uporaba vključno z rezultati.

Novinec se imenuje Dolly 2.0. Prvo verzijo so sicer izdali že marca, a tista še ni imela ustrezne licence, ker se je učila na nekaterih podatkih ChatGPT. Dolly 2.0 pa je uporabila 13.000 pogovorov od več kot 5000 zaposlenih v podjetju, ki so jih ustvarili prav z namenom učenja. Podjetje je organiziralo različne vzpodbude za ustvarjanje zbirke, ki vključuje vprašanja in odgovore zaprtega ali odprtega tipa, povzetke in izvlečke iz Wikipedije, možgansko viharjenje, razvrščanje in kreativno pisanje.

Pod isto licenco so izdali tako zbirko podatkov kakor tudi celotni jezikovni model vključno z vsemi parametri. To pomeni, da ga lahko uporabi in spreminja kdorkoli za kakršenkoli namen. To je potemtakem prvi zares permisivni LLM. In to je v resnici pomembnejše od dejstva, ali je Dolly 2.0 res odlična ali ne. Morda je slabša od ChatGPT, a je "naša".

Databricks