Komentarze (1)

entropy_

@Deykun w sumie to typ ma rację.

Wspomina, że modele świetnie odnajdują się w koncepcjach które widziały miliony razy i słabo w tych które były rzadkie w danych trenujących.

Also wielkość modeli, llama 8b nie nadaje się do niczego bo ma wodogłowie i działa na laptopie ale 700b już można pogadać ale na sprzęcie za 1,5mln złotych.

Do następnego kroku potrzeba innej technologii i innej generalizacji pojęć w modelach

Zaloguj się aby komentować