P.S. I co tam lamusy modelek wessal Erwinka i teraz pisze wiersze o ruchaniu owiec ?? XDD do kasacji z nim.
#gownowpis #llm #przemyslenia #tagowanietomojapasja

@ErwinoRommelo mmmmmmm stupki
@AdelbertVonBimberstein ( ͡ʘ ͜ʖ ͡ʘ) 100pki stupencje stupunie
dobrej jakosci, ksiazki, podreczniki
Tych nie ma w internecie?
@jimmy_gonzale nie ma. Większość wartościowej wiedzy ludzkości nadal jest tylko w bibliotekach.
@AdelbertVonBimberstein to biblioteki nie da się zeskanować? Wiele już przypadkiem nie jest?
Zdjęcia zapiskow na kamiennych tabliczkach z przed 6 tys lat też są:)
@jimmy_gonzale jakiś czas temu przyłapałem ChataGPT na korzystaniu z pirackich podręczników do D&D
@jimmy_gonzale jest ale ilosciowo nie jest tego az tak duzo, sa firmy co zbieraja po prostu tekst ze stron internetowych, kazdy pakiet takich danych to niesamowite ilosci, setki terabaitow samego tekstu.
@aerthevist chyba meta mieli afere ze kradli ksiazki na torentach XD
@jimmy_gonzale da się, ale obraz trzeba umieć odczytać (i skanowanie to koszt, tak jak utrzymanie potem obrazu w sieci). Część skanów bibliotecznych ma nałożony kanał alfa z tekstem, ale to też często ocr kiepskiej jakości
@moll no to chcecie jakości czy ilości. I czemu nie mogą być oba.
@jimmy_gonzale ja tam nie wiem czego chcecie xD to raczej kwestia kasy i praw autorskich, czyli w sumie też kasy...
@ErwinoRommelo to nie jest podobno, to dosłownie tak jest. Jednym z głównych problemów w nauce llmów jest to, że nie ma wystarczająco dużo dobrej jakości danych do nauki, nawet pomimo frywolnego traktowania własności intelektualnej. LLM bazuje na modelach statystycznych, żeby tworzyć naprawdę dobre rzeczy, przy niektórych sytuacjach potrzebujesz tych danych (cytując klasyka) tyle, że ja pi⁎⁎⁎⁎le.
Zaloguj się aby komentować