Wracajac do tego wpisu, dostalem w koncu zeskanowane zapiski, 274 strony recznie przepisane z orygnialnej wersji ktora sie rozpadla.
Samo tlumaczenie nie jest problemem ale zamiast robic to recznie chce sie czegos nauczyc bo jestem generalnie glupi a chcialbym umrzec troche mniej glupszy.
Mam 274 pliki PNG, skan w dobrej jakosci. Pierwsze sie bede bawil w badania czy kompresja bedzie miala jakis wplyw na programy typu OCR ( PNG>TXT) bo takim czyms chcialbym sobie ulatwic prace. Narazie wiekszosc programow wydaje sie byc platna ale to sie jakos obejdzie.
Nie wiem czy uzycie jakiegos LLM do wstepnego tlumaczenia i potem poprawianie ma jakis sens i czy nie bedzie bardziej jebalo bani niz zrobienie tego samemu od 0.
Bede sie staral wstawiac sample i ciekawsze fragmenty z zycia pana Tarnawskiego / Tarnowskiego. na > #wechikulczasu
( jak ktos dal obs to plecam kliknac znowu w starym tagu byly polskie znaki wiec moze nie dzialac)
Jak macie jakies tipsy czy pomysly to zapraszam do klikania.
#historia
@ErwinoRommelo hm. Spisać raczej i tak musisz, bo nie sądzę by jakikolwiek program wykrył poprawnie takie literki. Jak już to spiszesz cyfrowo, to DeepL'a masz za darmo, z kontem tłumaczysz bodaj 1500 znaków na raz. GPT4o jest dużo lepszy, ale tu bez inwestycji 25€ się nie obejdzie.
Ogólnie miałem pytać, czy dzisiaj coś psocimy, ale widzę, że masz ambitniejsze zadanie.
Zaobserwowałem tag, bo ciekawi mnie co znajdziesz.
@Dziwen narazie bede testowal strone Transkirbus, taki OCR jak jest boostowany AI da sobie rade, bo jak jakiejs literki nie odczyta to sobie z otaczajacych ja dojdzie do tego jak. Zaraz bede testowal na 10 stronach co i jak.
@ErwinoRommelo w sumie zawołaj, bo ciekawe jak sobie poradzi. Tu nawet ja mam lekki problem, żeby te strony płynnie przeczytać, stąd lekkie powątpiewanie w AI. xd
@ErwinoRommelo z ciekawości wrzuciłem to w transkribusa i poległ. Ile stron masz do ogarnięcia?
@Dziwen hmmm eksperyment uznam za umiarkowanie udany XD
@ErwinoRommelo za fikuśne. XD
@ErwinoRommelo xd
już nie łatwiej to odręcznie?
@UmytaPacha 'latwiej "XD chcialem obadac jak takie programy dzialaja, ale z tego co widze to 1. musi byc w miare czytelnie napisane 2. musi byc po ang, niestety AI nie umie po naszemu : (
@ErwinoRommelo w ogóle kto to tłumaczenie napisał
@ErwinoRommelo jak kiedyś korzystałem z https://readcoop.eu/model/polish-general-model/ to też Trans, tylko nie wiem czy ten sam model co użyłeś na stronie.
@ErwinoRommelo Polish.typeit.org jak nie masz znaków
@UmytaPacha ? To jest bazowo po polsku
@To_Stan_Umyslu tak samo nie daje rady, chyba pisownia zbyt nieczytelna, problem jest taki ze scan to nie orygnial tylko przepisana recznie kopia przez zone tego pana, ona byla z Ukrainy ale nauyczyla sie mowic i pisac po polsku, a sam autor skonczyl w PL tylko szkole podstawowa wiec chyba bedzie to robione recznie.
@ErwinoRommelo ja zamiast przepisywania ręcznie to dyktowałem tekst do Google Drive. Też robił dużo błędów i potem musiałem redagować tekst, ale sporo mi to ułatwilo pracy.
@To_Stan_Umyslu myślałem nad tym, zrobie test czy idzie szybciej, to jest 270 stron do odjebania w jeden dzień bez problemu.
Zaloguj się aby komentować