Ktoś skatalogował 'Wiadomości'
TwitterNa wszelki wypadek dodaję także #polityka chociaż w teorii to ciekawostka z #technologia
Ale sztos
Elegancko
"Jeżeli piszesz prace naukową" - prokurator niedługo zacznie pisać "pracę naukową"
@sone setki studentów podczas zajęć nt propagandy będą wałkować pisowska gadzinówkę
No ostro. Wydaje się że to będzie trwalsze niż portale TVP więc warto trzymac. Tam zawsze może zdarzyć się wypadek jak prokuraturze że "się wzielo i zepsuło"
@kodyak Albo jak w "Polactwie" Ziemkiewicza, co wydanie, to treść się zmienia.
Najlepiej niech skompresuje do plików .webp i da na domenę kraju Tuvalu czyli .tv
Wspolczuje typowi. 2721 odcinkow tej chujni, przeciez ja bym po czyms takim nie wiedzial jak wiazac buty i kurwil na tuska ze to przez niego...
@grubshy podobno jest taka przypadłość, która się nazywa hoarding
Gromadzisz, rzerzy bez wartości, które do niczego nikomu się nie przydadzą, bo wydaje ci się, że kiedyś z nich coś będziesz miał
https://www.nhs.uk/mental-health/conditions/hoarding-disorder/
@KasiaJ XDDD
@KasiaJ jest coś takiego jak data hoarding ale bez przesady to tylko 300GB danych, jeden dysk ssd 512 za 100zł danych nie zaburzy nikomu życia. Co innego przeczytanie tego całego ścieku.
@owczareknietrzymryjski to nie tylko 400 GB danych. To systematyczna praca. Codzienne nagrywanie, sortowanie, tworzenie kopii zapasowych. Ktoś to robił przez 8 lat! To nie jest normalne zachowanie.
Najleosze kawałki i tak krążą po sieci na bieżąco, dzięki licznym antysytemowcom. Za każdym razem gdy prezenter się choćby zakaszlał setki profili to podawały jako "dowód" na niekompetencję pisu.
Ale co najlepsze: wszystkie te materiały można zdobyć bezpośrednio od tvp.
https://centruminformacji.tvp.pl/62861261/czym-sie-zajmujemy
@KasiaJ
@owczareknietrzymryjski to nie tylko 400 GB danych. To systematyczna praca. Codzienne nagrywanie, sortowanie, tworzenie kopii zapasowych. Ktoś to robił przez 8 lat! To nie jest normalne zachowanie.
To tylko głupie 400 giga, a serio robisz z tego wielkie halo i próbujesz to rozdmuchać do rangi jakiegoś niebotycznego osiągnięcia. Produkcyjne bazy w firmie gdzie pracuję mają po 100 TB i więcej i to jest efekt tej codziennej, systematycznej pracy. Big data w ogóle ma na DC swoją osobną alejkę na serwery i macierze. A w mniejszej skali... prosta wintelowa przesiadka na środowisko klienckie z zainstalowanymi podstawowymi narzędziami i co tam jeszcze potrzebne to +150 GB. Maszyna, bez żadnych danych użytkowników.
Prywatnie wystarczy, że twoja pasją jest fotografia (i mowa tu o takiej na poważnie więc lustrzance, a nie Cybershoty czy inne kieszonkowce), jak to połączysz z wycieczkami to ilość zdjęć przyrasta w chorym tempie. Nagrywasz filmy? Spoko, masz to samo tylko jeszcze szybciej. Trzymasz bezstratną muzykę? Filmy w wysokiej rozdzielczości? To samo- lepiej miej na podorędziu kilka wolnych terabajtów. Ba- dzisiaj byle gra na dzień dobry potrafi zeżreć 150 giga na dysku. Serio, takie liczby może robiły wrażenie w momencie, jak standardem w domowych pecetach były dyski 60 GB i to było takie "łooo, trzycyfrowa wartość i to nie z 1 na przodzie", ale dzisiaj? Dzisiaj nie ma sensu kupować dysku mniejszego jak 512 GB, zarówno z powodów praktycznych, jak i finansowych. Dzisiaj pendrive potrafi mieć 1 TB. Pamiętam, jak w pierwszym komputerze miałem właśnie dysk 60 GB, podzielony na 3 partycje. I kiedy go finalnie złożyłem, odpaliłem i zainstalowałem, to byłem przekonany, że nigdy nie wykorzystam takiej ilości miejsca. "Nigdy" nastąpiło ze 3-4 lata później.
@NiebieskiSzpadelNihilizmu "To tylko głupie 400 giga, a serio robisz z tego wielkie halo i próbujesz to rozdmuchać do rangi jakiegoś niebotycznego osiągnięcia" - nie, bardzo wyraźnie napisałam, że to MNÓSTWO ROBOTY. Dokładnie 8 lat roboty. 4 miliony plików z ponad 2k wydań. łatwo jest zrobić zrzuty z pliku wideo, ale te zruzty trzeb posegregowac, nadać tagi itp. Przeciez algorytm nie zawsze wykryje sens wypowiedzi, czy to serkazm, czy manipulacja czy pomyłka.
Podsumujmy: codziennie musiał nagrywać - czyli poł godziny. Później sprawdzic czy wszystko ok i uruchomić skrypk dzielący pliki na zrzuty. Później zrzuty posegregować i dodać etykiety. Dodatkowo napisał programy do przeglądania i wyszukiwarkę. Do tego dochodzi testowanie itp.
Gośc musiał przez ostanie osiem lat godzinę do półtorej poświęcić tylko na katalogowanie wiadomości. XDDD To nie jest normalne. Porównujesz to to fotografii, czyli pieknego hobby. Robiąc zdjęcia uczysz się i rozwijasz. Jest to przydatna umiejętnośc życiowa. Jesli poświęcisz fotografi dostatecznie dużą ilość czasu mozesz nawet zacząć zarabiać.
Nie wiem jaki cel życiowy może ktoś mieć na codzinne katowanie się wiadomościami przez 8 lat, oprócz jakiejs chorej obsesji na punkcie pisu. Pieniedzy z tego też nie bedzie. Programów typu baza danych też jest na pęczki i na pewno duzo lepszych. Więc co on z tego miał? To jakieś zaburzenie a nie hobby.
No ale nie takie numery widziałam, co bycie "antysystemowcem" robi z pozornie normalnymi ludzmi
@KasiaJ jeden lubi las drugi córkę leśniczego. Może koleś był pisowcem ale przez ostatnie kilka lat oglądania wiadomości się nawrócił. Nie był antysystemowcem tylko właśnie był za partią ale po analizie wiadomości zobaczył to całe spierdolenie i się ogarnął. Można zawsze zapytać kolesia na twitterze dlaczego to robi a nie na siłę przypinać mu łatkę nienormalnego na portalu że śmiesznymi obrazkami.
@owczareknietrzymryjski Koles napisał na twitterze "bo moze sie komuś przydać". Więc jak już pisałam:
8-letnia obsesja na punkcie widomości partyjnych nie jest normalna. To jest chore
Robił to tylko po to, żeby udowodnić, że wiadomości są propisowskie XD Bo przecież tego nikt nie wiedział wcześniej
wyważał otwarte drzwi, bo kazdy, kto na powaznie chce się tym zajmować (dziennikarze, ludzie nauki itp), może po prostu uzyskać materiały z archiwum
@KasiaJ Nie rozumiesz, że to posłuży do rozliczeń pisowskich funkcjonariuszy, którzy przez 8 lat pobierali pensje dziennikarzy?
@Gracz_Komputerowy "Nie rozumiesz, że to posłuży do rozliczeń pisowskich funkcjonariuszy," - obawiam się, że ty nie rozumiesz, że te DANE sa PUBLICZNIE DOSTĘPNĘ. Kazdy moze je zdobyć - także ci chcący "rozliczać"
Zresztą nawet załużmy, że jakiś prokurator chce "rozliczyć" Hołecką. Za co? Za wykonywanie pracy? Za to, że powiedziałą, że Tusk jest zły? No ale abstrachując od takich absurdów załóźmy, że jednak znalazł jakiś paragraf i chce ją zniszczyć na pokaz. Może Hołecka nakradła kasę jak Kijowski, a nagraniach wiadomości jest na to dowód . Żaden sąd nie dopuściłby jako materiału dowodowego screenshotów gromadzonych przez jakiegoś janusza. To musiałby być ofiacjalny zapis z archiwum, zabezpieczony w odpoweidni sposób i przeanalizwany przez biegłego.
Ja przepraszam, ale wy albo bujacie w obłokach, albo dajecie się mamić aktywistom
@KasiaJ Hobby nie musi być racjonalne: filatelistyka, modelarstwo, gry, książki itp - ludzie poświęcają mnóstwo czasu i pieniędzy dla własnej przyjemności. A w tym konkretnym przypadku jeszcze na coś się to przydało, chociażby tym czymś była rozrywka dla kogoś.
A kto powiedział że ja mówię o prokuraturze 😄
@grubshy jest róznica między zbieraniem znaczków a śmieci z ulicy. Niby oboje robią to samo, ale w praktyce jedną z takich osób nazwiemy chorą.
On poświęcił 8 lat na zebranie PUBLICZNIE DOSTEPNYCH DANYCH. Rozumiesz to?
"ludzie poświęcają mnóstwo czasu i pieniędzy dla własnej przyjemności" - a wybrał systematyczne gromadzenie niepotrzebnych nikomu danych przez 8 lat. Kazdego dnia
@KasiaJ "To systematyczna praca. Codzienne nagrywanie, sortowanie, tworzenie kopii zapasowych. Ktoś to robił przez 8 lat! " - Chyba w średniowieczu Lol. Zwykłe makro/nagrywarka, którą ustawiasz żeby zapsiał program o danej porze na dysk z datą jak ma ustawionego QNAP to też robi kopie automatyczne.
"Mam też program, który umożliwia ich przeszukiwanie." - Czyli jakimś programem do detekcji twarzy, tekstów wyodrębnić klatki gdzie takie się znajdują.
Całość jak jest ktoś ma wiedzę i soft może zrobić w dzień.
@Gracz_Komputerowy "A kto powiedział że ja mówię o prokuraturze" - to jak chcesz "rozliczyć". Iść pod dom Hołeckiej z pierzem i smołą?
@KasiaJ > Gość zmarnował 8 lat życia na nic.
jeśli nawet to kim jesteś żeby osądzać na co miał spożytkować ten czas.
@VanQuish gadanie do tej osoby to jak kopanie się z koniem, zwykła jałowa dyskusja i nic nie dociera. imo szkoda czasu
@owczareknietrzymryjski "kim jesteś żeby osądzać na co miał spożytkować ten czas." - kim jesteś, żeby narzucać, kogo mogę krytykować?
@KasiaJ
'Poświęcił 8 lat'? Skąd taki pomysł. Zwykle w takich projektach poświęca się więcej czasu na początku (ale i tak nie są to jakieś kosmiczne wartości) a potem 90% jest zautomatyzowane.
Bardzo możliwe, że jako źródło korzystał także z tych publicznie dostępnych danych.
Efekt jego pracy zainteresował całkiem sporo osób sądząc po popularności wątku na Twitterze - czy do prac naukowych, opracowań czy zwykłej rozrywki nie ma znaczenia. Przydało się.
@KasiaJ
nie, bardzo wyraźnie napisałam, że to MNÓSTWO ROBOTY. Dokładnie 8 lat roboty. 4 miliony plików z ponad 2k wydań.
Chuja tam mnóstwo. Napisałem ci to już wcześniej- szokuje cię ta liczba mimo że realnie ona wcale nie jest duża.
A co do tego mnóstwa roboty, to może tak z 20 lat temu. Mamy 2023 rok, stawiasz własny mikroserwer albo jakiś kupiony VPS z OHV na którym stawiasz jakiś model maszynowego uczenia typu tensorflow, do tego system do ocr, mapujesz to z NASem, na którego lecą nagrania z VOD TVP1 i TVP INFO z ich wydań wiadomości, które przecież lecą w konkretnych godzinach, więc nawet nie musisz pilnować kiedy wcisnąć guzik nagrywania- to zrobi za ciebie zapięty scheduler i voila- dane zbierają się same, ty na dobrą sprawę musisz tylko pilnować, żeby na tym konceptualnym NASie nie brakło miejsca. AI/ML to obrabiają i ogarniają ocr i tagowanie, jak jest dobrze napisane to nawet co do sekundy wskażą kiedy było wystąpienie więc od razu można na bazie tagów budować statystykę np "ile razy w danym roku padło słowo Tusk" albo "ile razy w ciągu 8 lat rządów wspomnieli ośmiorniczki". W sumie to jeszcze jedną rzecz musisz zrobić wtedy- określić tagi po jakich materiały będą przeszukiwane.
Podkręcę to jeszcze bardziej- jak nie chcesz się kopać w N osobnych klocków, żeby to zrobić, to wszystko to możesz zrobić na AWSie i tam to już serio jest klikanie kilku guzików, bo wszystko out of the box jest preinstalowane i zintegrowane. "Systematyczna praca".
@NiebieskiSzpadelNihilizmu "mamy 2023 rok" - zgadza sie a on to robił od 2015 roku
@grubshy "Zwykle w takich projektach" - kto robi 8- letnie projekty, aby nagrywać wiadomości znienawidzonej partii?
2- nie, bardzo wyraźnie opisał swoją pracę. Nagrywał
3- dostałem 700 polubień na Twitterze a trzy osoby nawet kupiły mi kawę, na buymeacoffe. Było warto ślęczeć nad tym osiem lat
@KasiaJ skąd podejrzenie, że robił to od 2015 roku? Z obrazka to nie wynika. Wynika, że ma dane od 2016 do 2023 roku. Jak sama przyznałaś, te dane są dzisiaj publicznie dostępne, zarówno w CI TVP jak i na VOD. Mógł to wszystko zrobić jednym kliknięciem w 2023. Systematyczność od 2015/2016 to jak dotąd twój domysł.
@jeikobu__ acha. No to jak od 2016 a nie od 2015 to w porzadku. Już się martwiłam, że coś z nim nie tak. Ulga.
Nie nie zrobił tego jednym kliknieciem: Użytkownik o pseudonimie FlasH przez 7 lat rządów Prawa i Sprawiedliwości, sumiennie dokumentował wszystkie paski z "Wiadomości" emitowanych na antenie Telewizji Polskiej. (to z artykułu o nim)
Mało tego - gość prowadzi stonę na której skrupulatnie odnotowuje ile razy dany "ekspert" się wypowiadał. Przykro mi, ale, ale tego nie da się zrobić automatycznie. WIęc do obsesji na punkcie screenshotów prowadzi i utrzymuje jeszcze stronę z danymi
Normalne zachowanie.
Komentarz usunięty
Normalne zachowanie.
@KasiaJ no, ty na przykład siedzisz i trollujesz 24/7 na małym portalu internetowym xD
Oczywiście, że da się to zrobić automatycznie. Sam autor przyznaje, że robi to automatycznie w odpowiedzi do tego posta: https://twitter.com/mat3oosh/status/1714861559707525229 Po prostu nie zrobił tego na raz - robi to z każdym wydaniem od 2016. To jest garść skryptów. Nawet jestem w stanie wymienić kroki, które robi:
Dzieli każde wydanie Wiadomości na ok. 1500 zrzutów ekranu. Przypadkowo 25 minut * 60 sekund = 1500 - po prostu robi jeden zrzut na sekundę materiału.
Sprawdza, czy obrazki są do siebie podobne, żeby znaleźć "ostateczną" wersję obrazka, bo niektóre napisy pojawiają się nie od razu. Takie rzeczy też się robi automatycznie m. in. OpenCV.
Przepuszcza każdy zrzut programem OCR. Takie programy to nie nowy wynalazek i są usprawniane od co najmniej 30 lat. Tekst maszynowy rozpoznają dobrze od bardzo dawna.
Robi poprawki słownikowe dla rozpoznanych słów w razie błędów OCR i zlicza ich wystąpienia.
I to tyle. Cały jego trud leży w automatyzacji takich badziewi. Ja np. zbieram dane dotyczące stabilności działania internetu w domu. Też automatycznie.
@jeikobu__ "siedzisz i trollujesz 24/7" - nie widzisz róznicy miedzy napisaniem kilku komenntarzy a systematycznym poświeceniem 7 lat życia jakiemuś projektowi?
Zresztą ciekawe, że użyłeś słowa "trollujesz". Mam inną opinię niż ty i uważam, gościa za oderwanego od rzeczywistości co staram się poprzeć w miarę sensownymi argumentami. Jesli uważasz że to trollowanie, to równie dobrze TY trollujesz nie zgadzając sie ze mną czyż nie?
Co to jest codzienne przeglądanie 1500 obrazków i ręczne robienie dodtakowych zrzutów, jeśli coś się nie udało.
Co to jest przetwarzenie i poprawienie tekstów wygenerowanych przez OCR dla 1500 zrzutów, z czasami ze sporą ilością tekstu (te ikonografiki pokazujące wykresy itp)
Co to jest sprawdzenie, czy skrypt dobrze rozpoznał twarze.
Co to jest robienie tego CODZIENNIE przez 7 lat
Co to jest tworzenie programów do obługi tego i wyszukiwarki
Co to jest prowadzenie i utrzymywanie strony poświęconej tylko i wyłącznie temu
Naprawdę nie wydaje ci się aż takie poświęcenie się bo nie lubisz Hołeckiej to lekka przesada?
staram się poprzeć w miarę sensownymi argumentami
@KasiaJ "NIE DA SIĘ TEGO ZROBIĆ AUTOMATYCZNIE I CHUJ" oraz "NO GOŚĆ PIERDOLNIĘTY ŻE ROBI TO CO MU SIĘ PODOBA" to nie są sensowne ani merytoryczne argumenty.
nie widzisz róznicy miedzy napisaniem kilku komenntarzy a systematycznym poświeceniem 7 lat życia jakiemuś projektowi?
Podczas naszej ostatniej rozmowy usilnie stwierdzałaś, że laska z wydziaranymi gałkami ocznymi wpływa na moje życie za pomocą whataboutismu. Dziwnym trafem raz za razem trafiam na ciebie w dyskusjach pełnych nierzeczowych argumentów z twojej strony. Tak, jesteś trollem internetowym, chcąc bądź nie chcąc.
Co to jest [...]
Wszystkie te czynności mogą być wykonane automatycznie - a na pewnym etapie część z nich jest w ogóle zbędna. Na 100% nie jest potrzebny krok 1, na 95% 2 jest automatyczny, 3 jest zbędny na tym etapie (zwłaszcza gdy porównuje te same migawki z Tuskiem Fur Deutschland). Oprogramowanie do przeszukiwania baz danych jest gotowe i istnieje. Utrzymywanie strony to pikuś, sam utrzymuję sporo aplikacji webowych tylko dla swojego użytku. Ja mam stronę ze statystykami mojego łącza. I też ją muszę utrzymywać. Najwyraźniej jestem pierdolnięty.
Naprawdę nie wydaje ci się aż takie poświęcenie się bo nie lubisz Hołeckiej to lekka przesada?
Nie. Potrafię spędzić sporo czasu nad różnymi dziwnymi projektami. To się nazywa hobby. Jakby ktoś robił to samo, tylko z TVN24, to też uważałbym to za tak samo normalne. Oddolne inicjatywy obywateli zawsze mi się podobały. Ta nie jest wyjątkiem. Komuś się chciało, i dzięki temu wiem, ile razy Tusk mówił Fur Deutschland w Wiadomościach.
Poza tym moje zdanie na temat tego, co on robi - ani twoje - nie jest rzeczowym argumentem w dyskusji pt. "ile czasu zabiera mu to dziennie". Moim zdaniem niewiele. No i nie zapominajmy, że to spore pole do nauki, koleś mógł pozyskać bezcenną wiedzę przez ten czas która przekłada się na jego umiejętności zawodowe (ja używałem takich technologii np. do testów automatycznych oprogramowania).
@jeikobu__ nie pamiętam cie, ale skoro twierdzisz, że często spierasz sie że mną to jesteś trollem do kwadratu.
Nie będę się powtarzać ile te czynności zajmują bo już napisałam i nie będę cię karmić. Bez nieustannego nadzoru i poprawek sie nie obędzie (co zresztą sam przyznajesz we wcześniejszym wpisie) xd No ale trollem już tak widocznie mają
"Bezcenną wiedzę" - jeśli nauczenie się obsługi OCR wymaga 7 lat to gość powinien zmienić branżę
Trochę dziwne też, że przeszkadza Ci moja krytyka innego dziwnego zachowania ( tatuowanie oczu), poparta stwierdzeniem, że to daje zły przykład...ale należysz do lewicy, która pragnie wyeliminować każdego kto mówiąc nieprawomyślne rzeczy daje zły przykład XDD
"Potrafię spędzić sporo czasu nad różnymi dziwnymi projektami" - jak każdy z nas. Na ogół jednak ludzie próbują rzeczy, bo do czegoś aspirują, albo ich rozwijają. Granie na gitarze. Nauka koreańskiego. Nauka robienia sushi. Zbieranie monet. Wiesz co te rzeczy łączy? Rozwijają cie, są pozytywne i mogą się kiedyś przydać. 7-letnia obsesja na punkcie na punkcie "reżymowych" wiadomości już nie. Przypomina to chorobę. Przecież jego jedynym motywem jest nadzieja, że może ktoś coś w tym odnajdzie, co ostatecznie pogrąży jego znienawidzoną partię. Tyle, że zapomniał, se te dane są już dostępne publiczne a sztab wiecznych opozycjonistów analizował każde wydanie wiadomości i wrzucał do sieci każde kaszlnięcie prowadzącego
Wiem, jak bardzo cie boli moja opinia, ale nie ma dla ciebie innej. A przekręcanie moich słów, że niby tylko gościowi ubliżam, a nie popieram tego żadnym argumentem to tania manipulacja...ale trolle już tak mają
Smacznej kawusi
@KasiaJ
skoro twierdzisz, że często spierasz sie że mną to jesteś trollem do kwadratu
Kłamiesz, nie powiedziałem tego. Powiedziałem, że cię spotykam.
jeśli nauczenie się obsługi OCR wymaga 7 lat to gość powinien zmienić branżę
On niczego nowego sie nie uczył tylko przez 7 lat monotonnie powtarzał to samo jak baba przy taśmie w fabryce.
Nadal usilnie twierdzisz, że robi to ręcznie. Ten proces można zautomatyzować i to jest cenny skill.'
Wiem, jak bardzo cie boli moja opinia, ale nie ma dla ciebie innej.
Ała, jak boli. Zaraz się zesram z tego bólu. Nie boli mnie ona wcale. Boli mnie gwałt na logice. Boli mnie przekręcanie moich słów i próba twierdzenia, że ja robię to z twoimi. I boli mnie ten oczywisty trolling.
7-letnia obsesja na punkcie na punkcie "reżymowych" wiadomości już nie. Przypomina to chorobę. Przecież jego jedynym motywem jest nadzieja, że może ktoś coś w tym odnajdzie, co ostatecznie pogrąży jego znienawidzoną partię. Tyle, że zapomniał, se te dane są już dostępne publiczne a sztab wiecznych opozycjonistów analizował każde wydanie wiadomości i wrzucał do sieci każde kaszlnięcie prowadzącego
Podoba mi się, jak zignorowałaś potencjał nauki narzędzi do analizy danych, obrazków i programowania, o których pisałem. Zupełnie, jakbyś trollowała.
Smacznej kawusi
Siła argumentów cię dusi
@jeikobu__ "proces można zautomatyzować i to jest cenny skill.'" - powiedz mi, że ty w ogóle czytasz własne wypociny przez zmianą w fabryce xddd
Na mój argument, że nauka obsługi OCR trwa chwilę a nie 7 lat odpisałeś, że...On to zautomatyzował skryptem XD
Rozumiesz, że sobie zaprzeczasz? Jeśli napisał skrypt, który można stworzyć w kilka godzin to później przez pozostałe 6 lat 11 miesięcy 3 tygodnie i 6 dni NICZEGO SIĘ NIE UCZYŁ tylko powtarzał to samo do wyrzygania
Żaden skrypt nie obędzie się bez ręcznego nadzoru niestety. Skrypt nie rozpozna sarkazmu czy nawiązań. Nie będzie też wiedział o jakiego Kowalskiego chodzi: polityka, lekarza czy może sportowca. Bo do tego trzeba znać KONTEKST.
Więc nasz antyreżymowiec musi codziennie nad tym siedzieć, sprawdzać, segregować, poprawiać...Dzień dnia... przez 7 lat l. Trochę mi go nawet żal
@KasiaJ kogo tu piecze? Więcej XD, bo za mało! Miałaś już nie odpisywać, już piłaś kawusię i cyk - podkusiło!
powiedz mi, że ty w ogóle czytasz własne wypociny przez zmianą w fabryce xddd
Chcesz mi powiedzieć, że nauka automatyzacji (= nauka programowania) to nie jest cenny skill? Dobrze wiedzieć. Przekażę sobie w poniedziałek w pracy, że niepotrzebnie się uczyłem programować, mogłem dostać tę pracę bez nauki.
Rozumiesz, że sobie zaprzeczasz? Jeśli napisał skrypt, który można stworzyć w kilka godzin to później przez pozostałe 6 lat 11 miesięcy 3 tygodnie i 6 dni NICZEGO SIĘ NIE UCZYŁ tylko powtarzał to samo do wyrzygania
Ale rozumiesz, że on absolutnie nic nie musiał robić, bo wszystko może włączyć się samo? Oczywiście, że rozumiesz, ale potwierdzenie tego obala całkowicie twój argument o tym, że on siedem lat w kółko robi to samo. Przez siedem lat powoli mógł udoskonalać swój zautomatyzowany proces.
Żaden skrypt nie obędzie się bez ręcznego nadzoru niestety.
Niesamowite! Weryfikację rezultatów - jeżeli w ogóle jest konieczna - można robić raz na miesiąc, a nie codziennie. A uwaga, w zależności od zaawansowania zbudowanego systemu, weryfikacja może być automatyczna. Nazywamy to fachowo testami automatycznymi. I tak, można rezultat sprawdzić automatycznie.
Więc nasz antyreżymowiec musi codziennie
Nie dasz rady zmanipulować tej dyskusji powtarzając, że "on to musi robić codziennie" do skutku. Nie musi.
Na mój argument, że nauka obsługi OCR trwa chwilę a nie 7 lat odpisałeś, że...On to zautomatyzował skryptem XD
Nauka automatyzacji i udoskonalania takiego procesu zajmuje znacznie więcej niż nauka ręcznej obsługi OCR. Taki argument to fałszywe porównanie. Taki tani chwyt erystyczny. Używany m. in. przez internetowych trolli, takich jak ty.
Już piecze? Czy jeszcze za mało?
"mamy 2023 rok" - zgadza sie a on to robił od 2015 roku
@KasiaJ czy ty serio teraz wyciągnęłaś dokładnie ten sam argument, który niedalej jak miesiąc temu padł, gdzie "ktoś" powiedział o 15% poziomie inflacji i nastąpił incydent kałowy z wrzaskami o kłamstwie i pozwami, bo jest "tylko 14,5%"? Bo na to wygląda, ale zmartwię cię- w 2015 takie rzeczy jak VPS, ML, NAS czy AWS stack też już istniały. One nie powstały dopiero w tym roku
@jeikobu__ "Miałaś już nie odpisywać" - gdzie tak napisałam XDDDD Czy to nie ty narzekałeś na manipulację i wkładanie nie swoich słów w usta? Pytam dla koleżanki... Jak bedę tobą znudzona to zbaczysz "nie masz dostępu do tego wpisu"
"Przez siedem lat powoli mógł udoskonalać swój zautomatyzowany proces." - po SIEDMIU latach pracy nad JEDNYM skryptem, to chyba nasa już musiała od niego kupić ten skrypt. Przez siedem lat niektórzy studia skończą i będą już mieli 4 lata doświadczenia w branży...a on pracował nad jedym legendarnym skryptem XDDDDD
"można robić raz na miesiąc" - 1500 obrazków dziennie przez 30 dni daje 45000 obrazków do sprawdzenia, posortowania, poprawienia... prawdziwy twardziel, tak sziedzieć tydzień czasu bez przerwy i przeglądać jednym ciągiem XDDD
"wszystko może włączyć się samo?" - tu już zatoczylismy kółeczko. Pisalismy już o ludzkiej interwencji
"Nie dasz rady zmanipulować tej dyskusji powtarzając, że "on to musi robić codziennie" do skutku. Nie musi." - źródło poprosze. Pokaż mi githubowy albo komercyjny algorytm, sortujący, testujący, poprawiający, rozpoznający kontekst itp ze 100% skutecznością. Bo nawet najnowsze algorytmy AI szkolone latami i karmione milionami petabajtów tego nie potrafią. A ten geniusz osiągnął to kilka lat temu...dopieszczając skrypt. Czekam
"Nauka automatyzacji i udoskonalania takiego procesu zajmuje znacznie więcej niż nauka ręcznej" więc teraz to wszystko to żmudna ręczna robota? Sprawdzmy co pisałeś wcześniej, przed zmianą w fabryce: "Takie rzeczy też się robi automatycznie m. in. OpenCV." XDDDDDDDDDDDDDDDD
"Już piecze? Czy jeszcze za mało?" - Czy piecze mnie, że gość jest bardzo chorym człowiekiem, z niezdrową obsesją? Śmieje się z tego i jednoczesnie mi go troszkę żal, że sobie zmarnował taki kawał życia. Niektórzy tyle w więzieniu nie siedzą ile on spędził na tropieniu Hołeckiej
@NiebieskiSzpadelNihilizmu "Grasz w przegraną grę (...) mógł to zrobić w tydzień," - tylko, że na jego profilu jest napisane INACZEJ
Sam się do tego przyznaje w wywiadach, że zbierał latami a ty biedaczku walczysz z wiatrakami.
@KasiaJ Oj piecze, dużo tych XD tym razem.
gdzie tak napisałam XDDDD
Pomyliłem się. W przeciwieństwie do ciebie nie boję się przyznać do błędu. Nie zauważyłem podobnej refleksji z twojej strony. Nie tylko troll, ale i cham?
po SIEDMIU latach pracy nad JEDNYM skryptem, to chyba nasa już musiała od niego kupić ten skrypt.
Ad absurdum też ci nie wyjdzie. Daruj sobie tanie chwyty erystyczne. Chyba, że jesteś trollem. To, że ktoś pracuje nad czymś "przez 7 lat" nie oznacza, że pracuje szybko, albo dużo. Ja przez ostatnie 7 lat pracuję nad przepisem na jajecznicę z boczkiem, i nie sprzedałem go jeszcze Amaro.
1500 obrazków dziennie przez 30 dni daje 45000 obrazków do sprawdzenia, posortowania, poprawienia...
Sposób, w jaki mówisz o tej ilości danych każe mi myśleć, że nie masz pojęcia, o czym mówisz.
Po pierwsze, jak już wspominałem, część obrazków jest na pewno odrzucana, bo są "częściowe", zawierają jeszcze niepełny tekst, który się jeszcze pojawia, albo są rozmazane. Po drugie, sprawdzanie tak przeanalizowanych danych nie polega na powtórnym wykonaniu pracy automatu, a na sprawdzeniu jego rezultatów. Operujemy więc na uporządkowanym już zbiorze danych z ewentualnym stosem na treści nierozpoznane. Więc sprawdzenie ogranicza się do przejrzenia, co wypluł automat - a są to obrazki z rezultatem OCR i ew. rozpoznanymi twarzami. Sprawdzając taki zbiór łatwo wyłapać (m. in. metodą słownikową) czy rezultaty są bez sensu. W skrócie - patrzymy na nierozpoznane obrazki i na rozpoznane obrazki. I w tych rozpoznanych sprawdzamy pobieżnie, czy nie ma pozycji typu "Tuzg" zamiast "Tusk", i na wyrywki czy Tusk to Tusk. Przy tak prostych zadaniach dokładność jest zwykle wysoka i procent błędów jest wystarczająco niski, by był pomijalny i ew. wykryty przy przeszukiwaniu bazy.
tu już zatoczylismy kółeczko. Pisalismy już o ludzkiej interwencji
Ty zatoczyłaś. Nie ma żadnych przeciwwskazań, by taka analiza uruchamiała się automatycznie. Wystarczy Cron pobierający najnowsze wydanie Wiadomości i włączający analizę. Ewentualne sprawdzenie, o ile następuje, może być wykonane w dowolnej porze.
źródło poprosze. Pokaż mi githubowy albo komercyjny algorytm, sortujący, testujący, poprawiający, rozpoznający kontekst itp ze 100% skutecznością.
Ad absurdum. Nie istnieje żadne oprogramowanie mające 100% skuteczności. Nawet Hello World może się przy odpowiednich warunkach wyglebić. Oprogramowanie sortujące dane - wystarczy nawet Elasticsearch do takich zadań. Testujący - możesz porównywać OpenCV do znanego zbioru (np. sprawdzasz kilkakrotnie czy wszystkie rozpoznane Donaldy Tuski odpowiadają wzorcowym zdjęciom Donalda Tuska i czy nie wkradły się tam jakieś Kaczyńskie). Poprawiający - testy nie poprawiają, testy wykazują błędy i odkładają je na osobną kupkę.
Nie potrzeba rozpoznawać kontekstu - wystarczy banalny algorytm rozpoznawania twarzy połączony z OCR.
więc teraz to wszystko to żmudna ręczna robota?
Nic takiego nie napisałem. Ten wniosek to albo twoje urojenia, albo brak umiejętności czytania ze zrozumieniem. W odpowiedzi na twój zarzut, że nauka obsługi OCR to tylko chwila odpisałem, że w przeciwieństwie do ręcznej obsługi OCR nauka automatyzacji takich rozwiązań jest bardziej skomplikowana. Nigdzie nie twierdzę, że on to robi ręcznie. Twierdzisz tak ty.
Biorąc pod uwagę twoją chorobliwą wręcz nieumiejętność prowadzenia dyskusji na poziomie (a utwierdza mnie w tym przekonaniu absurdalne wręcz przekręcenie moich słów w ostatnim zacytowanym przeze mnie akapicie), argumenty ad hominem i próby wyprowadzenia mnie z równowagi stwierdzeniami na temat mojej pracy, to ja odkładam szablę pierwszy. Jeżeli nie jesteś trollem, to jest mi bardzo przykro, ale jesteś najgorszym dyskutantem na Hejto zaraz za schizofrenikiem dsol17.
Ale jesteś trollem. I to miernym, bo ci się nie udało nawet usłyszeć ode mnie wyzwisk. Teraz to na pewno zapiecze. Baju baj!
@jeikobu__ "To, że ktoś pracuje nad czymś "przez 7 lat" nie oznacza, że pracuje szybko, albo dużo." - jajecznica nie ukazuje się CODZIENNIE i trwa niemal pół godziny. Nieprzerwanie, bez litości. Swięta, nie święta. Zabawne, że w tym samym paragrafie przywołujesz manipulacje erystyczne a po chwili sam ich uzywasz aż miło
"Więc sprawdzenie ogranicza się do przejrzenia, co wypluł automat" - miotasz się pomiędzy: wszystko się dzieje z automomatu i pracował (dopieszczał?) nad algorytmem przez 7 lat. Zdecyduj się, czy to nacisnięcie guzika czy mordercza praca koderska, czy długie testowanie
" Donaldy Tuski odpowiadają wzorcowym zdjęciom Donalda Tuska i czy nie wkradły się tam jakieś Kaczyńskie" - tyle, że w pewnym momncie zaczeli używać zdjęć DT z rogami. Gość nawet w jednym z postów zwraca uwagę, że w użytych nagraniach nieznacznie zmieniła się ostrość i nie omieszkał uznać, że na pewno nagranie ukradli z tvn albo innej stacji. Jeszcze w jedym przykładzie pisze, że coś tam zmainpulowali z kolorami na zdjęciu uzytym. Gość ewidentnie OGLĄDA to co nagrywa - każdego dnia od siedmiu lat
"twoją chorobliwą wręcz nieumiejętność prowadzenia dyskusji na poziomie" - napisała osoba, której argumenty są strącane raz za razem. Przez mój krótki staż na Hejto już się nauczyłam jednak, ze podczas rozmowy z osobą o lewicowych poglądach, fakty to mowa nienawiści i propaganda. Albo "metafora"
Dziwne, że to zawsze od was wychodzi, ale zakładam, ze to zwykły przypadek
"to ja odkładam szablę pierwszy." - może to i dobrze? Ogladałeś Potop? Bo waść mi się przypomniał cytat z tego filmu
"Ale jesteś trollem. I to miernym" - "wiesz", że jestem trollem, jednak prowadzisz dyskusję XDDDDD Z logiką za pan brat. Teraz już rozumiesz czemu mnie bawisz?
"bo ci się nie udało nawet usłyszeć ode mnie wyzwisk" - więc dla ciebie ostatecznym sprawdzianem w rozmowie są wyzwiska? XDDDDDD W jakim klubie dyskusyjnym trenowałeś? Na podlasiu? U kibiców Legii? U wujka Janusza? W mordowni, gdzie tanie wino na szklanki sprzedają?
@grubshy idealne na licencjat z psychologii tłumu
@Neq ...albo jak polityka potrafi owładnąć jednostką do punktu obsesji
Szacun dla kolegi, który widocznie nie wierzy w archiwa TVP. Różne rzeczy znikają, niewykluczone są "awarie". Znamy już noce palenia teczek to też możliwy jest jakiś sabotaż w archiwach. Ja doceniam wysiłek nawet jeśli się okaże niepotrzebny bo archiwa cudem przetrwają.
Zaloguj się aby komentować