#datascience

6
31
Kombinacje 4 cyfrowych PINów

#ciekawostki #datascience #statystyka #nauka #matematyka #technologia
33a7e5aa-83a0-4aae-866a-3ee82672cc3c
Suodka_Monia

@Only2Genders fake. Trochę mało rzułto przy 2137

Bystrygrzes

Mam w karty Maestro. Polska i Austriacka. Polska znajduje się w jasnym a Ausria w ciemnym kolorze. Co ciekawe pin był nadany przez maestro

Zaloguj się aby komentować

Znacie kogoś kto potrzebuje pracownika przy analizie danych?
Jestem pod koniec licencjatu z matematyki (obrona ma być we wrześniu, praca jest o proceduralnym tworzeniu treści w grach). Głównie zajmuje sie statystyką, rachunkiem prawdopodobieństwa, oraz algorytmiką (rzeczy około programowania). Studiowałem takie zagadnienia jak procesy stochastyczne, rachunek Ito, jednorodne łańcuchy Markova, oraz zagadnienia pomocne przy tworzeniu modeli (takie jak teoria grafów, czy algebra liniowa i abstrakcyjna). Tworzyłem analizy techniczne wraz z dopasowaniem modelu do cen akcji na giełdzie, a następnie przeprowadzenie analizy ex ante i ex post. Wyznaczałem też współczynniki determinacji modelu. Na studiach też uczyłem się używania algorytmów genetycznych do optymalizacji zadań, tak samo jak tworzyłem sieci neuronowe oraz modele regresji wielorakiej

Mam zaplecze jeżeli chodzi o bycie zwykłym programistą. Tworzyłem skrypty w pythonie, gry w c++, serwery TCP w ruście, czy aplikacje mobilną w C# Xamarin. Jestem nawet autorem pluginu do neovima stworzonego w Lua który zebrał jakieś gwiazdki na githubie. Do tego kilka mniejszych kontrybucji do kodu open source. Selfhostuję usługi na prywatnym serwerze, więc podstawowe zarządzanie linuxem też mam opanowane (abstrachując od używania linuxa na desktopie od dzieciństwa w sumie)

Same dane zwykle analizuję używając kodu w pythonie lub arkuszy excela, a raporty tworzę w Latexu. Do pokazywania danych zwykle używam wykresów matplotliba albo seaborna.

Chcę pokazać że mam wiedzę, i że sobie poradzę z analizą danych. Porozsyłałem troche cv ale ciężko żeby ktoś dał szansę osobie bez doświadczenia stricte w analizie. Jeżeli chodzi o doświadczenie komercyjne w ogóle, to mam 1.5 roku doświadczenia jako junior data governance engineer gdzie głównie developowałem skrypty w pythonie do obsługi rest API, czy programy do szukania zepsutych plików w środowisku online wykorzystując selenium.

Podrzucam githuba na którym są moje pomniejsze kontrybucje. Reszte projektów mam na własnym serwerze gita
https://github.com/redve-dev

#pracbaza #datascience #niewiemjaktootagowac #matematyka
aae91771-a3ea-4bc1-8a6c-309ce106c84b
plemnik_w_piwie

@redve ja wiem gdzie potrzeba jest teoretyka-dobrego ziomka od doe, od trudnych przypadków I do pomocy z qbd. Ale ci co go potrzebują o tym nie wiedzą i wolą robić bezmyślną dłubaninę na lewych szablonach przez niekompetentnych przygłupów. A potem zdziwko, że nic nie wychodzi, więc metodologia jest zła, hurr durr kto to słyszał matematykie łączyć z inżynierią procesową!?

Jak będę zakładał swoją firmę o podobnym profilu to cię biorę z miejsca. Nie wiem czy cię to pocieszy:/

Papa_gregorio

@redve zerknij na instytut opi pib, mogą szukać kogoś

m_balazy

pokaz repo z pluginem do nvim'a

Zaloguj się aby komentować

Zostań Patronem Hejto i odblokuj dodatkowe korzyści tylko dla Patronów

  • Włączona możliwość zarabiania na swoich treściach
  • Całkowity brak reklam na każdym urządzeniu
  • Oznaczenie w postaci rogala , który świadczy o Twoim wsparciu
  • Wcześniejszy dostęp, do wybranych funkcji na Hejto
Zostań Patronem
Spróbowałem zrobić kalkulator który oblicza ile mniej więcej pieniędzy nam ubyło z portfela z powodu inflacji w 2023 (można łatwo zmodyfikować arkusz żeby był dla dowolnego miesiąca, można też wpisać inflację ukrytą).

Wyliczyłem to w następujący sposób:
Jeżeli inflacja w danym miesiącu wynosi np 16.6% w skali roku, to oznacza że gdyby przez 12 miesięcy pieniądze traciły na wartości tyle ile straciły w tym miesiącu, to w skali roku stracilibyśmy 16.6% pieniędzy z początkowego miesiąca.
Tym samym po roku te pieniądze są warte (1-0.166=0.834), a biorąc poprawkę na to że są to straty po 12 takich samych miesiącach, to stracone pieniądze w tym miesiącu są pierwiastkiem 12 stopnia z 0.834

W każdym miesiącu sumaryczne straty wyliczam w następujący sposób:
Zakładam że oszczędności to przychody-wydatki. Jako "wartość oszczędności względem pierwotnej kwoty" liczę oszczędności z obecnego miesiąca + dotychczasowe oszczędności, i całość mnożę przez straty z tego miesiąca.

Zakładałem przy tworzeniu tego szablonu że w każdym miesiącu uda się coś zaoszczędzić. Nie jestem pewien czy model będzie sie poprawnie zachowywał, jeżeli w jakimś miesiącu wydatki przekroczą przychody (np. kupimy samochód na który oszczędzaliśmy od dawna). Sprawdzając pobieżnie wydaje mi się że jest dobrze. Podrzucam wam arkusz jakby ktoś chciał sie pobawić, albo znalazł błąd.

Podrzucam link jakby ktoś chciał pobrać
https://docs.google.com/spreadsheets/d/10jh0JPqZvoBRwt9dF1QSozKUEaKS_39N/edit?usp=sharing&ouid=107715318295966714274&rtpof=true&sd=true

#datascience #pieniadze i nie wiem czy #gospodarka
9868ee5d-edec-4dab-b21f-cb9903725d3d
01980ce5-5719-406e-9114-d9c629396eea
michal-g-1

Możesz znaleźć też dane o inflacji w skali miesiąca i po prostu przemnażać $ po kolejnych miesiącach

Zaloguj się aby komentować

#programowanie
Od jakiego stanowiska można zająć karierę w #datascience ?
Mam licencjat z matematyki (a raczej we wrześniu powinienem mieć, bo wtedy sie bronie), a do tego póki co 1.5 roku komercyjnego expa w korpo, ale jako zwykły dev w data governence, to nie wiem czy ktoś na to spojrzy.

Na data scientista każdy wymaga kilku lat expa z AI, czy z samą analizą
#pracbaza
slawek-borowy

ja bym wbijał do firmy, która zajmuje się interesującym Cię tematem, na dowolne stanowisko specjalistyczne i wtedy dużo łatwiej będąc na pokładzie pogadać z ludźmi od tego, douczyć się na praktycznym przykładzie, etc.

Parę razy widziałem ten scenariusz na żywo i za każdym razem działał tak samo - ktoś chciał robić coś innego więc łaził do ludzi którzy to robią i im truł, potem dostawał jakieś projekty, albo sam sobie wymyślał i dalej truł, a potem już coś umiał i zaczynał stawiać warunki (niekiedy już innym firmom


Druga rzecz, że oczekiwanie kilku lat doświadczenia z AI to raczej pobożne życzenie, takie oferty w zasadzie same się filtrują.

wombatDaiquiri

@redve fake it till you make it, pozdrawiam

GrindFaterAnona

@redve śledząc twoje wpisy obstawiam, ze przejdziesz dowolną rekrutację na mid DS, a moze i senior. zapoznaj się z procesem pracy DS (EDA, feature engeneering, modelowanie, deployement) i próbuj. akurat w czwartek rekrutuję na seniora to mogę ci podpowiedziec na co zwracamy uwagę

Zaloguj się aby komentować

#programowanie #pracbaza #datascience
Czy wpisując do CV moje projekty, jest sens wpisywać prace zaliczeniowe ze studiów?
Konkretniej te prace to:
-Analiza techniczna cen akcji na giełdzie + próba przewidzenia danych w przyszłości. Z analizą ad hoc, ze sprawdzaniem założeń hipotez, z analizą ad hoc i post hoc
-Licencjat w którym opisuję metody proceduralnego tworzenia światów w grach od strony matematycznej
-Wyznaczenie najkrótszej drogi pomiędzy miastami z użyciem algorytmu genetycznego

Ewentualnie zrobić w projektach jakąś jedną rubrykę gdzie opiszę zbiorczo te 3 projekty
Konto_serwisowe

Licencjat tak, resztę tylko jeśli ma związek ze stanowiskiem.

monke

@redve wydaje mi się, że nie musisz pisać czy to praca zaliczeniowa czy własny projekt - jeśli jest ciekawy, wiesz co tam się dzieje i popiera on Twoje umiejętności to jak najbardziej wpisuj.

Wydaje mi się, że częstym problemem jest, że cv ludzi co dopiero zaczynają jest puste. Nie dlatego, że nic nie robili ale dlatego, że wpiszą nazwę jakiegoś projektu czy kursy i niech się Anetka z HR domyśla czy to pasuje do tego stanowiska czy nie.

dolitd

@redve Generalnie wpisuj wszystko co ma wspólnego ze stanowiskiem na jakie aplikujesz.

Zaloguj się aby komentować

#matematyka #informatyka #datascience #programowanie
Mój wykładowca od procesów stochastycznych powiedział że procesy stochastyczne i procesy Wienera są użyteczne w pracy z komputerami i z analizą danych. Może mi ktoś podać praktyczny przykład?
Przykładowo, umiem policzyć na kartce prawdopodobieństwo
P(W1 - W3 > W2 | W2 > 0) gdzie Wn jest 1 wymiarowym procesem Wienera o rozkładzie normalnym z (mu = 0, var = n)
i dostać konkretną liczbę która może oceniać np. prawdopodobieństwo na to że bitcoin przebije jakiś próg, żeby wchodzić w trade-y które są "pewniaczkiem", ale to wydaje się zdecydowanie za proste (na poziomie licencjatu uczyliby mnie tajnego sposobu na shackowanie rynku, który gdyby działał to każdy by go używał?).

Czy umiałby mi ktoś podać przykład praktycznego zadania z zastosowaniem takich procesów stochastycznych, a zwłaszcza procesu Wienera? Do tego fajnie by było podać interpretację i zastosowanie całki Ito.

Taguję #finanse bo w nich też się tego używa podobno
ataxbras

@redve procesy Wienera są procesami w sensie Markowa. Czyli właściwie mogą opisywać większość otaczającej nas rzeczywistości.

Zaloguj się aby komentować

#programowanie #datascience #matematyka
Mam na studiach zajęcia z projektu zespołowego (mamy coś zrobić w grupie 4 studentów).
Prowadzący nam podsunął żeby zrobić coś z algorytmami genetycznymi.
Umówiliśmy sie ze ekipą że przez tydzień poprzeglądamy literature na ten temat, i sprawdzimy czy jest to coś co damy radę ogarnąć.
Temat wydaje sie w miare łatwy, i nawet zrobiłem prosty program który wykorzystuje algorytm genetyczny (narazie tylko do szukania ekstremów funkcji 1 i 2 zmiennych, i faktycznie umie je dobrze przybliżać nie wiedząc jaki wzór ma funkcja), i tu pojawia się pytanie:

znacie jakiś praktyczny projekt który by wykorzystywał taki algorytm?
Nie musi być skomplikowany, ale zwykłe szukanie ekstremum funkcji zadanej znanym wzorem jest dosyć nudne.
Chce zrobić coś, co nie będzie nudne przy pracy, tylko faktycznie będzie można poobserwać jakieś ciekawe rezultaty

EDIT: Pytam sie o coś na czym można fajnie zaprezentować taki algorytm
b62a559b-2bb1-49d1-9149-fa06e0493bbb
inskpektor

@redve znajdowanie drogi w labiryncie

TryingMyBest

Na studiach rozwiązywaliśmy problem n-queens za pomocą genetycznego ale to chyba trochę mało jak na projekt zespołowy.

jakibytulogin

U mnie na studiach był problem optymalnego użycia elektrowni różnych rodzajów (węglowe, szczytowo-pompowe itd.) na podstawie dobowego wykresu zapotrzebowania i parametrów poszczególnych elektrowni. Zadanie na 6: dokładamy el. wiatrowe losowo generujące prąd.

Zaloguj się aby komentować

()
#datascience #programowanie #heheszki
c9e40e0e-1d8e-403b-b601-6e955c5d6241
koszotorobur

@GrindFaterAnona - to jest czyste zło - na szczęście w miarę łatwe do wychwycenia jak ma się jakikolwiek linter...

jestem_na_dworzu

@GrindFaterAnona ty zły człowieku xD zaraz jakiś junior zejdzie na zawał

the_good_the_bad_the_ugly

@GrindFaterAnona That’s evilest thing I could ever imagine. xD

Zaloguj się aby komentować

#nauka #medycyna #biologia #datascience #matematyka
czy da się jakoś uniwersalnie sprawdzić "jak bardzo pijany/naćpany jestem"?
Nie mam na myśli alkoholu w wydychanym powietrzu, czy ilości substancji we krwi.
Chodzi mi stricte o to, czy da się określić przykładowo, że jestem pijany tak na 76.5pkt w skali redve123
Pytam, bo chciałem zrobić porównanie stan upojenia / ilość substancji, bo jestem ciekawy jakie jest optimum opłacalności.

Zgaduje że we wzorze na to pojawiłaby się jakaś całka po czasie, ilość substancji, czas od zażycia, i tempo półrozpadu (żeby określić stężenie), parametry ciała, no generalnie byłby to pojebany wzór. Ale czy w ogóle tak się da?
m-q

Amerykańska drogówka każe przejść po linii prostej

GrindFaterAnona

@redve nie jesteś w stanie nawet koncepcyjnie opisać co to znaczy, ze dwie osoby są pijane/naćpane tak samo, a chcesz to matematycznie opisywać.

Niepowtarzalny2

Możesz zbudować własną skalę wykonując szereg testów po różnych stanach spożycia.

Przykadowe testy:

- przejście w Lini prostej 20m w funkcji czas

- rozwiązanie 3 równianie matematycznych z mnożeniem i dodawaniem w funkcji czasu i ilości podejść

Itp.


Na podstawie zebranych wyników możesz określić w jakim stopniu upośledzone są twoja percepcja otoczenia, logiczne myślenie itp

Zaloguj się aby komentować

#programowanie w pierwszej pracy jestem odpowiedzialny za developowanie nowych aplikacji, czyli wywoływanie REST-a w pythonie. Chciałem iść w branżę data science, gdzie mogę pracować z matematyką i analizowaniem danych zamiast samego klepania kodu (chce klepać kod który coś przeliczy, a nie coś monotonnego i tak prostego że nawet chatgpt to kiedyś pewnie będzie pisać).
Mam pracę w której robię bardzo mało, i płacą mi bardzo dużo. Na tyle dużo że mając ten rok doświadczenia dalej ciężko żeby mi ktoś chciał tyle dać. Problem w tym że wywoływanie REST-a to kiepskie doświadczenie dla analizy danych (chociaż stanowisko ma w sobie nawet data governence), a szczególnie takiej w której mi dobrze zapłacą.

Czy dobrym pomyslem byłoby poszukanie roboty gorzej płatnej, w której będzie zapierdol, ale która będzie powiązana ściśle z analizą danych? Tym sposobem za 2 lata miałbym 2 lata doświadczenia w branży DS i mógłbym wołać wyższe stawki w branży która mnie interesuje, a tak miałbym 3 w kodzeniu REST-a z tytułem data governence, ale chyba nic wybitnego do DS.
Przy okazji, czy w DS coś pomoże tytuł licencjata z matematyki?
#datascience #pracbaza
GrindFaterAnona

@redve lepiej sobie zostaw dobrze platna prace, w ktorej nie musisz duzo robic. Skoro nie musisz duzo robic, to masz czas zeby sobie robic projekty DS na boku. Hobbistyczne do portfolio na gicie, male zlecenia. Licencjat z matmy dobrze widziany ale zrob tez jakies certyfikaty z rozwiazan chmurowych pod DS od Azure albo AWS i bzikaj. Doswiadczenie w budowaniu aplikacji i kodowaniu w ogole zawsze mile widziane

rakokuc

@redve musisz sobie odpowiedzieć na jedno zajebiście, ale to zajebiście ważne pytanie: co chcesz robić w życiu – i zacząć to robić.

koszotorobur

@redve - nawet wywołani RESTa można ulepszyć - jeśli nie używasz to polecam asyncio i asynchroniczne moduły zewnętrzne jak aiohttp.

Do analizy danych koniecznie jest ogarnięcia Pandas, Polars, Numpy, Plotly - polecam też Dash do robienia stron z wizualizacjami.

Wiedzieć jak optymalizować kod pod duże obliczenia to już chyb standard - najlepsze rezultaty daje Numba i Cython ale są też inne możliwości więc zacznij robić to kiedy się nudzisz w obecnej pracy.

Do tego warto ogarnąć chmurę i minimum ich usługi do analizy danych - AWS chyba najpopularniejszy - do tego można zrobić oficjalne certyfikaty i one są całkiem poważane.

Konteneryzacja to plus - więc ogarnięcie Dockera, Podmana, Compose to podstawa.

Linux oczywiście zawsze na propsie - minimalne musisz ogarniać WSL na Windowsie i jak developować na Windowsie lub Macu ale uruchamiać na Linuksie.

Pewnie są jakieś inne rzeczy co pominąłem ale powyższe to podstawy.

Zaloguj się aby komentować

#datascience #programowanie
Póki co mam stanowisko data governence engineer, ale chciałem iść bardziej w stronę analizy danych.
Mam na studiach rachunek prawdopodobieństwa i statystykę, i myślałem nad jakimś projektem żeby dostać faktycznie pracę gdzie dostaję zestaw danych, i proszą mnie o informacje co robić.
Co uważacie o takim projekcie/serii "projektów":
Wszedłem na Kaggle, pobrałem losowy zestaw danych (tutaj informacje o osobach z ryzykiem zawału serca), i przez jakiś czas będę sobie z niego wyciągał różne informacje (korelacja zmiennych losowych, wartości oczekiwane etc.). Następnie zrobię prosty skrypt który z całego zestawu danych wylosuje mi kilka obiektów, i ukryje kilka wartości (jak np. wiek pacjenta etc.). Moim zadaniem jest na podstawie reszty danych wydedukować te zakryte wartości. Oceniane będzie to jak blisko będę prawdziwej wartości.
Całość dokumentuję w postaci notatek w latexu, z dodatkową konwersją do markdown i całość wrzucam na serwer gita, dzięki czemu można podejrzeć notatki online.
f1e4fb55-975d-4ad5-b713-b476b854508f
GrindFaterAnona

@redve jesli chcesz w tym pracowac to dobry pomysl, zawsze to jakis wpis do cv. Zasugeruję jedynie model klasyfikacyjny zamiast regresyjny - pisales, ze chcesz przewidywac wartosc jakichs parametrow, przewiduj po prostu czy ktos zachoruje czy nie. Jak bys mial jakies pytania to pisz, 5 lat juz jako ds.

wombatDaiquiri

@redve 


Oceniane będzie to jak blisko będę prawdziwej wartości.


Overfitting?

koszotorobur

@redve - ciągle narzekasz, że nic nie umiesz, że niepełnosprawność, że się już poddałeś... a tu taka pozytywa NIESPODZIANKA!

To co zaprezentowałeś to już są podstawowego umiejętności analizy danych!

Myślę, że masz problem z samooceną która nie przystoi do stanu faktycznego i jesteś dla siebie za surowy.

Jeśli chcesz kontynuować naukę to dobrze też znać narzędzia - najpopularniejsze obecnie są Python w połączeniu z Pandas lub Polars. Do tego Jupyter Notebooks oraz coś do rysowania wykresów jak Plotly czy robienia całych stron www prezentujących dane jak Dash.

Życzę Zaciętości i Powodzenia!

Zaloguj się aby komentować

#programowanie #datascience polecicie jakąś większą społeczność związaną z data science, i szeroko pojętą analizą danych? Obecnie pracuje na stanowisku związanym z archiwizacją danych, i chcę się przebranżowić na analizę. Oprócz doświadczenia z kodem, mam raczej solidny background matematyczny, więc takie pojęcia jak współczynnik korelacji, kowariancja zmiennych losowych, czy nierówność Czebyszewa mnie nie przerażają, ale od policzenia czegoś do bardziej użytecznych danych jeszcze daleka droga. Myślę jak zacząć iść w tym kierunku.
qdco

@redve Polecam kursy od Andrew Ng na coursera, wielu od tego zaczynało. Były za free, jak nie chcesz certyfikatu oficjalnego, nie wiem czy nadal tak jest.

GrindFaterAnona

@redve jak chcesz spolecznosc to na medium.com jest masa artykulow od podstaw

Zaloguj się aby komentować

@rakieciara dodała fajny zbiór danych do wykrywania hejtu na podstawie moderacji serwisu wykop.pl
https://www.hejto.pl/wpis/polski-zbior-danych-do-wykrywania-hejtu-powstal-przy-wspolpracy-z-wykop-pl

Znalazłem kilka cytatów o partii:
8292,"> uważaj kolego już raz oddziały specjalne [pseudonym] skasowały ten obrazek
{USERNAME}: jebać pis też kasują za to jebać biedę już jest legalne
! debile",1

3548,"Jak myślicie, będzie coś dzisiaj w #tvpis o zabójstwie irańskiego generała? Czy standardowo broszurka wyborcza PiS i udajemy, że świat poza Polską nie istnieje? ( ͡° ͜ʖ ͡°)
#bekazpisu #kurwizja #polityka",1

8540,"Na S8 do Warszawy wjeżdża okolo 30 policyjnych suk. Czyby Pis coś szykował?
#warszawa #jebacpis",1

2763,No j mamy pierwsze blokady dróg . Jebac PiS ( ͡° ͜ʖ ͡°),1

Na szybko przejrzałem, ale jebać + OPA/Ciebie/[nazwisko]/grupę społeczną/policję/kraj jest na liście ale
jebać + inna niż pis partia nie ma w tym zbiorze albo jest w minimalnych ilościach

Znalazłem też w sumie 0 wystąpień dla jebać biedę i tagu jebacbiede

Jak ktoś będzie trenował na tym sieci neuronowe to niemożliwe będzie wypowiadanie się negatywnie o partii bo automoderacja nie pozwoli

#sztucznainteligencja #datascience #programowanie #ai
entropy_ userbar
GrindFaterAnona

@entropy_ a co to z lista? Tego typu algorytm powinien wylapywac szerszy kontekst niz ograniczac sie do zlepku slow

entropy_

@GrindFaterAnona tyle, że tam jest negatywnie w 99% o Pisie.

Algorytm nauczy się, że negatywne komentarze o pisie to mowa nienawiści i nie będziesz mógł nic napisać złego o partii.

Zobacz przykład 3548. To nie jest mowa nienawiści ale uczysz algorytm banowania takich tekstów, które są partii nieprzychylne.

Szczerze to nie znalazłem za dużo o innych partiach

GrindFaterAnona

@entropy_ i dont care, wykop moze mi possać. Wolalbym porozmawiać o algorytmach pod tagiem #datascience

Zaloguj się aby komentować

Cześć,
czy jest tu jakiś ekspert z #datascience, który zechciałby mi pomóc w stworzeniu prostego modelu predykcyjnego? Mam wstępnie obrobione dane w .csv, ale utknąłem na modelowaniu, tj. nie jestem pewien w jaki sposób dobrać parametry żeby to miało ręce i nogi i żeby móc z tego wyciągnąć jakiekolwiek poprawne wnioski.
Z góry dzięki za pomoc!
plemnik_w_piwie

@kolorado a opiszesz po krotce co tam masz? Co chcesz zrobić?

kolorado

@plemnik_w_piwie tak, potrzebuję zrobić model predykcyjny, którego zadaniem będzie sprawdzenie szansy na to, że dany pociąg będzie opóźniony. Dane, które posiadam zawierają informacje o konkretnych pociągach, stacjach, datach i godzinach przyjazdu/odjazdu oraz o opóźnieniach na danych relacjach. Próbowałem to wszystko wymodelować w SAS Miner, ale wyniki raczej nie były satysfakcjonujące.

plemnik_w_piwie

@kolorado no to zacznij od prostej statystyki dla danej linii:

Wykres opożnienia linii w czasie, to od razu ci pokaże trendy.

Średnie opóźnienie i odchylenie standardowe ci pokażą, która linia ma ogolnie niejwieksze opóźnienia

Potem sprawdziłbym korelacje między nimi, bo spożnienia mogą chodzic parami.

Cykliczność i ogólnie postarał się zrozumieć przyczynę opóźnień, bo jeśli np na twoich liniach bywają opóźnienia z powodu problemów z pociągi spoza twojej listy, to powinieneś rozszerzyć badanie. Pkp kiedyś podawało powody opóźnienia pociągu przy portali z ich śledzeniem. Ale to trzebaby studiować na bieżąco, bo nie kojarzę archiwalnych danych z tego. Fajne zajęcie ogólnie:)

Zaloguj się aby komentować

Czy możesz mi wysłać CSV? Otworzyłbym to sobie u siebie w Excelu...
¯\_(ツ)_/¯
#datascience #pracbaza
95341885-6016-4994-b98a-9d71093f0520
kolorado

@motoinzyniere R powinien udźwignąć?

tellet

@motoinzyniere


CSV


anetko wyślę ci tego eksela bo u mnie coś się nie otwiera, pewno musze po informatyka dzwonić!

SzalonyNalesnik

sporo, najwieksza jaka ja widzialem byla 5x większa, tylko przy tych wielkościach to każdy select trzeba 10x przemyslec bo full backup leci 30 godzin na pure macierzach, strach dotykac:)

Zaloguj się aby komentować

Następna