Najnowsze wpisy o #datascience

Przeglądasz wpisy z tagu:

#datascience

obserwujących

wpisów

redve

Fanatyk

w Hydepark 2024-01-13T20:24:34+01:00

#matematyka #statystyka #datascience

jak skonstruować taki przedział ufności?

Założyć że urządzenie sie psuje z rozkładem normalnym, czy może dwupunktowy?

Bo totalnie nie wiem jak sie za to zabrać

dolitd 2024-01-13T23:16:22+01:00

@redve Tak o.

Zaloguj się aby komentować

redve

Fanatyk

w Hydepark 2023-12-28T11:52:10+01:00

#nauka #medycyna #biologia #datascience #matematyka

czy da się jakoś uniwersalnie sprawdzić "jak bardzo pijany/naćpany jestem"?

Nie mam na myśli alkoholu w wydychanym powietrzu, czy ilości substancji we krwi.

Chodzi mi stricte o to, czy da się określić przykładowo, że jestem pijany tak na 76.5pkt w skali redve123

Pytam, bo chciałem zrobić porównanie stan upojenia / ilość substancji, bo jestem ciekawy jakie jest optimum opłacalności.

Zgaduje że we wzorze na to pojawiłaby się jakaś całka po czasie, ilość substancji, czas od zażycia, i tempo półrozpadu (żeby określić stężenie), parametry ciała, no generalnie byłby to po⁎⁎⁎⁎ny wzór. Ale czy w ogóle tak się da?

m-q 2023-12-28T12:07:38+01:00

Amerykańska drogówka każe przejść po linii prostej

GrindFaterAnona 2023-12-28T13:53:52+01:00

@redve nie jesteś w stanie nawet koncepcyjnie opisać co to znaczy, ze dwie osoby są pijane/naćpane tak samo, a chcesz to matematycznie opisywać.

Niepowtarzalny2 2023-12-28T15:55:36+01:00

Możesz zbudować własną skalę wykonując szereg testów po różnych stanach spożycia.

Przykadowe testy:

- przejście w Lini prostej 20m w funkcji czas

- rozwiązanie 3 równianie matematycznych z mnożeniem i dodawaniem w funkcji czasu i ilości podejść

Itp.

Na podstawie zebranych wyników możesz określić w jakim stopniu upośledzone są twoja percepcja otoczenia, logiczne myślenie itp

Zaloguj się aby komentować

koszotorobur

Fanatyk

w Python 2023-12-27T12:41:37+01:00

Polars vs. pandas: What’s the Difference?

Dla zainteresowanych Data Science co używają pandas ale nie słyszeli jeszcze o zorientowanym na szybkość polars.

#technologia #python #datascience #polars #pandas

Polars vs. pandas: What’s the Difference?

Explore the key distinctions between Polars and Pandas, two data manipulation tools. Discover which framework suits your data processing needs best.

The JetBrains Blog

Zaloguj się aby komentować

redve

Fanatyk

w Hydepark 2023-12-03T14:08:50+01:00

#programowanie w pierwszej pracy jestem odpowiedzialny za developowanie nowych aplikacji, czyli wywoływanie REST-a w pythonie. Chciałem iść w branżę data science, gdzie mogę pracować z matematyką i analizowaniem danych zamiast samego klepania kodu (chce klepać kod który coś przeliczy, a nie coś monotonnego i tak prostego że nawet chatgpt to kiedyś pewnie będzie pisać).

Mam pracę w której robię bardzo mało, i płacą mi bardzo dużo. Na tyle dużo że mając ten rok doświadczenia dalej ciężko żeby mi ktoś chciał tyle dać. Problem w tym że wywoływanie REST-a to kiepskie doświadczenie dla analizy danych (chociaż stanowisko ma w sobie nawet data governence), a szczególnie takiej w której mi dobrze zapłacą.

Czy dobrym pomyslem byłoby poszukanie roboty gorzej płatnej, w której będzie zapierdol, ale która będzie powiązana ściśle z analizą danych? Tym sposobem za 2 lata miałbym 2 lata doświadczenia w branży DS i mógłbym wołać wyższe stawki w branży która mnie interesuje, a tak miałbym 3 w kodzeniu REST-a z tytułem data governence, ale chyba nic wybitnego do DS.

Przy okazji, czy w DS coś pomoże tytuł licencjata z matematyki?

#datascience #pracbaza

GrindFaterAnona 2023-12-03T16:31:52+01:00

@redve lepiej sobie zostaw dobrze platna prace, w ktorej nie musisz duzo robic. Skoro nie musisz duzo robic, to masz czas zeby sobie robic projekty DS na boku. Hobbistyczne do portfolio na gicie, male zlecenia. Licencjat z matmy dobrze widziany ale zrob tez jakies certyfikaty z rozwiazan chmurowych pod DS od Azure albo AWS i bzikaj. Doswiadczenie w budowaniu aplikacji i kodowaniu w ogole zawsze mile widziane

rakokuc 2023-12-03T17:08:55+01:00

@redve musisz sobie odpowiedzieć na jedno za⁎⁎⁎⁎ście, ale to za⁎⁎⁎⁎ście ważne pytanie: co chcesz robić w życiu – i zacząć to robić.

koszotorobur 2023-12-03T19:44:49+01:00

@redve - nawet wywołani RESTa można ulepszyć - jeśli nie używasz to polecam asyncio i asynchroniczne moduły zewnętrzne jak aiohttp.

Do analizy danych koniecznie jest ogarnięcia Pandas, Polars, Numpy, Plotly - polecam też Dash do robienia stron z wizualizacjami.

Wiedzieć jak optymalizować kod pod duże obliczenia to już chyb standard - najlepsze rezultaty daje Numba i Cython ale są też inne możliwości więc zacznij robić to kiedy się nudzisz w obecnej pracy.

Do tego warto ogarnąć chmurę i minimum ich usługi do analizy danych - AWS chyba najpopularniejszy - do tego można zrobić oficjalne certyfikaty i one są całkiem poważane.

Konteneryzacja to plus - więc ogarnięcie Dockera, Podmana, Compose to podstawa.

Linux oczywiście zawsze na propsie - minimalne musisz ogarniać WSL na Windowsie i jak developować na Windowsie lub Macu ale uruchamiać na Linuksie.

Pewnie są jakieś inne rzeczy co pominąłem ale powyższe to podstawy.

Zaloguj się aby komentować

redve

Fanatyk

w Hydepark 2023-10-28T03:24:28+02:00

#datascience #programowanie

Póki co mam stanowisko data governence engineer, ale chciałem iść bardziej w stronę analizy danych.

Mam na studiach rachunek prawdopodobieństwa i statystykę, i myślałem nad jakimś projektem żeby dostać faktycznie pracę gdzie dostaję zestaw danych, i proszą mnie o informacje co robić.

Co uważacie o takim projekcie/serii "projektów":

Wszedłem na Kaggle, pobrałem losowy zestaw danych (tutaj informacje o osobach z ryzykiem zawału serca), i przez jakiś czas będę sobie z niego wyciągał różne informacje (korelacja zmiennych losowych, wartości oczekiwane etc.). Następnie zrobię prosty skrypt który z całego zestawu danych wylosuje mi kilka obiektów, i ukryje kilka wartości (jak np. wiek pacjenta etc.). Moim zadaniem jest na podstawie reszty danych wydedukować te zakryte wartości. Oceniane będzie to jak blisko będę prawdziwej wartości.

Całość dokumentuję w postaci notatek w latexu, z dodatkową konwersją do markdown i całość wrzucam na serwer gita, dzięki czemu można podejrzeć notatki online.

GrindFaterAnona 2023-10-28T11:34:21+02:00

@redve jesli chcesz w tym pracowac to dobry pomysl, zawsze to jakis wpis do cv. Zasugeruję jedynie model klasyfikacyjny zamiast regresyjny - pisales, ze chcesz przewidywac wartosc jakichs parametrow, przewiduj po prostu czy ktos zachoruje czy nie. Jak bys mial jakies pytania to pisz, 5 lat juz jako ds.

wombatDaiquiri 2023-10-28T12:18:53+02:00

@redve

Oceniane będzie to jak blisko będę prawdziwej wartości.

Overfitting?

redve 2023-10-28T12:32:43+02:00

@wombatDaiquiri dla każdej zmiennej losowej liczę ile wyniesie: X / (|X-GX|)

Gdzie X to faktyczna wartość, a GX to moje przewidywanie (Guess)

Finalnie będę miał wektor z punktami które opisują, jak blisko byłem prawdziwej wartości

Roboczo mam taką formułę, ale już wiem że ostatnia linijka będzie do zmiany bo nie jest to dobry sposób zliczania sumy punktów (jeżeli na 10 strzałów 1 będzie prawie idealny, a reszta totalnie zła, to i tak uzyskam dużo punktów przez ten jeden strzał)

dolitd 2023-10-28T13:15:24+02:00

@redve I zmień attemt na attempt.

koszotorobur 2023-10-28T16:00:17+02:00

@redve - ciągle narzekasz, że nic nie umiesz, że niepełnosprawność, że się już poddałeś... a tu taka pozytywa NIESPODZIANKA!

To co zaprezentowałeś to już są podstawowego umiejętności analizy danych!

Myślę, że masz problem z samooceną która nie przystoi do stanu faktycznego i jesteś dla siebie za surowy.

Jeśli chcesz kontynuować naukę to dobrze też znać narzędzia - najpopularniejsze obecnie są Python w połączeniu z Pandas lub Polars. Do tego Jupyter Notebooks oraz coś do rysowania wykresów jak Plotly czy robienia całych stron www prezentujących dane jak Dash.

Życzę Zaciętości i Powodzenia!

Zaloguj się aby komentować

redve

Fanatyk

w Hydepark 2023-09-15T11:11:15+02:00

#programowanie #datascience polecicie jakąś większą społeczność związaną z data science, i szeroko pojętą analizą danych? Obecnie pracuje na stanowisku związanym z archiwizacją danych, i chcę się przebranżowić na analizę. Oprócz doświadczenia z kodem, mam raczej solidny background matematyczny, więc takie pojęcia jak współczynnik korelacji, kowariancja zmiennych losowych, czy nierówność Czebyszewa mnie nie przerażają, ale od policzenia czegoś do bardziej użytecznych danych jeszcze daleka droga. Myślę jak zacząć iść w tym kierunku.

qdco 2023-09-15T11:32:51+02:00

@redve Polecam kursy od Andrew Ng na coursera, wielu od tego zaczynało. Były za free, jak nie chcesz certyfikatu oficjalnego, nie wiem czy nadal tak jest.

GrindFaterAnona 2023-09-15T23:18:21+02:00

@redve jak chcesz spolecznosc to na medium.com jest masa artykulow od podstaw

rayros 2023-09-16T12:10:04+02:00

Kaggle, huggingface

Zaloguj się aby komentować

entropy_

★GURU

w Hydepark 2023-08-24T13:41:42+02:00

@rakieciara dodała fajny zbiór danych do wykrywania hejtu na podstawie moderacji serwisu wykop.pl

https://www.hejto.pl/wpis/polski-zbior-danych-do-wykrywania-hejtu-powstal-przy-wspolpracy-z-wykop-pl

Znalazłem kilka cytatów o partii:

8292,"> uważaj kolego już raz oddziały specjalne [pseudonym] skasowały ten obrazek

{USERNAME}: j⁎⁎ać pis też kasują za to j⁎⁎ać biedę już jest legalne

! debile",1

3548,"Jak myślicie, będzie coś dzisiaj w #tvpis o zabójstwie irańskiego generała? Czy standardowo broszurka wyborcza PiS i udajemy, że świat poza Polską nie istnieje? ( ͡° ͜ʖ ͡°)

#bekazpisu #kurwizja #polityka",1

8540,"Na S8 do Warszawy wjeżdża okolo 30 policyjnych suk. Czyby Pis coś szykował?

#warszawa #jebacpis",1

2763,No j mamy pierwsze blokady dróg . J⁎⁎ac PiS ( ͡° ͜ʖ ͡°),1

Na szybko przejrzałem, ale j⁎⁎ać + OPA/Ciebie/[nazwisko]/grupę społeczną/policję/kraj jest na liście ale

j⁎⁎ać + inna niż pis partia nie ma w tym zbiorze albo jest w minimalnych ilościach

Znalazłem też w sumie 0 wystąpień dla j⁎⁎ać biedę i tagu jebacbiede

Jak ktoś będzie trenował na tym sieci neuronowe to niemożliwe będzie wypowiadanie się negatywnie o partii bo automoderacja nie pozwoli

#sztucznainteligencja #datascience #programowanie #ai

Polski zbiór danych do wykrywania hejtu powstał przy współpracy z Wykop.pl - rakieciara - Hejto.pl

Gdzie można znaleźć najbardziej krzywdzące i obrzydliwe komentarze w całym polskim internecie? W zbiorze danych przygotowanych przez naukowców z instytutu badawczego NASK we współpracy z Wykop.pl. Dataset może zostać wykorzystany do treningu modeli sztucznej inteligencji wykrywających

Hejto.pl

GrindFaterAnona 2023-08-24T17:11:51+02:00

@entropy_ a co to z lista? Tego typu algorytm powinien wylapywac szerszy kontekst niz ograniczac sie do zlepku slow

entropy_2023-08-24T17:45:44+02:00

@GrindFaterAnona tyle, że tam jest negatywnie w 99% o Pisie.

Algorytm nauczy się, że negatywne komentarze o pisie to mowa nienawiści i nie będziesz mógł nic napisać złego o partii.

Zobacz przykład 3548. To nie jest mowa nienawiści ale uczysz algorytm banowania takich tekstów, które są partii nieprzychylne.

Szczerze to nie znalazłem za dużo o innych partiach

GrindFaterAnona 2023-08-24T21:50:05+02:00

@entropy_ i dont care, wykop moze mi possać. Wolalbym porozmawiać o algorytmach pod tagiem #datascience

Zaloguj się aby komentować

rakieciara

Mocarz

w AI 2023-08-24T12:19:21+02:00

Polski zbiór danych do wykrywania hejtu powstał przy współpracy z Wykop.pl

Bieżąca...

#sztucznainteligencja

#naukawpolsce

GitHub

kolorado

Twórca

w Programowanie 2023-05-25T17:39:37+02:00

Cześć,

czy jest tu jakiś ekspert z #datascience, który zechciałby mi pomóc w stworzeniu prostego modelu predykcyjnego? Mam wstępnie obrobione dane w .csv, ale utknąłem na modelowaniu, tj. nie jestem pewien w jaki sposób dobrać parametry żeby to miało ręce i nogi i żeby móc z tego wyciągnąć jakiekolwiek poprawne wnioski.

Z góry dzięki za pomoc!

plemnik_w_piwie 2023-05-25T18:48:23+02:00

@kolorado a opiszesz po krotce co tam masz? Co chcesz zrobić?

kolorado 2023-05-25T19:39:39+02:00

@plemnik_w_piwie tak, potrzebuję zrobić model predykcyjny, którego zadaniem będzie sprawdzenie szansy na to, że dany pociąg będzie opóźniony. Dane, które posiadam zawierają informacje o konkretnych pociągach, stacjach, datach i godzinach przyjazdu/odjazdu oraz o opóźnieniach na danych relacjach. Próbowałem to wszystko wymodelować w SAS Miner, ale wyniki raczej nie były satysfakcjonujące.

plemnik_w_piwie 2023-05-25T20:33:11+02:00

@kolorado no to zacznij od prostej statystyki dla danej linii:

Wykres opożnienia linii w czasie, to od razu ci pokaże trendy.

Średnie opóźnienie i odchylenie standardowe ci pokażą, która linia ma ogolnie niejwieksze opóźnienia

Potem sprawdziłbym korelacje między nimi, bo spożnienia mogą chodzic parami.

Cykliczność i ogólnie postarał się zrozumieć przyczynę opóźnień, bo jeśli np na twoich liniach bywają opóźnienia z powodu problemów z pociągi spoza twojej listy, to powinieneś rozszerzyć badanie. Pkp kiedyś podawało powody opóźnienia pociągu przy portali z ich śledzeniem. Ale to trzebaby studiować na bieżąco, bo nie kojarzę archiwalnych danych z tego. Fajne zajęcie ogólnie:)

Zaloguj się aby komentować

motoinzyniere

Mocarz

w Hydepark 2023-05-16T14:50:38+02:00

Czy możesz mi wysłać CSV? Otworzyłbym to sobie u siebie w Excelu...

¯\_(ツ)_/¯

#datascience #pracbaza

kolorado 2023-05-16T16:25:08+02:00

@motoinzyniere R powinien udźwignąć?

tellet 2023-05-16T16:40:07+02:00

@motoinzyniere

CSV

anetko wyślę ci tego eksela bo u mnie coś się nie otwiera, pewno musze po informatyka dzwonić!

SzalonyNalesnik 2023-05-16T17:11:32+02:00

sporo, najwieksza jaka ja widzialem byla 5x większa, tylko przy tych wielkościach to każdy select trzeba 10x przemyslec bo full backup leci 30 godzin na pure macierzach, strach dotykac:)

Zaloguj się aby komentować

datachaint

Debiutant

w Dyskusje 2023-05-06T12:34:43+02:00

Kiedy Excel już nie daje rady - o pracy Data Scientist i jego supermocach

W dzisiejszych czasach analiza danych jest niezbędna w wielu dziedzinach, od biznesu po sport, ale czy na pewno rozumiemy, czym zajmuje się data scientist? Dowiedz się ile zarabia, czym się zajmuje, jak nim zostać oraz czy w przyszłości jego praca nie zostanie zastąpiona przez sztuczną...

#sztucznainteligencja

Debiutant

w Dyskusje 2023-04-23T20:13:33+02:00

tl;dr: założylem bloga o statystyce/danych jak narazie czekam na informacje zwrotne o tym czy jakoś to wygląda

Witajcie! Jestem właścicielem nowego polskiego bloga o danych https://datachaint.me i chciałbym Wam opowiedzieć trochę o tym, czego możecie się spodziewać od tej strony.

Dane to dziś jeden z najważniejszych zasobów, którymi dysponujemy. Mogą nam pomóc w podejmowaniu decyzji, rozwijaniu biznesu czy w codziennym życiu. Jednakże, by korzystać z danych należy wiedzieć jak je pozyskać, przetwarzać oraz interpretować. A to właśnie będzie tematem naszych artykułów.

Chcemy, aby nasz blog był miejscem, gdzie każdy, niezależnie od poziomu swojej wiedzy, mógł znaleźć interesujące informacje o danych i sposobach ich wykorzystania oraz dodać swój własny artykuł. Będziemy starali się pisać w prostych i zrozumiałych dla każdego słowach, tak aby nawet osoby, które nie są specjalistami w tej dziedzinie, mogły łatwo zrozumieć, o czym mówimy.

Nasze artykuły będą poruszać różne tematy, począwszy od podstawowych pojęć związanych z danymi, poprzez analizę danych, po machine learning i sztuczną inteligencję. Postaramy się również pisać o różnych zastosowaniach danych, takich jak marketing, zarządzanie firmą czy nauka.

Jeśli interesujesz się tematyką danych, chciałbyś nauczyć się czegoś nowego lub po prostu poszerzyć swoją wiedzę, to nasz blog jest dla Ciebie. Będziemy publikować artykuły regularnie, więc warto zaglądać na naszą stronę co jakiś czas.

Mamy nadzieję, że nasz blog stanie się dla Was cennym źródłem wiedzy o danych. Jeśli macie jakieś sugestie czy pytania, to zachęcamy do kontaktu. Chętnie odpowiedzielibyśmy na Wasze pytania i wysłuchalibyśmy Waszych sugestii.

Pierwszy post pojawił się 16 kwietnia, jednak dopiero dzisiaj staram się jakoś rozpromować moją stronę. Blog wystartował kilka dni temu i jestem świadom tego, że nie wszystkie funkcje działają (np. newsletter). Moim celem jak na tą chwile jest sprawdzenie tego czy chociażby jedna osoba byłaby zainteresowana taką działalnością. Jeżeli macie jakieś pomysły na poprawę lub chcielibyście dodać swój artykuł, prosiłbym o wysłanie informacji na email: [email protected]

Dziękujemy, że jesteście z nami i zapraszamy do czytania naszych artykułów! https://datachaint.me

#blog #analizadanych #statystyka #statystyki #machinelearning #programowanie #python #datascience #nauka

datachaint - Twoja zatoka danych

Polskie forum zajmujące się analizą danych

Datachaint

Jason_Stafford 2023-04-23T20:50:42+02:00

@datachaint przecież tam nic nie ma ¯\_(ツ)_/¯

datachaint 2023-04-23T21:13:40+02:00

@Jason_Stafford witam co mógłbym zrobić, żeby coś się tam pojawiło, za wszelką pomoc dziękuje

Jason_Stafford 2023-04-23T21:37:36+02:00

@datachaint Ty prowadzisz bloga o danej tematyce i pytasz się innych co tam umieścić? Coś mi się wydaje, że nie miałeś pomysłu i tak sobie o, zrobiłeś z nudów.

Zaloguj się aby komentować

rakieciara

Mocarz

w AI 2023-03-28T20:54:38+02:00

Hej(to)!

Kiedy udostępniałam tu meetup Polish Machine Learning Community kilka osób pisało, ze nie mogą się pojawić, ale chętnie obejrzeliby nagrania po. I oto nagrania są dostępne, playlista na youtube.

Było to moje pierwsze poważne wystąpienie publiczne i stres trochę zjadł, ale będzie tylko lepiej!

#programowanie #naukaprogramowania #ai #python #datascience #machinelearning #astronomia #radioteleskop

mute 2023-03-28T22:45:31+02:00

(° ͜ʖ °)

Opornik

★

2023-03-29T04:50:03+02:00

@rakieciara brawo:)

biskitus 2023-03-29T07:55:53+02:00

Super! Z każdym kolejnym będzies się czuć swobodniej. Wyobraź sobie że na sali siedzą twoi znajomi i opowiadasz im o swoim hobby

Zaloguj się aby komentować

Macer

Osobistość

w Nauka 2023-02-01T21:08:21+01:00

wykres roku xD

#heheszki #wykresy #datascience

Heheszki

★

2023-02-01T21:14:33+01:00

Roku 2020

A_I

★

2023-02-01T23:49:59+01:00

@Macer oj no dwie osie by były i by było git, w UK spada a na świecie nie, wszystko gra xd

GrindFaterAnona 2023-04-21T15:51:46+02:00

@Macer sprytne

Zaloguj się aby komentować

inskpektor

Wirtuoz

w Ciekawostki 2022-12-15T17:34:44+01:00

Wizualizacja blackoutów w Kijowie. (https://observablehq.com/@mourner/blackouts)

Visualizing Blackouts at Home in Kyiv

8 months into Russia's genocidal invasion of Ukraine, after a series of humiliating losses, Russia turned to a tactic it's much better equipped to do than conventional warfare — a cowardly war on civilians. With Ukraine approaching winter & freezing temperatures, Russia launched wave after wave of mass missile and drone strikes on energy infrastructure, trying to destroy the power grid and subsequently deprive Ukrainian civilians of not only electricity, but also heating, running water, light and communicat

Observable

tak_bylo 2022-12-15T18:02:10+01:00

@inskpektor not great, not terrible

Zaloguj się aby komentować

S2k0

Twórca

w Ciekawostki 2022-10-05T09:44:05+02:00

Midjourney AI

Na fali popularności AI Generatorów obrazków, zachęcam do przetestowania i podzielenia się pracami

oto przykład komendy:

/imagine samurai with sword in hand walking in cyberpunk city rain ghost in the shell style

Kompan

w Programowanie 2021-11-17T23:46:04+01:00

Uwaga! 10 grudnia odbędzie się pierwsza konferencja zorganizowana pod marką Order of Devs.

Darmowy bilet oraz więcej informacji możesz znaleźć: https://www.subscribepage.com/orderofdevsconference

Na konferencji pojawią się 3 ścieżki tematyczne:

data science,
cloud,
frontend.

Każda osoba posiadająca bilet dostanie linki do transmisji mailem w dniu wydarzenia, dzięki czemu będzie mogła uczestniczyć w wydarzeniu online lub odtworzyć nagranie w innym momencie.

Właściciele biletów zostaną również zaproszeni do przedsprzedaży dostępu do naszego programu mentoringu grupowego.

Zapraszamy! Zapraszamy też do udostępniania

https://www.facebook.com/Order-of-Devs-238944198047414/

Order of Devs Konferencja

Zapraszamy na konferencję stworzoną przez pasjonatów dla pasjonatów szeroko pojętego programowania oraz IT.

www.subscribepage.com

lubieplackijohn 2021-11-18T08:33:38+01:00

@hackerman No dzień dobry

Zaloguj się aby komentować

hackerman

Kompan

w Ciekawostki 2021-06-02T20:10:17+02:00

Już 26.06.2021 od 11 do 18! na naszym discord Data Society Community, aż 7 prelekcji pełnych praktycznej wiedzy. Tematyka od data science, ML, AI i projektowanie architektury. Zapraszam!!! https://summer-data-society-conf.carrd.co/

Summer Data Society Conf

Summer Conf

Summer Data Society Conf

hackerman 2021-06-03T00:06:02+02:00

@lubieplackijohn Wpadnij na sam discord bo tam masz też różniaste tematy

Zaloguj się aby komentować

pyXelr

Praktykant

w Machine learning 2021-05-08T20:36:04+02:00

Best-of Machine Learning with Python - lista najpopularniejszych repozytoriów aktualizowana co tydzień. Przejrzałem zawartość i śmiało mogę polecić jako jedną z lepiej zorganizowanych list typu "awesome". Na + zasługuje duża przejrzystość, ogrom kategorii i posortowanie narzędzi po liczbie gwiazdek na GitHubie/ich jakości.

https://github.com/ml-tooling/best-of-ml-python

Polecam też sprawdzić resztę list "best of" od powyższych autorów (link znajdziecie w repo)

GitHub - ml-tooling/best-of-ml-python: 🏆 A ranked list of awesome machine learning Python libraries. Updated weekly.

🏆 A ranked list of awesome machine learning Python libraries. Updated weekly. - GitHub - ml-tooling/best-of-ml-python: 🏆 A ranked list of awesome machine learning Python libraries. Updated weekly.

GitHub

Zaloguj się aby komentować

hackerman

Kompan

w Hydepark 2021-02-26T22:38:45+01:00

Jednym z bardziej ciekawych wzorców architektonicznych jest architektura zwana Pipe And Filters.

Co nam daje?

Polega ona na utworzeniu za pomocą modułów w kodzie idempotentych przepływów danych.

Przykład na ML flow:

Dane => Mapowanie danych => Analiza danych => Imputacja danych => Transformacja danych (np scalowanie) => Uczenie na danych => Weryfikacja modelu => Deploy modelu

Co nam daje P&F?

Możemy bez problemu każdą z tych części zrównoleglić od siebie i użyć tak zwanych collectors do zbierania wyników i przekazania ich do kolejnego modułu.

Dane => 1..N osobnych procesów => Mapowanie danych => Analiza danych => Imputacja danych => Transformacja danych => Kolektor => Uczenie na danych => weryfikacja modelu => Deploy modelu

P. S. Co to podziału analizy statystycznej na mniejsze batche opieram się na Centralnym Twierdzeniu Granicznym, dlatego mogę robić na zatomizowanych ilościach

Z ciekawości czy ktoś chciałby coś o ML/DS ?

hackerman 2021-02-26T22:57:27+01:00

@chusteczka_haftowana Yeap myślę, że temat fajny ale bardzo szeroki

chusteczka_haftowana 2021-02-26T23:00:38+01:00

@hackerman takie są najlepsze, ale trzeba mieć o tym większe pojęcie, niż wydzierganie prostego programiku w konsoli

pyXelr 2021-02-28T12:29:20+01:00

@hackerman Z chęcią poczytam. Sam ostatnio raczkuję w pracy w tematyce MLOps, dlatego też przyda się poszerzyć wiedzę

Zaloguj się aby komentować

Poprzednia strona

1 2 3

Następna strona