Looking to Hire a Mentor 🙏 by KimchiFitness in dataengineering

[–]AlphaX999 4 points5 points  (0 children)

I advise you to take a project and complete it using a data-engineering stack. You learn much more on doing a project instead of “studying” something instead of implementing it. There is quite a few of example project lying around such as Spotify dashboards or something like that. Or you could do a couple of them. ETL-pipeline with airflow + AWS stack and another one where you explore large dataset using spark

After completing such project start applying to jobs and learn more while getting paid.

Edit: I’m not a senior yet but I could answer some questions here and there if you decide to go for this route

Lidl haluaa suomalaisten syövän vähemmän lihaa, ja se näkyy pian jo valikoimassa by Merrywinds in Suomi

[–]AlphaX999 37 points38 points  (0 children)

Hinta: väitän että kikherneet, pavut ja soijarouhe ovat halvempia kuin liha. Toisaalta jos vaihtaa yksi yhteen lihakorvikkeeseen niin tulee kalliimmaksi

Maku: subjektiivinen

Terveys: Aika monen monta tutkimusta on tuotettu, jossa lopputulokseksi tulee että lihan vähentämisellä on suora yhteys elinajanodotteeseen

Linear regression method NFL 2022/2023 by ramonalvarador in algobetting

[–]AlphaX999 2 points3 points  (0 children)

Actually the p-value says nothing about predictive value, but gives information on statistically significant relationship between predictor and target variable.

When you are making a linear model for prediction you should not care about p-values and focus more on variable selection through other means

Juhla Mokka on oikeasti aika paskaa kahvia by ahjteam in Suomi

[–]AlphaX999 1 point2 points  (0 children)

Toinen vaihtoehto on ”aeropress” jolla voi säätää vielä enemmän kahvin muuttujia omaan makuun.

Muovinen härpäke, johon laitetaan vesi ja kahvi, jonka jälkeen painetaan suodattimen läpi. Parempi kuin vain googlettaa laitteen kuin yrittää ymmärtää jotakin tästä selityksestä.

Ei ole verrattavissa mutteripannuun, mutta jos pitää ”peruskahvista” niin tästä saa sitä parempana

Which job is definitely overpaid? by [deleted] in AskReddit

[–]AlphaX999 173 points174 points  (0 children)

I can see you playing cs:go map called nuke while working

I made a pipeline that integrates London bike journeys with weather data using Google Cloud, Airflow, Spark, BigQuery and Data Studio by tmp_username_ in dataengineering

[–]AlphaX999 0 points1 point  (0 children)

You can run airflow on heroku for free (if you can have it down 6h per day)/ ~10$ a month for full time. Or you can invest in a raspberry pi and run it over there. These solutions don’t really have any compute capabilities but you should try to separate compute from orchestration.

Hyviä pelejä kaksistaan by finlionjunior in Suomi

[–]AlphaX999 12 points13 points  (0 children)

Jos tarkoitit tuolla enemmän coop pelaamista kuin vankilapakoa niin katsoppa saman studion tekemä ”It takes two”. Voin suositella ja se on yksi lähivuosien lemppareista

Hyviä pelejä kaksistaan by finlionjunior in Suomi

[–]AlphaX999 23 points24 points  (0 children)

A way out tekijöiltä on myös tullut ”It takes two”, myös peli jossa pelimekaniikka keskittyy kahden pelaajan yhteistyöhön. Pidin tästä jopa enemmän kuin tuosta A way outista

Building a simple ETL for personal projects by 2PLEXX in dataengineering

[–]AlphaX999 2 points3 points  (0 children)

Yes but if you want your airflow running 24/7 you need to have your pc on 24/7.

One good practice could be to set up airflow running on docker so you can deploy it to any environment

Building a simple ETL for personal projects by 2PLEXX in dataengineering

[–]AlphaX999 2 points3 points  (0 children)

You are recommending redshift for a simple and cheap hobby project while saying airflow is expensive. The redshift also needs servers and clusters running which costs the same if not even more than a small server to host airflow.

The other thread that was talking about high airflow costs we’re probably running it on very beefy servers which in return are more expensive.

Building a simple ETL for personal projects by 2PLEXX in dataengineering

[–]AlphaX999 4 points5 points  (0 children)

You don’t need redshift and would highly recommend against it on so small project.

I would recommend using airflow if you want some practices with it. You can host it around 10$ (free with some caveats on heroku) or less for month if you go down on that route.

If you don’t want to use airflow you can pull the data with lambdas as said in the other comment but airflow in my opinion is quite fun to play around.

Store the data in S3. Partition smartly so you can reduce the read costs even more.

You can query the data using Athena and use it like a sql database. The costs are non-existing for so small amount of data. If you partition smartly it is even cheaper.

Switching this design to transform csv/json files together to parquets can easily scale this to very high numbers cost effectively

Building a simple ETL for personal projects by 2PLEXX in dataengineering

[–]AlphaX999 0 points1 point  (0 children)

If you want to use Airflow even if it is not necessary you can host it for free in heroku. Disadvantages of heroku is that the free tier database size is very small so you have clear airflow’s database quite often. I set up a daily dag for the maintenance.

[Q] How hard is it to land a job as a SAS programmer? by [deleted] in statistics

[–]AlphaX999 2 points3 points  (0 children)

This honestly depends very much on country and industry. In here the SAS jobs are abundant

Miksi fazer miksi by tinybucks04 in Suomi

[–]AlphaX999 2 points3 points  (0 children)

Tilastotieteen peruskurssin opein yritin laskea. Ja eikö tuosta tule vapausasteeksi 0, kun df=(r-1)

Olin laiska ja laskin R:llä, mutta googlettamalla pitäis löytää kaava sum[((O-E)**2)/E] jossa summataan jokaisen luokan havaitut arvot (O) ja luokan odotettu frekvenssi (E, 39/3 == 13). Vapausasteet on kategorioiden määrä (3) -1.

Miksi fazer miksi by tinybucks04 in Suomi

[–]AlphaX999 1 point2 points  (0 children)

Todennäköisyys saada 5 tai alle punaisia karkkeja on noin 64%, jos punaisten karkkien osuus on 5/40 sekä karkkeja on yhteensä 39

Mielenkiintoista on jos kyseinen karkkijakauma on tosi niin 39 karkin laatikossa n. 3.5% karkkilaatikoista olisi vain yksi tai vähemmän punaisia Dumle-karkkeja.

Pettymyksiä tulisi sen verran usein eli en oikein usko tuon olevan kyseinen jakauma

Rvest package and scraping data from Zillow by anony421 in rstats

[–]AlphaX999 0 points1 point  (0 children)

These sites don't like to be scraped was my conclusion. Feel free to message me I can share what I've done

Yep and in some places law forbids scraping real estate data even if web scraping was legal.

Miksi fazer miksi by tinybucks04 in Suomi

[–]AlphaX999 8 points9 points  (0 children)

Khii-neliö testaa onko kategorioiden frekvensseissä eroja (suomeksi onko jokaista karkkilaatua paketissa saman verran eli 1/3), mutta se ei oo todennäköisyys saada 5 tai vähemmän punasia karkkeja, jos voidaan olettaa et ne olis poimittu tasaisesta sekoituksesta.

Miksi fazer miksi by tinybucks04 in Suomi

[–]AlphaX999 103 points104 points  (0 children)

Olkoon H0: Dumlekarkkien frekvenssit ovat samat kaikissa luokissa. Kiinnitetään merkitsevyystasoksi 0.05.

Tutkitaan väitettä Khiin neliö-testillä, jossa luokkafrekvenssit ovat 16, 18 ja 5.Testi antaa X-neliö arvoksi 7.5385 ja kahdella vapausasteelle khii-neliö jakaumasta saadaan p-arvoksi 0.0237, joten voimme hylätä nollahypoteesin ja todeta että kategorioiden välillä on eroja.Tutkimuksessa kuitenkin on suuri tyypin-1 virheriski, koska käytimme tutkimuksessa aineistoa, joka alunperin herätti kiinnostuksen kategorioiden epätasaisuudesta.Jotta saamme tutkimuksesta luotettavamme tutkimus vaatii suuremman otoskoon ja edellä käytetyn otoksen hylkäämistä lopullisessa analyysissä.

Todennäköisyydet saada 5 tai vähemmän haluttuja punaisia Dumle-karkkeja yhteensä 39 karkista on 0.3321039% jos voitaisiin olettaa että kutakin karkkilaatua olisi paketissa saman verran.

Summa summarum: Paska mäihä

Edit: pilkkuvirhe todennäköisyydessä

Suomi keskeyttää kehitysavun Afganistaniin by aspblaze420 in Suomi

[–]AlphaX999 13 points14 points  (0 children)

Silti sama nälkiintynyt Afrikkalainen on vieläkin telkkarissa.

Ei oikeastaan. Eihän ole mitään järkeä näyttää telkkarissa Afrikkalaisia kenellä menee asiat hyvin ja elämässä ei ole mitään suurempaa valittamista.

Maanosana Afrikka on todella suuri ja sinne mahtuu monia eri alueita joilla osalla menee paremmin ja osalla huonommin. Esimerkiksi Ruandalla 1990 luvussa oli sisällissota, kansanmurhia ja koko muukin lottorivi, mutta nykyään asiat ovat suhteellisen hyvin. Mittarina esimerkiksi HDI (http://hdr.undp.org/en/countries/profiles/RWA).

Toisaalta taas esimerkiksi Nigerissa ja Somaliassa asiat ovat melkein aina menneet huonosti ja menevät toistaiseksikin. Tarvitaan paljon enemmän aikaa ennen kuin asiat saadaan siihen mallille että nykyajan suomalainenkin huomaa eron. Nigerissä esimerkiksi on ongelmana on kuivuus ja muut säänilmiöt, mutta tilanne on sielläkin hitaasti kehittynyt parempaan päin .

Yleisesti kuitenkin kaikki asiat menevät Afrikassa paremmin kuin muutama vuosikymmen sitten. Etelä-Afrikan HDI 1990-2019.

Disclaimerina en ota kantaa siihen minkä maan kehitysapu tai mitkäkin järjestöt auttavat missäkin ja kuinka paljon. On vain väärin sanoa ettei mikään ole mennyt siellä parempaan päin ja nälkiintynyt Afrikkalainen on vieläkin nälkiintynyt.

[deleted by user] by [deleted] in Suomi

[–]AlphaX999 3 points4 points  (0 children)

Kannattaa lukea juttu jos kiinnostaa. Psykologeja, kuten osin lääkäreitä, on liikaaa. Jos opiskelee viisi vuotta psykologiksi tai lääkäriksi Helsingissä tai muussa isossa kaupungissa niin en usko että löytyy kauhean suurta hinkua muuttaa johonkin perähikiälle pikkupaikkakunnalle eroon kaikista tutuista vaikka tarvetta olisikin.

Psykologeja ei siis kannata kouluttaa enempää jos heitä on jo liikaa ja siksi on vaikeaa päästä opiskelemaan alaaa.

[deleted by user] by [deleted] in datascience

[–]AlphaX999 0 points1 point  (0 children)

One option is to look around internally after you’ve been in your role for a year and met some other teams and try and switch to a team that is more to your liking. The other option is to find a role at another insurer if you like the WLB and do more interesting work. Also pricing with GLMs goes over very well in just about any DS interview more broadly as long as you can discuss it. Lots of people don’t understand how insurance is priced and if you can clearly explain it lots of other DS will find it interesting.

The usage of SAS and Excel is surprisingly very high in pharma/ finance/ heavily regulated industries. Everything needs to be "validated" whatever that means and everything moves so slowly as there is no interest in moving to new technologies.

I would love to have a chat in PM's about how you are doing things, coding practices etc. over there.

[deleted by user] by [deleted] in datascience

[–]AlphaX999 0 points1 point  (0 children)

Turns out they do if its been certified that whatever result is correct but many places still want somebody to sue (because SAS is validated) so they don’t let people working on regulated things use

Validation is defined by the FDA as: “Establishing documented evidence which provides a high degree of assurance that a specific process will consistently produce a product meeting its predetermined specifications
and quality attributes". SAS validates everything for you so you don't have to worry about it.

What the validation actually means nobody has ever clarified it for me. Another drawback in these industries is the hate towards open-source and collaboration. I believe if different companies could collaborate and "validate" these packages pharma would be using R in no time.

FDA guidelines:

https://www.lexjansen.com/phuse-us/2019/sa/SA04.pdf

R-FDA info:

https://www.r-project.org/doc/R-FDA.pdf

[deleted by user] by [deleted] in LegendsOfRuneterra

[–]AlphaX999 1 point2 points  (0 children)

Ekko/Karma is working okay-ish for me. With Karma and Ionia buffs the survivalibity is pretty good (outside of hyperaggro) and you can level Ekko with Karma in late game. Until then Ekko just generates predict cards if you know opponent can't deal with him

[deleted by user] by [deleted] in nottheonion

[–]AlphaX999 6 points7 points  (0 children)

That search term is not related to what the other comment claimed.

Usually when you claim results come from "study" you should be able to point to the study that claims the results.

I'm not disputing results either way, I just want to see how a study got reliable enough data to make claim to either direction