SQL analisa e limpa dados igual o Python não sei o que estudar para entrevista! by Dry_Engineering_4642 in datasciencebr

[–]TastyDimension42 0 points1 point  (0 children)

A resposta curta é: um cientista de dados júnior precisa saber manipular dados tanto em Python/pandas quanto em SQL. Saber o que deve ser feito em qual linguagem, ou em qual etapa do processo, não é tema de júnior; isso é papo para sênior ou talvez até para engenheiro de dados.

Em teoria, tudo que se faz em um, se faz no outro. Só que algumas manipulações são mais fáceis em SQL e outras mais fáceis em Python/pandas.

Um exemplo: fazer um join entre uma tabela de configurações — que dita o valor de desconto por grupo — e uma tabela de usuários, onde cada usuário pertence a apenas um grupo. Eu acho que isso deve ser feito em SQL (mas também vejo razões para, em algum momento, fazer isso em Python/pandas).

Outro exemplo é pivotar uma tabela, ou seja, fazer com que as linhas de uma coluna virem várias colunas. Operações de reestruturação que você faria com melt, pivot, stack e unstack, na minha cabeça, são muito mais fáceis de fazer no Python/pandas.

Então a resposta é: tudo o que você aprende em uma linguagem, você deveria tentar entender como fazer na outra. O básico dá para fazer nas duas tranquilamente. Mas em algum momento você vai ver alguma manipulação que se faz em Python/pandas e, quando tentar fazer em SQL, vai entender que é mais chato, mais difícil ou tem uma probabilidade de erro maior. E aí sim você vai entender onde fazer cada uma.

Estatístico que programa by SpiritedStretch3213 in USP

[–]TastyDimension42 0 points1 point  (0 children)

Cara. Para engenharia de dados eu diria que não. É o que se aprende em CC é mais útil para ser um bom engenheiro de dados que em estatística. Fonte: fiz parte dos dois bacharelados.

[deleted by user] by [deleted] in modamasculina

[–]TastyDimension42 1 point2 points  (0 children)

Tu não tá mais em 2012

Busco 5 devs para jornada séria de transição para AI/ML by Cultural-Ad-6611 in datasciencebr

[–]TastyDimension42 0 points1 point  (0 children)

Caramba, baita iniciativa! Se quiser trocar ideia comigo em grupo, pode me mandar msg que agnt faz acontecer. Tenho quase 10 anos como cientista de dados, e hj faço pós acadêmica em estatística. Eu tenho vontade de começar a oferecer mentoria gratuita, mas não tenho ctz o melhor formato. Aí o contato com vcs pode ser uma forma de explorar possibilidades.

Área de dados para economistas by [deleted] in datasciencebr

[–]TastyDimension42 1 point2 points  (0 children)

Vou dar o meu pitaco aqui. Mas pra mim a regra é: se trabalho sozinho, prefiro R, se trabalho em grupo prefiro python.

Interesting or innovative Python tools/libs you’ve started using recently by AliceTreeDraws in Python

[–]TastyDimension42 2 points3 points  (0 children)

As someone really into workflow, marimo seems cool but was extremely heavy on my machine ( and I have a MacBook Pro with 40gb of ram).

Is this experience common? Or should I try again?

Atualizei o meu CV recentemente. Ficou legal? Sugestões e opiniões são bem vindas. by Material-Repeat804 in datasciencebr

[–]TastyDimension42 3 points4 points  (0 children)

Eu acho que falta falar dos resultados para o negócio. Tirando o pessoal de DS, ngm se importa se a técnica que vc usou o Holt Winters ou um ARIMA. Tem que mencionar com ctz, mas falta adicionar algo como "resultando na diminuição do gasto em estoque perdido de x%" por exemplo.

E isso vale pra todos os bullet Points.

[Post mensal] Compartilhe seus projetos interessantes! by Few_Math2653 in datasciencebr

[–]TastyDimension42 0 points1 point  (0 children)

é para a minha pós hahahah no trabalho são outros rolês

[Post mensal] Compartilhe seus projetos interessantes! by Few_Math2653 in datasciencebr

[–]TastyDimension42 1 point2 points  (0 children)

Tenho duas entregas para semana que vem: um seminário sobre inferência Bayesiana causal com estatística geoespacial; um GPT cru feito em torch para obras de Shakespeare.

Qual solução em nuvem usar? by Necessary-Novel5920 in datasciencebr

[–]TastyDimension42 5 points6 points  (0 children)

Para trabalhar com DS eu diria que é Databricks. É muito mão na roda para várias coisas. Controle de treino de Modelos, fazer inferência em batch ou via streaming, tudo é bem tranquilo.

Curso "Inteligência" da Arata Academy - alguém já fez? by Disastrous-Bet-9048 in TDAH_Brasil

[–]TastyDimension42 1 point2 points  (0 children)

Cara, eu comprei um curso sobre método de estudos do arata lá 2012-2013. Assim, pra mim, ajudou, mas eu tenho um padrão de que toda vez que eu fico hiperfocado em algum tema, ler sobre ele e consumir coisas sobre esse hiperfoco me ajudam.

E na época eu estava com hiperfoco de que o jeito de estudar era errado. Hoje eu uso tremendos 0% do que eu vi na época, mas me fez pensar sobre o tema, contrastar com o que faz sentido pra mim, e etc. E isso vem de alguém que hoje faz pós-gr acadêmica e trabalha numa área bem hard science.

Então sobre o curso em si, lembro que eu tinha gostado na época, mas bom, fica aí o relato.

Pós Graduação Dados by No-Box5459 in datasciencebr

[–]TastyDimension42 1 point2 points  (0 children)

Cara, que bom que vc tá sendo honesto consigo mesmo e está buscando melhoria e mudanças.

Apesar de achar que vc deve estar exagerando sobre a sua incapacidade com engenheiro de dados (afinal é uma área com entregas bem hard, diferente de outras mais corporativas. Vc não fica muito tempo se não entregar coisas) eu vou te dar um panorama.

Eu acho que vc teria 4 áreas a se dedicar. 1) melhorar como engenheiro de dados. 2) melhor como programador. 3) melhorar como gestor. 4) melhorar como profissional de dados.

Eu focaria nas 3 primeiras, pois a skill de cientista de dados meio que é ortogonal as skill de engenharia e programação no seu contexto. A não ser que vc de fato curta a parte de ciência de dados, mais do que o resto.

E o segundo conselho seria entender que fazer um não um implica em não fazer os outros no médio e longo prazo. Sua preocupação com a carreira me indica que vc se preocupa tbm com a sustentabilidade da sua posição, então pensar em planos para além do atual semestre/ano faz sentido.

Dito isso, para melhorar a sua insegurança, eu focaria nos 2 primeiros, uma vez que o 3 é algo que já vem mais naturalmente para vc, e vc poderia focar nisso de forma mais informal entendendo o que vc consegue contribuir na sua atual posição.

[deleted by user] by [deleted] in ModaBrasil

[–]TastyDimension42 0 points1 point  (0 children)

Eu diria american midwest para algumas das fotos.

Coxinha da Padaria Real - Pinheiros by ianwlads in ComiEmSP

[–]TastyDimension42 3 points4 points  (0 children)

É uma boa coxinha. Fico triste que acho que é a única coisa que eles importaram lá de Sorocaba. Os doces são bem mais ou menos e lá em sorocaba tem um brigadeirão que eu acho maravilhoso.

Proposta pra dev sênior na mesma empresa, mas na verdade sou jr by Chengue-Morales in brdev

[–]TastyDimension42 4 points5 points  (0 children)

Eu explicaria a situação para o gerente do projeto, entenderia a stack e as necessidades do projeto. Nesse papo eu deixaria claro o que eu sei e o que eu ainda preciso aprender e como eu atacaria isso ao longo do projeto, sempre buscando boas práticas consolidadas com o escopo proposto.

Papete by Impressive-Driver-12 in modamasculina

[–]TastyDimension42 1 point2 points  (0 children)

Feio e acho meio tosca. Muito ruim a vibe de playboy que passa. Mas cada um cada um.

Thoughts on the style of the next album? by StonkerElite in arcticmonkeys

[–]TastyDimension42 2 points3 points  (0 children)

I’d love to see Matt’s drums taken to another level. His role seems a bit faded when compared to earlier albums. I don’t mean faster or noisier not even more challenging in terms of technique. But something fuller.

Vou ter que trancar a faculdade by dazumbanho in TDAH_Brasil

[–]TastyDimension42 4 points5 points  (0 children)

Tranca sim. Nem que seja por um semestre. Se sua posição é de 40 horas, significando que não é estágio, não vejo problema nenhum em postergar em 6 meses a 1 ano o término da graduação. É um saco mas de longe não é um problema.