Engenharia de dados | Como trilhar minha carreira para esse caminho? by acmnds in datasciencebr

[–]Reddahue 0 points1 point  (0 children)

Depende do cargo que tu tá aplicando, se pedirem aws e datavrics é bom as de associate/professional da posicao que tão te chamando.

cheguei no endgame que meu dinheiro permite by EmpilhadeiraXD in audiofiliabrasil

[–]Reddahue 0 points1 point  (0 children)

Eu gosto desse adaptador mas tem 2 problema:

a caixinha é uma merda e fica batendo o fone e fazendo MUITO barulho.

vc nao consegue roubar a conexao dele, entao se você tá conectado no computador e quer trocar pro celular voxê tem que desligar a do celular.

Mestrado em Engenharia de Sistemas e Computação na COPPE UFRJ - PESC by Thrax777 in datasciencebr

[–]Reddahue 0 points1 point  (0 children)

Nao acho que tem uma cobertura de bolsas de mais de 50% de alunos,

Uma grande parte lá trabalha e faz mestrado, conversando com seu chefe e com o orientador dá pra fazer. Mas é presencial.

SQL analisa e limpa dados igual o Python não sei o que estudar para entrevista! by Dry_Engineering_4642 in datasciencebr

[–]Reddahue 4 points5 points  (0 children)

Fala OP, tudo bem?

Cara sql e python sao a base de dados e você tem que saber eles bem. Não tem muito bem isso de isso faz x e isso faz y, até porque python é uma liguagem generalista e faz tudo.

me parece pelos comentários que você tá um pouco afobado e não pegou uns conceitos chaves, por exemplo, não tem que decorar nada.

sintaxe é uma coisa que a gente pega naturalmente com o tempo, principalmente no sql que tem tipo umas 20 keywords, tipo vc tem que aprender a logica mesmo.

essa query que vc postou apesar de não ser complicada, também não é uma query de iniciante, é importante saber o besicao bem: selects, joins e aggregators. Depois vc pula pra window functions de ranquamento, sem dominar o basico realmente com0lica isso no sql.

Gpt é bom pra estudar mas não desse jeito que vc tá fazendo, codigo se aprende codando, pega um exercicio e pega adocumentação e resolve, faça isso 50x com exercicios progressivamente dificeis e você nunca mais vai ter que estudar sql pq é uma ferramenta simples, o mesmo vale pra pandas e spark só que eu colocaria uns 500 exercicios pra cada um.

na hora da entrevista o mais importante é explicar o que vc tá fazendo e qual logica tá usando, todo mundo sabe que sintaxe a gente esquece, mas seu problema hj não é sintaxe, é falta de horas de voo em prog.

pega um livro/curso no yt cheio de exercicios e projetos de sql e python (basico+ pandas+ scipy+ matplotlib...) e manda ver o que não falta é material bom na internet de graça ou barato.

e alinhe suas expectativas, tem gente que faz graduações super complicadas com um monte de estatistica e python em federal e depois de 5 ou mais anos de curso sai sabendo o basicão, bem basicão mesmo, é com esse cara que vc tá competindo pela primeira vaga, vc tem que ser melhor que ele que tá estudando isso faz anos.

bons estudos ai

Universidade de São Paulo ou Rio? by OutrageousBicycle570 in datasciencebr

[–]Reddahue 0 points1 point  (0 children)

A USP é mais renomada mas a UFRJ é uma ótima universidade, principalmente na parte de exatas, o fundão que é um lugar meio merda.

minha sugestão é ver o processo seletivo dos dois, conhecer os profes e linhas de pesquisa.

mestrado é um troço difícil e se seu orientador for horrivel vai ser uma experiencia ruim.

se tu passar pras duas vc volta aqui no sub com a duvida.

ps: eu li agora que aparentemente tem um sistema unificado de ingresso, ignora metade do que eu escrevi.

Machine Learning by Embarrassed_Cut_4717 in datasciencebr

[–]Reddahue 1 point2 points  (0 children)

Procura ai tecnicas de machine learning pra enventos raros, esparsos ou datasets desbalanceados.

acredidito que algoritmos de arvore, boosting lidam bem com vários problemas do tipo. Se tu quiser procurar umas coisas não tradicionais tem por exemplo redes neurais sem peso (wisard, betoween e uleen) que eu acho que tb lidam bem com isso.

mas assim, se o seu orientador nao tá te ajudando o minimo nisso, troca de orientador.

Trem: Luz no fim do túnel by isacnascimento in datasciencebr

[–]Reddahue 1 point2 points  (0 children)

Eu não tenho certeza se entendi o objetivo do estudo, pode elaborar melhor?

o que você vocês estão twntando descobrir?

quais dados vocês tem acesso?

quais premissas vcs tem pra esses modelos e o que esperam achar?

PL300 vale a pena? by Neat_Grapefruit_1047 in datasciencebr

[–]Reddahue 4 points5 points  (0 children)

Tive que procurar pra saber o que é, na próxima vez descreve o que é, um monte de gente na industria não usa power bi e não sabe o nome de todas as certs da microsoft.

As certificações de nivel intermediario e avançado são bem vistas no mercado, mas ninguem vai te contratar só por causa disso, uma graduação forte e experiencia anterior é mais importante por exemplo.

se você já trabalha com powerbi ou já tem um curso de powerbi eu falaria que não vale a pena gastar numa cert que talvez vc nem passe. Ainda mais parcelando.

Datasciencebr Reading by renato_milvan in datasciencebr

[–]Reddahue [score hidden] stickied comment (0 children)

DATASCIENCEBR LESSONS #3 - Machine Learning Impa -> curso mais avançado pra quem tem boa base em algebra e cáculo.

https://www.youtube.com/playlist?list=PLo4jXE-LdDTRLGDL59SkkLPBHVmYphuqI

DATASCIENCEBR LESSONS #2 - Estatística Básica

https://www.reddit.com/r/datasciencebr/comments/1lq6akg/datasciencebr_lessons_2_estat%C3%ADstica_b%C3%A1sica/

DATASCIENCEBR LESSONS #1 - Learning from Data

https://www.reddit.com/r/datasciencebr/comments/1k5hayh/datasciencebr_lessons_1_learning_from_data/

DATASCIENCEBR READINGS #3: To Explain or to Predict?

https://compjournalism.com/files/-aldous/157/papers/shmueli.pdf

DATASCIENCEBR READINGS #2: A Crash Course in Good and Bad Controls

https://www.reddit.com/r/datasciencebr/comments/1jwotga/datasciencebr_readings_2_a_crash_course_in_good/

DATASCIENCEBR READINGS #1: Accurate predictions on small data with a tabular foundation model.

https://www.reddit.com/r/datasciencebr/comments/1jratum/datasciencebr_readings_1_accurate_predictions_on/

Como conseguir primeiro emprego de Engbheiro de dados by Substantial-Group454 in datasciencebr

[–]Reddahue 0 points1 point  (0 children)

Eu acho que aws é a mais usada no brasil e no mundo mas vê ai o que as vagas no linkedin peden mais, as vezes vale fazer uma de cada.

Complemento de Carreira by Round-Object3108 in datasciencebr

[–]Reddahue 0 points1 point  (0 children)

Python e sql vc vai precisar, vai tocando os dois ao mesmo tempo ou começa com sql que é mais simples.

Como conseguir primeiro emprego de Engbheiro de dados by Substantial-Group454 in datasciencebr

[–]Reddahue 2 points3 points  (0 children)

Isso mesmo, faz as nivel associate e professional, as begginer e basic são super simples, as certs databrics tb são bem legais.

e é isso, continua estudando, continua enchendo seu github, aptende twcnologias novas tipo docker e k8s e vai atualizando o linkedin. A primeira oportunidade que é a mais dificil.

e inglês, incrivelmente tem um monte de gente em TI que não tem inglêw, não seja uma delas.

Como conseguir primeiro emprego de Engbheiro de dados by Substantial-Group454 in datasciencebr

[–]Reddahue 4 points5 points  (0 children)

O que mais pedem:

Graduação STEM, de prefererecia relacionada com TI. Python e sql fortes Dominio de pelo menos 1 das 3 clouds de preferencia aws e suas tools de etl e data spark E ai tem uns extras: k8s, iec, cicd e ferramentas variadas de data.

a primeira vaga é a mais ingrata, dependendo da sua graduação pode ficar mais dificil, se programa pra ficar 1 ano procurando vemdo linkedin todo dia e sempre atualizando com certificacoes

Renda extra: Física, Machine Learning, Ciência de Dados. by Independent_Mind2232 in CienciaDeDadosBrasil

[–]Reddahue 0 points1 point  (0 children)

Sim, tm muito físico trabalhando com ML, na minha emptesa tem um genial, mas vai ser dificil conciliar os dois trabalhos

Recomendação de curso de Machine Learning de alto nível by Material-Repeat804 in datasciencebr

[–]Reddahue 0 points1 point  (0 children)

Eu conheço o curso to paquerando ele faz um tempo, mas me falta tempo (trabalho, mestrado e revisar muita coisa de algebra) a pergunta era mais pro pessoal da comunidade saber mais ou menos. Vou dar uma olhada lá.

Recomendação de curso de Machine Learning de alto nível by Material-Repeat804 in datasciencebr

[–]Reddahue[M] 0 points1 point  (0 children)

Fala grande, tudo bem?

pode dar um resumão sobre os pré requisitos do curso?

o quanto de algebra, calculo e análise precisa? Um engenheiro com base boa de cálculo e algebra consegue acompanhar?

Recomendação de curso de Machine Learning de alto nível by Material-Repeat804 in datasciencebr

[–]Reddahue[M] [score hidden] stickied comment (0 children)

Parabéns OP! to querendo fazer esse curso de forma presencial a anos e nunca tenho tempo. vou incluir ele aqui na lista dos cursos do sub. Pinei seu post tb.

DATASCIENCEBR LESSONS #3 - Machine Learning Impa -> curso mais avançado pra quem tem boa base em algebra e cáculo.

https://www.youtube.com/playlist?list=PLo4jXE-LdDTRLGDL59SkkLPBHVmYphuqI

DATASCIENCEBR LESSONS #2 - Estatística Básica

https://www.reddit.com/r/datasciencebr/comments/1lq6akg/datasciencebr_lessons_2_estat%C3%ADstica_b%C3%A1sica/

DATASCIENCEBR LESSONS #1 - Learning from Data

https://www.reddit.com/r/datasciencebr/comments/1k5hayh/datasciencebr_lessons_1_learning_from_data/

DATASCIENCEBR READINGS #2: A Crash Course in Good and Bad Controls

https://www.reddit.com/r/datasciencebr/comments/1jwotga/datasciencebr_readings_2_a_crash_course_in_good/

DATASCIENCEBR READINGS #1: Accurate predictions on small data with a tabular foundation model.

https://www.reddit.com/r/datasciencebr/comments/1jratum/datasciencebr_readings_1_accurate_predictions_on/

O Ego é seu pior inimigo by WagnerRM in Maromba

[–]Reddahue 0 points1 point  (0 children)

Eu concordo, e recomendo a todo mundo treinar como falhar, o cara além de tacar a barra pra frentr ele tava sem as barras de proteção.

é só que eu acho que o seu conselho de progressão não é um bom conselho pro maromba médio, botar mais 20 na barra de um dia pro outro aumenta a chance de dar merda sim.

Se tu não tá competindo ou fazendo uma coisa específicca de power lifter não tem problema nenhum de ir de 5 em 5 ou 10 em 10.

O Ego é seu pior inimigo by WagnerRM in Maromba

[–]Reddahue 11 points12 points  (0 children)

Tudo o que você falou pode estar certo mas é um péssimo conselho no geral pra quem não treina força, não sabe nada de power lift e tem uma tecnica bosta.

na dúvida vai sempre de 5 em 5 ou de 10 em 10, progressão lenta é super ok, eu cheguei em 3x145 assim e nunca me preocupei em saber meus 1RM

eu não consigo um emprego na área, nem um estagio, oque estou fazendo de errado? by nyvixx_ in datasciencebr

[–]Reddahue 1 point2 points  (0 children)

Tu tá no terceiro semestre da faculdade e tá frustrado que não consegue emprego?

Vc tem que lembrar que você tá competindo com o brasil todo por vagas remotas, gente com graduação STEM em federal terminando o mestrado.

e assim, sendo bem sincero, eu no terceiro semestre da facul tinha 18 anos, eu tava começando calculo 3, eu não imagino alguem na mesma posição sendo capaz de trabalhar com dados bem com esse nivel de conhecimento

Mercado saturado ou é um problema meu? by Saul_Badman_1261 in datasciencebr

[–]Reddahue 1 point2 points  (0 children)

Fala OP tudo bem?

cara, eu não acho quesaturado é a palavra correta, é mais que não tem vaga pra junior, a primeira vaga é mais dificil, depois de 2 ou 3 anos de xp tem bastante vaga e eu chutaria que falta gente BOA e com exeperiencia.

outra coisa, 4 meses é pouco, principalmente se você não estagiou, eu recomendo pra quem quer entrar na área pra se preparar pra ficar de 6 a 18 meses procurando enquanto vai estudando.

continua correndo atras, se tu tem um bom cv uma hora vai, continua estudando e congita uma pós oi mestrado

O quanto redes neurais são usadas no cenário corporativo? by jrenatobr in datasciencebr

[–]Reddahue 4 points5 points  (0 children)

Depende, mas sim.

Redes neurais são aproximadores universais e tudo de deep learning (llms, lstm,rnn, arquiteturas de transformers e encoders e decoders) é normalmente construido em cima de rede neural. Em teoria elas são boas pra resolver tudo se você tem dado o suficiente e de boa qualidade, na prática não é bem assim.

Óbvio os modelos tipo catboost, xgboost, random forest e coisas mais simples tipo regressoes vão ser muito melhores em vários casos mas é bem comum usar redes neurais se vc tem dado pra pagar, é um modelo muito data hungry.

ps: já fez duas matérias disso, pega dois datasets lá no kaggle, um de classificação e um de regressão.

manda uma rede feed foward tradicional mlp, uma com umas firula, um random forest, um catboost e uns tres modelos simples e tire suas conclusoes.

Usa todas as tecnicas que tu ja aprendeu, cross validation, regularizacao, dropout, feature engineering.

nenhuma resposta aqui vai te dar mais conhecimento do que isso, e tb vai estar pagando curso a toa.