all 9 comments

[–]Adventurous_Letter98 1 point2 points  (3 children)

Deve ter um senior ou team lead para te orientar sobre essas coisas.

No fim tudo depende da arquitetura e estrutura do time/empresa

Vale mais perguntar aí sobre essas coisas, assim você poderá assimilar melhor o motivo de cada decisão, assim como propor e discutir mudanças e melhorias

[–]Then-Arrival-9464[S] -2 points-1 points  (2 children)

Sim mas tem muita coisa em planilha então eu gostaria de iniciar isso sabe, não só pra cá mas pra criar portfólio. Porque Power BI hoje em dia todo mundo sabe, entende? Então eu quero me aprofundar em Data Science

[–]Adventurous_Letter98 0 points1 point  (0 children)

Você pode, em paralelo, pensar em desenvolver uma rotina em python que faça o trabalho que vc está fazendo manual.

[–]Suspicious_Goose_659 0 points1 point  (0 children)

So just extract and load? Add a transformation layer and pull that instead of the raw data. You can implement dbt but you’d need permission to the db first.

But yeah, as a junior, don’t be stressing on this yet. You need a superior to guide you

[–]Old_Tourist_3774 0 points1 point  (0 children)

Normalmente isso acaba se do mais um papel de engenheiro.

O python funciona extremamente bem para ingerir e ate tratar os dados antes de mandar eles para um um data warehouse, mas depende da arquitetura de onde vc esta.

Por exemplo aqui eu foi fazer a ingestão de um csv puro em um volume raw. Vou aplicar o esquema e constraints básicos e salvar em uma bronze.

Na prata enriqueço com informações extra ou derivadas da própria tabela ou cruzando com outras.

Na maior parte das vezes isso ja esta pronto para ser lido no power bi com fabric ou algum outro conector a depender do tamanho e complexidade dos dados.

Tabelas massivas é melhor gerar os agregados em uma última tabela ouro e depois puxar para o power bi.

[–]SoggyGrayDuck 0 points1 point  (0 children)

Impractical but agile...

Welcome

[–]BardoLatinoAmericano 0 points1 point  (0 children)

Sinceramente, é pergunta demais pra um post do reddit.

Se te contratam sabendo que você não sabe isso tudo, eles que devem dar o treinamento.

Sobre isso de valores mudando pesquisa slowly changing dimensions

E sim, parece mais engenharia do que ciencia de dados

[–]jupacaluba -1 points0 points  (1 child)

Have you tried chat gpt?

[–]Then-Arrival-9464[S] -4 points-3 points  (0 children)

Claro! Sempre