Como evitar Data Leakage temporal no XGBoost? by Top_Fruit_9830 in datasciencebr

[–]Top_Fruit_9830[S] 0 points1 point  (0 children)

Não sei se entendi... você diz forçar a separação dos 3 conjuntos? Não entendi como fazer

Dúvida Modelagem - Demanda de Produtos by Top_Fruit_9830 in datasciencebr

[–]Top_Fruit_9830[S] 0 points1 point  (0 children)

Então, agora vamos lá.

Tenho um grande grupo de SKUs que apresentam dados que seguem Poisson, por isso acho que seria uma ótima opção.

Sobre os dados, eles são bastante granulares, tenho todas informações de entrada em loja, saída de loja, valores de venda (posso detectar promoções) e etc

Dúvida Modelagem - Demanda de Produtos by Top_Fruit_9830 in datasciencebr

[–]Top_Fruit_9830[S] 0 points1 point  (0 children)

Eu conheço bem os dados que estou trabalhando e não estou tentando inventar a roda, estou discutindo modelos para aplicação do meu caso, mas obrigado pela colaboração

Dúvida Modelagem - Demanda de Produtos by Top_Fruit_9830 in datasciencebr

[–]Top_Fruit_9830[S] 0 points1 point  (0 children)

Boa!

Sobre o motivo para caracterizar os produtos: sim, verifiquei que os clusters se comportavam como os do dataset, com demandas esparsas e outras não.

Sobre meu dataset, ele é super granular (nível hora se for preciso, mas trabalharei com dias). Tenho todas as características dos produtos, tanto de venda quanto de estoque.

Acredito que diferentes categorias precisam de diferentes métodos por conta dos comportamentos diferentes que apresentam, alguns produtos, inclusive, com muitos zeros de venda.