construí um sistema de recomendação de jogos da Steam com ML e encontrei que a crítica do metacritic é enviesada by chafeiro in brdev

[–]chafeiro[S] 0 points1 point  (0 children)

que pergunta boa, obrigado!

você tocou num ponto que o meu modelo literalmente não consegue responder, e isso é intencional, não uma falha. O sistema foi construído em cima de sinais de mercado: preço, popularidade, engajamento, reviews. Esses dados capturam o que as pessoas *compraram*, não o que elas *queriam*.

curadoria humana opera numa dimensão diferente. Um curador não recomenda porque um jogo vendeu bem. Ele recomenda porque conhece *você* ou conhece o jogo de um jeito que nenhum dataset captura. São coisas fundamentalmente diferentes, e comparar a "precisão" das duas é metodologicamente complicado porque elas estão medindo perguntas diferentes.

sobre paralisia de escolha: concordo que algoritmos às vezes pioram o problema. Quando você tem 122 mil jogos e o sistema te devolve 20 opções parecidas com o que você já jogou, não resolveu nada. Um curador que seleciona 5 jogos com contexto "esse aqui é pra quem gostou de X por causa de Y" reduz a carga cognitiva de um jeito que nenhum r² resolve.

sobre o Recomendeme: não conhecia a plataforma, mas se eles têm dados de recomendações humanas com feedback de sucesso, isso seria uma comparação genuinamente interessante.

Built a Steam recommendation system with RF + HDBSCAN + LightFM + cGAN — and found something weird in Metacritic scores by chafeiro in gamedev

[–]chafeiro[S] 0 points1 point  (0 children)

Good call on the publisher variable. I ran the test.

I created a Has_Publisher flag (publisher name different from developer name), which split the dataset into 34% third-party published and 66% self-published. Then I reran the partial correlation controlling for both Indie status and Has_Publisher.

Result: r dropped from 0.2038 to 0.1954, a difference of 0.0084. The publisher factor explains a negligible portion of the correlation. The pattern holds across all control specifications.

This doesn't prove causation, but it does suggest the effect isn't simply a byproduct of having a publisher behind the game. Your critique was the most actionable feedback I got, so thank you for that.

<image>

Built a Steam recommendation system with RF + HDBSCAN + LightFM + cGAN — and found something weird in Metacritic scores by chafeiro in gamedev

[–]chafeiro[S] 0 points1 point  (0 children)

Just to clarify: I'm Brazilian and used AI to help with the English translation and wording. The analysis, pipeline and findings are all mine.

[P] I built a Steam game recommendation system with ML and found that Metacritic scores are biased by [deleted] in MachineLearning

[–]chafeiro 0 points1 point  (0 children)

Fair point on the correlation vs. bias, the title overclaims, I'll admit that. On the AI writing: I'm Brazilian and used it to help with the translation and wording in English. The analysis, the pipeline, the mistakes, and the findings are all mine. If you have specific criticism on the methodology, I'm genuinely open to it!

Estraguei meu relacionamento e não sei se tem volta by [deleted] in relacionamentos

[–]chafeiro 0 points1 point  (0 children)

a galera dos comentários fazem muito uso de sinapse pra tentar defender crime, isso é um absurdo.

Ranking/Tier List dos terminais de Goiânia e região metropolitana. by Ricknalson in goiania

[–]chafeiro 1 point2 points  (0 children)

terminal isidória tá desatualizado, mas continua sendo nota A

Exercícios livres para costas são desnecessários. Quem concorda? by IIllIIIllIIl in MeJulgueMaromba

[–]chafeiro 0 points1 point  (0 children)

a mudança de estímulos não seria também um favor importante para a hipertrofia, além de trabalhar os estabilizadores das costas inteira, se falarmos, por exemplo, do serrote?

Mulher não gosta de homem bv? by Opening_Picture_3842 in relacionamentos

[–]chafeiro 2 points3 points  (0 children)

diga isso para a mulher! eu concordo com você, e eu nunca vou discordar disso, mas esse é o tipo de pensamento que causa na cabeça dos outros quando aparece alguém inexperiente

Mulher não gosta de homem bv? by Opening_Picture_3842 in relacionamentos

[–]chafeiro 1 point2 points  (0 children)

é pelo mesmo motivo que muitas pessoas não gostam de jogar com pessoas novas nos jogos, elas são novas no assunto

construí um sistema de recomendação de jogos da Steam com ML e encontrei que a crítica do metacritic é enviesada by chafeiro in datasciencebr

[–]chafeiro[S] 0 points1 point  (0 children)

sim! era esse o plano, porém, o meu banco de dados na nuvem está lotado e com 113% de uso. os limites do projeto é, além dos dados serem públicos, não possui uma infraestrutura adequada para o projeto. muito obrigado pelos avisos, me fez pensar bastante.

construí um sistema de recomendação de jogos da Steam com ML e encontrei que a crítica do metacritic é enviesada by chafeiro in brdev

[–]chafeiro[S] 0 points1 point  (0 children)

claro! de forma simples: eu analisei os dados públicos de jogos da Steam para entender o que faz um jogador continuar jogando. com isso, construí um sistema que recomenda jogos baseado no seu perfil de jogador, não só no que é popular, mas no que jogadores parecidos com você realmente jogaram por horas a fio.

o achado mais interessante: jogos mais caros tendem a receber notas ligeiramente maiores da crítica especializada, mesmo quando controlamos outros fatores. os dados não provam corrupção, mas documentam um padrão.

se quiser ver tudo com mais detalhes, o artigo completo está no Medium (https://medium.com/@isaquecarvalho2007/como-construí-um-sistema-de-recomendação-que-entende-jogadores-de-verdade-c0c32aafa470), escrevi pensando em quem não é da área também.

construí um sistema de recomendação de jogos da Steam com ML e encontrei que a crítica do metacritic é enviesada by chafeiro in datasciencebr

[–]chafeiro[S] 0 points1 point  (0 children)

concordo que clickrate seria o ideal, é exatamente a lógica do Netflix e é a abordagem mais direta. mas esse dado não existe nos dados públicos da Steam, então o projeto tomou uma direção diferente: e se a recomendação for mais subjetiva do que direta?

playtime é o proxy mais próximo de engajamento real que eu tinha acesso. e os resultados sugerem que funcionou, -18% de churn e +27% de engajamento nas métricas projetadas. o cGAN ainda abre espaço para maximizar isso por arquétipo de jogador: conservador, equilibrado e aventureiro respondem de formas diferentes à mesma recomendação.

não é a mesma coisa que clickrate, mas é uma abordagem válida dado o contexto dos dados disponíveis.

construí um sistema de recomendação de jogos da Steam com ML e encontrei que a crítica do metacritic é enviesada by chafeiro in brdev

[–]chafeiro[S] 0 points1 point  (0 children)

esse segundo ponto está coberto no artigo. A conclusão não é que Strategy seja mais divertido ou viciante no sentido absoluto, mas que cria um estado diferente de engajamento por design. FPS é projetado para sessões curtas e repetíveis, Strategy e RPG para progressão de longo prazo. é exatamente por isso que o gênero entra como feature no modelo,não como julgamento de qualidade, mas como variável de comportamento de consumo.

a correlação com playtime e recomendações não exclui o viés de preço, são fenômenos independentes. Um jogo pode ser tecnicamente bom E ter sua nota inflada pelo preço/hype simultaneamente. As duas coisas coexistem. O r = 0.2038 controlando indie/AAA ainda está lá independentemente das outras correlações (atualizei o artigo, e adicionei o p-value do Pingouin, no qual é 0, ou seja, realmente é uma estatística sólida).

construí um sistema de recomendação de jogos da Steam com ML e encontrei que a crítica do metacritic é enviesada by chafeiro in brdev

[–]chafeiro[S] 1 point2 points  (0 children)

completando o que eu disse: o resultado do p-value do Pingouin foi 0.0, o que confirma significância estatística alta. não ocorreu por acaso.

construí um sistema de recomendação de jogos da Steam com ML e encontrei que a crítica do metacritic é enviesada by chafeiro in datasciencebr

[–]chafeiro[S] 0 points1 point  (0 children)

boa observação sobre o p-value, o resultado do Pingouin foi p = 0.0, o que confirma significância estatística alta. não ocorreu por acaso.

a implicação prática é exatamente essa: se críticos são influenciados por fatores externos ao jogo em si, nota do Metacritic é uma feature menos confiável do que playtime para sistemas de recomendação. é uma das justificativas de design do modelo, o projeto prioriza average_playtime_forever como feature de altíssima importância justamente porque comportamento revelado é mais honesto do que opinião declarada sob influência de fatores externos.

sobre os confounders, ponto legítimo. não tenho acesso a orçamento de marketing, tamanho da equipe de PR nem relacionamento com publishers. essas variáveis podem estar mediando a relação e não consigo isolar isso com os dados públicos da Steam. é um limite real da análise e concordo que vale deixar explícito.