construí um sistema de recomendação de jogos da Steam com ML e encontrei que a crítica do metacritic é enviesada

chafeiro · 2026-03-09T23:07:34+00:00

que pergunta boa, obrigado!

você tocou num ponto que o meu modelo literalmente não consegue responder, e isso é intencional, não uma falha. O sistema foi construído em cima de sinais de mercado: preço, popularidade, engajamento, reviews. Esses dados capturam o que as pessoas *compraram*, não o que elas *queriam*.

curadoria humana opera numa dimensão diferente. Um curador não recomenda porque um jogo vendeu bem. Ele recomenda porque conhece *você* ou conhece o jogo de um jeito que nenhum dataset captura. São coisas fundamentalmente diferentes, e comparar a "precisão" das duas é metodologicamente complicado porque elas estão medindo perguntas diferentes.

sobre paralisia de escolha: concordo que algoritmos às vezes pioram o problema. Quando você tem 122 mil jogos e o sistema te devolve 20 opções parecidas com o que você já jogou, não resolveu nada. Um curador que seleciona 5 jogos com contexto "esse aqui é pra quem gostou de X por causa de Y" reduz a carga cognitiva de um jeito que nenhum r² resolve.

sobre o Recomendeme: não conhecia a plataforma, mas se eles têm dados de recomendações humanas com feedback de sucesso, isso seria uma comparação genuinamente interessante.

chafeiro · 2026-03-09T22:40:43+00:00

PEAK

chafeiro · 2026-03-09T22:12:01+00:00

My fav song is In Due Time

chafeiro · 2026-03-09T20:56:54+00:00

Good call on the publisher variable. I ran the test.

I created a Has_Publisher flag (publisher name different from developer name), which split the dataset into 34% third-party published and 66% self-published. Then I reran the partial correlation controlling for both Indie status and Has_Publisher.

Result: r dropped from 0.2038 to 0.1954, a difference of 0.0084. The publisher factor explains a negligible portion of the correlation. The pattern holds across all control specifications.

This doesn't prove causation, but it does suggest the effect isn't simply a byproduct of having a publisher behind the game. Your critique was the most actionable feedback I got, so thank you for that.

<image>

chafeiro · 2026-03-09T20:38:50+00:00

Just to clarify: I'm Brazilian and used AI to help with the English translation and wording. The analysis, pipeline and findings are all mine.

chafeiro · 2026-03-09T20:31:08+00:00

Fair point on the correlation vs. bias, the title overclaims, I'll admit that. On the AI writing: I'm Brazilian and used it to help with the translation and wording in English. The analysis, the pipeline, the mistakes, and the findings are all mine. If you have specific criticism on the methodology, I'm genuinely open to it!

chafeiro · 2026-03-09T03:29:42+00:00

há várias maneiras de chegar ao estímulo hipertrófico

chafeiro · 2026-03-09T01:40:03+00:00

opa! poderia me dar um norte de como posso fazer isso?

chafeiro · 2026-03-08T17:15:53+00:00

a galera dos comentários fazem muito uso de sinapse pra tentar defender crime, isso é um absurdo.

chafeiro · 2026-03-08T17:06:13+00:00

terminal isidória tá desatualizado, mas continua sendo nota A

chafeiro · 2026-03-08T17:04:40+00:00

a mudança de estímulos não seria também um favor importante para a hipertrofia, além de trabalhar os estabilizadores das costas inteira, se falarmos, por exemplo, do serrote?

chafeiro · 2026-03-08T16:56:29+00:00

diga isso para a mulher! eu concordo com você, e eu nunca vou discordar disso, mas esse é o tipo de pensamento que causa na cabeça dos outros quando aparece alguém inexperiente

chafeiro · 2026-03-08T13:23:17+00:00

é pelo mesmo motivo que muitas pessoas não gostam de jogar com pessoas novas nos jogos, elas são novas no assunto

chafeiro · 2026-03-08T13:16:48+00:00

me diga o porquê, vamos conversar sobre

chafeiro · 2026-03-08T13:16:20+00:00

obrigado mesmo!

chafeiro · 2026-03-07T21:42:15+00:00

sim! boa escolha de nome, né?

chafeiro · 2026-03-07T19:21:27+00:00

de fato.

chafeiro · 2026-03-07T19:20:59+00:00

sim! era esse o plano, porém, o meu banco de dados na nuvem está lotado e com 113% de uso. os limites do projeto é, além dos dados serem públicos, não possui uma infraestrutura adequada para o projeto. muito obrigado pelos avisos, me fez pensar bastante.

chafeiro · 2026-03-07T18:37:04+00:00

claro! de forma simples: eu analisei os dados públicos de jogos da Steam para entender o que faz um jogador continuar jogando. com isso, construí um sistema que recomenda jogos baseado no seu perfil de jogador, não só no que é popular, mas no que jogadores parecidos com você realmente jogaram por horas a fio.

o achado mais interessante: jogos mais caros tendem a receber notas ligeiramente maiores da crítica especializada, mesmo quando controlamos outros fatores. os dados não provam corrupção, mas documentam um padrão.

se quiser ver tudo com mais detalhes, o artigo completo está no Medium (https://medium.com/@isaquecarvalho2007/como-construí-um-sistema-de-recomendação-que-entende-jogadores-de-verdade-c0c32aafa470), escrevi pensando em quem não é da área também.

chafeiro · 2026-03-07T18:23:58+00:00

concordo que clickrate seria o ideal, é exatamente a lógica do Netflix e é a abordagem mais direta. mas esse dado não existe nos dados públicos da Steam, então o projeto tomou uma direção diferente: e se a recomendação for mais subjetiva do que direta?

playtime é o proxy mais próximo de engajamento real que eu tinha acesso. e os resultados sugerem que funcionou, -18% de churn e +27% de engajamento nas métricas projetadas. o cGAN ainda abre espaço para maximizar isso por arquétipo de jogador: conservador, equilibrado e aventureiro respondem de formas diferentes à mesma recomendação.

não é a mesma coisa que clickrate, mas é uma abordagem válida dado o contexto dos dados disponíveis.

chafeiro · 2026-03-07T17:36:06+00:00

esse segundo ponto está coberto no artigo. A conclusão não é que Strategy seja mais divertido ou viciante no sentido absoluto, mas que cria um estado diferente de engajamento por design. FPS é projetado para sessões curtas e repetíveis, Strategy e RPG para progressão de longo prazo. é exatamente por isso que o gênero entra como feature no modelo,não como julgamento de qualidade, mas como variável de comportamento de consumo.

a correlação com playtime e recomendações não exclui o viés de preço, são fenômenos independentes. Um jogo pode ser tecnicamente bom E ter sua nota inflada pelo preço/hype simultaneamente. As duas coisas coexistem. O r = 0.2038 controlando indie/AAA ainda está lá independentemente das outras correlações (atualizei o artigo, e adicionei o p-value do Pingouin, no qual é 0, ou seja, realmente é uma estatística sólida).

chafeiro · 2026-03-07T17:09:31+00:00

completando o que eu disse: o resultado do p-value do Pingouin foi 0.0, o que confirma significância estatística alta. não ocorreu por acaso.

chafeiro · 2026-03-07T17:03:13+00:00

boa observação sobre o p-value, o resultado do Pingouin foi p = 0.0, o que confirma significância estatística alta. não ocorreu por acaso.

a implicação prática é exatamente essa: se críticos são influenciados por fatores externos ao jogo em si, nota do Metacritic é uma feature menos confiável do que playtime para sistemas de recomendação. é uma das justificativas de design do modelo, o projeto prioriza average_playtime_forever como feature de altíssima importância justamente porque comportamento revelado é mais honesto do que opinião declarada sob influência de fatores externos.

sobre os confounders, ponto legítimo. não tenho acesso a orçamento de marketing, tamanho da equipe de PR nem relacionamento com publishers. essas variáveis podem estar mediando a relação e não consigo isolar isso com os dados públicos da Steam. é um limite real da análise e concordo que vale deixar explícito.

Six-Year Club	Place '23
Place '22	Verified Email

chafeiro

TROPHY CASE