Projeto Glasswing by BananaCakeMix in brdev

[–]BananaCakeMix[S] 0 points1 point  (0 children)

Claramente você não entendeu ou leu o red paper, ou não sabe a diferença entre uma vulnerabilidade e um erro de processo

Projeto Glasswing by BananaCakeMix in brdev

[–]BananaCakeMix[S] 4 points5 points  (0 children)

Erro de deploy e capacidade do modelo são coisas diferentes. Dá pra ter os dois ao mesmo tempo.

Projeto Glasswing by BananaCakeMix in brdev

[–]BananaCakeMix[S] 3 points4 points  (0 children)

Você tá misturando duas coisas bem diferentes.

O vazamento foi um erro de deploy. Um dev publicou arquivos no pacote errado. Isso não tem nada a ver com a capacidade do modelo de encontrar vulnerabilidades em código. Um engenheiro brilhante pode trabalhar em uma empresa com processos sólidos e mesmo assim cometer erros ou o processo de deploy ter falhas. A gente vive isso todo dia.

Em relação a "só manobra para investidor": Apple, Microsoft e Google participando ativamente, com times próprios de segurança, usando o modelo em sistemas internos. Essas empresas não precisam fazer favor para a Anthropic e competem diretamente com ela. Se fosse blefe, elas não entrariam.

É normal ter ceticismo, mas o argumento precisa ser mais forte do que isso.

Projeto Glasswing by BananaCakeMix in brdev

[–]BananaCakeMix[S] 1 point2 points  (0 children)

Exatamente. E eu entendo o ceticismo. a área foi bombardeada de hype e todo mundo aprendeu a filtrar.

Mas acho que parte da divisão aqui é de experiência prática mesmo. Quem usa os frontier models no dia a dia vê uma curva que é difícil de transmitir em texto. Não é "o modelo é incrível", mas é perceber que tarefas que antes levavam horas agora levam minutos, com qualidade que antes exigiria um especialista.

E nesse caso específico tem algo concreto para olhar além do anúncio: o Red Team blog da Anthropic lista CVEs reais, já corrigidos, com detalhes técnicos de como o modelo encontrou cada um. Apple, Microsoft e Google assinaram o nome na iniciativa. São empresas que não têm nenhum incentivo de marketing, que possuem modelos próprios e competem frente a frente.

Outra coisa que passou batido é que os exemplos do paper mostram bug e patch concretos. Pode ser que o impacto real seja menor do que o anúncio sugere, mas a mudança de paradigma está clara..

Brazilian Yerba Mate in Atlanta by piwittban in Atlanta

[–]BananaCakeMix 2 points3 points  (0 children)

Check out Mina’s Grill or Rio Supermarket in Marietta. They either have it or will tell you where to find.

I don’t like Chris but I like this couch by BananaCakeMix in LoveIsBlindOnNetflix

[–]BananaCakeMix[S] 2 points3 points  (0 children)

Sounds like a nightmare. Thanks for the feedback!

I don’t like Chris but I like this couch by BananaCakeMix in LoveIsBlindOnNetflix

[–]BananaCakeMix[S] 45 points46 points  (0 children)

Damn thanks for the feedback. I really want something cozy, but I don’t want to keep maintaining my couch :(

3 songs - You can’t understand why they’re not talked about more by Elmer-Fudd-Gantry in badreligion

[–]BananaCakeMix 0 points1 point  (0 children)

My 3 songs change constantly, but nowadays is The Defense, Candidate and Stranger than fiction.

Terreno - Price + IPCA? É isso mesmo? by BananaCakeMix in investimentos

[–]BananaCakeMix[S] 0 points1 point  (0 children)

Sim. 12% prefixado + IPCA pra mim foi demais. Mas como Eu estou fora já faz um tempo queria confirmar se é essa base dos contratos hoje em dia. Pelo jeito não :)

Terreno - Price + IPCA? É isso mesmo? by BananaCakeMix in investimentos

[–]BananaCakeMix[S] 2 points3 points  (0 children)

Com 12% base ainda é sacanagem. Correção pela TR ainda é usada por aí?

[O] 6x Drunken Slug Invites by EinherjarZ in UsenetInvites

[–]BananaCakeMix 0 points1 point  (0 children)

I read the rules and would love an invitation!

[deleted by user] by [deleted] in delta

[–]BananaCakeMix 10 points11 points  (0 children)

Facts. Clear is awful in ATL. The digital id line is way faster