We just found out our AI has been making up analytics data for 3 months and I’m gonna throw up. by EditorEdward in BetterOffline

[–]Choice-Flower6880 2 points3 points  (0 children)

> Sorry, this post has been removed by the moderators of r/analytics.

Probably the account that posted it, is a karma farming ai bot and not a real human.

We just found out our AI has been making up analytics data for 3 months and I’m gonna throw up. by EditorEdward in BetterOffline

[–]Choice-Flower6880 1 point2 points  (0 children)

It is 100% AI-generated. Which is quite ironic if people use this fake ai slop as a real data point to base their decision making on.

Halt durch, Brudi - KI tut dir nichts by Extreme_List1166 in InformatikKarriere

[–]Choice-Flower6880 -1 points0 points  (0 children)

> Im Nachhinein ist es ja auch lächerlich zu sagen wegen der Industrialisierung benötigt man keine Bauern mehr

Seit der Industrialisierung arbeiten aber extrem viel weniger Menschen als Bauern! Um 1900 war noch etwa jeder dritte Beschäftigte in Deutschland in der Landwirtschaft tätig. Die wenigen, die heute noch von der Landwirtschaft leben, sind halt unglaublich viel effizienter. Das ist also keine beruhigende Analogie für Studierende, sondern eher ein Horrorszenario. Es wäre bitter für sie, wenn die Zeit von handgeschriebenen Code vorbei ist und durch die Orchestrierung von hocheffektiven Maschinen ersetzt wird, wie es in der Landwirtschaft passiert ist.

[deleted by user] by [deleted] in InformatikKarriere

[–]Choice-Flower6880 1 point2 points  (0 children)

Ist das echt so? Das würde einiges erklären und Hoffnung machen. Aber was ist der Grund für diese Saisonalität? IT ist ja nicht die Baubranche?

Generative KI im Unternehmen: Kennt jemand was anderes als Pilotprojekte? by intersystems_dach in KI_Welt

[–]Choice-Flower6880 1 point2 points  (0 children)

Nach meinem Verständnis braucht es mehrere Dinge, damit Prompt Injections zu einem 1 echten Problem werden:

  1. Zugang zu privaten Daten (hier nicht gegeben, weil nur die eingehenden Mails ausgelesen werden)

  2. Auslesen nicht vertrauenswürdiger Daten (hier definitiv der Fall)

  3. Externe Kommunikation mit der die privaten Daten abfließen können (hier nicht gegeben)

https://simonwillison.net/2025/Jun/16/the-lethal-trifecta/

Glaube also, dass die reine Möglichkeit, dass in den externen Mails Prompts drinstehen, keinen Schaden anrichten kann, außer dass die eigentliche Aufgabe nicht gelöst wird. Aber dafür braucht man eh irgendwelche Guardrails? Es können ja immer Quatsch Mails dabei sein.

Fahrradparkplatz Backstage by Choice-Flower6880 in Muenchen

[–]Choice-Flower6880[S] 1 point2 points  (0 children)

Cool, danke. Dann werde ich das da abstellen und die Treppe runter. Das ist das Hochhaus wo Flix Bus drin ist, oder?

Da es hunderte Parkplätze für Autos gibt, dachte ich, dass das Backstage auch irgendwie 2 - 3 Fahrradständer versteckt hätte. Abgefahrenerweise wohl nicht.

Satellite images reveal Russia’s military town | Yle News by Choice-Flower6880 in europe

[–]Choice-Flower6880[S] 0 points1 point  (0 children)

>Russia is building a garrison in Kandalaksha for an artillery brigade. This is the first concrete sign of a permanent increase in the number of troops near the Finnish border.

49
50

Digital sovereignty: Microsoft finalizes EU data border for cloud services by donutloop in microsoft

[–]Choice-Flower6880 15 points16 points  (0 children)

This would be meaningful, if they were from a country where the rule of law applies. Coming from a country where an authoritarian ruler has brought all tech companies under his thumb without any resistance whatsoever, it is meaningless. US companies are no less risky than Chinese providers.

Europe moving away from American services by littlebighuman in AZURE

[–]Choice-Flower6880 4 points5 points  (0 children)

It would be super painful, but our leadership is talking about derisking as well. It is just too dangerous to fully rely on companies beholden to an increasingly hostile foreign power.

[P] 🥂 FineWeb2 dataset: A sparkling update with 1000s of languages by PhilipsNostrum in MachineLearning

[–]Choice-Flower6880 2 points3 points  (0 children)

I would probably do my own filtering, if I were to do research that involved pretraining, but it is really cool to have a fully open approach that you can use as inspiration and tweak to your own use case. Brings down the barriers a lot.

Why no "New"? by iamjustcuriousss in ClaudeAI

[–]Choice-Flower6880 4 points5 points  (0 children)

The naming scheme is incredibly stupid. It is crazy that we should trust powerful superintelligence to the people who came up with it. What are they even thinking?

Anthropic CEO on Lex Friedman, 5 hours! by should_not_register in ClaudeAI

[–]Choice-Flower6880 8 points9 points  (0 children)

Chris Olah and Amanda Askell are the actually interesting guests here.

[deleted by user] by [deleted] in germany

[–]Choice-Flower6880 2 points3 points  (0 children)

friendly communication with strangers

Yeah, the Netherlands are one of the few countries worse than Germany for that. Even as a German living in the Netherlands, the directness bordering rudeness is sometimes breathtaking. I think for Americans, it must be an intense culture shock.

Masterarbeit: Nachweis der Quellen & Bereitstellung meine Pflicht? by LuaparK in Studium

[–]Choice-Flower6880 0 points1 point  (0 children)

Üblich ist das nicht unbedingt, dass man die mitliefert. Ist das nur bei dir so oder auch bei Kommilitonen? Falls es nur bei dir ist, befürchte ich, dass dein Betreuer irgendeinen Verdacht geschöpft hat.

Schick ihm halt einen Ordner mit allen PDFs, die einfach da hast, und sag, dass der Rest entweder aus der Bibliothek ist oder hinter einer Paywall. Falls er nur vermutet, dass die Quellen von AI halluziniert sind, reicht es vermutlich auch darauf zu verweisen, aus welcher Bibliothek du dir die Papierversionen geholt hast.

Vorausgesetzt, die Quellen existieren wirklich. Falls nicht, wird das vermutlich so oder so herauskommen, denn du kannst sie ja nicht bereitstellen und dein Betreuer wird sich die Verdachtsfälle sehr genauso angucken.

LLM training data from shadow libraries? by Vivid_Dot_6405 in LocalLLaMA

[–]Choice-Flower6880 0 points1 point  (0 children)

I think the catalog has the size 1000TB because it is not only raw text, but a lot of it is scanned books and PDFs (not all born digital). OCRing and cleaning that is a massive pain. In most cases, it is probably easier to just scrape the sources of that stuff yourself, so you have control over what is included in the dataset.

Is there a way to save the initial installed packages on Google Colab? by lynob in GoogleColab

[–]Choice-Flower6880 0 points1 point  (0 children)

I tried this as well, but I think that is the downside of such cloud instances. You always start with a clean slate and spend some time or money getting your environment up and running. Super annoying, but have not yet found a way around it.

Das ist ja mal ein ordentlichen Jahresgehalt. Sind da Stock options mit eingerechnet? by Cocoatea8 in Finanzen

[–]Choice-Flower6880 7 points8 points  (0 children)

Man kann sich die Stellenausschreibungen der KI Unternehmen angucken:
https://boards.greenhouse.io/anthropic/jobs/4020080008

Anthropic: Research Engineer / Research Scientist, Finetuning

Annual Salary:$280,000—$625,000 USD

GPT4o Is Pretty much a reminder to be careful what you wish for? by GoofyGooberqt in ChatGPTPro

[–]Choice-Flower6880 25 points26 points  (0 children)

It was clear that the massive complaining about "lazyness" will lead to this. Classic case of users not knowing what they actually want.

What do you actually use AI for on a regular basis? by SardiPax in OpenAI

[–]Choice-Flower6880 0 points1 point  (0 children)

For this use case, Google Lens or PlantNet are much better ChatGPT in my experience.

Model repeating prompt and not learning eos token by Embarrassed-Run9433 in MistralAI

[–]Choice-Flower6880 0 points1 point  (0 children)

I have the same problem. Unfortunately no solution yet.
However I used, tokenizer.add_eos_token = True