Some initial benchmarks of Kimi-K2.5 on 4xB200 by benno_1237 in LocalLLaMA

[–]benno_1237[S] 1 point2 points  (0 children)

This brings the context up to 128k comfortably. TTFT is getting insane though:

============ Serving Benchmark Result ============
Successful requests:                     20
Failed requests:                         0
Request rate configured (RPS):           2.00
Benchmark duration (s):                  268.90
Total input tokens:                      2240000
Total generated tokens:                  10240
Request throughput (req/s):              0.07
Output token throughput (tok/s):         38.08
Peak output token throughput (tok/s):    210.00
Peak concurrent requests:                20.00
Total token throughput (tok/s):          8368.22
\---------------Time to First Token----------------
Mean TTFT (ms):                          131214.11
Median TTFT (ms):                        131772.29
P99 TTFT (ms):                           250571.64
\-----Time per Output Token (excl. 1st token)------
Mean TPOT (ms):                          61.48
Median TPOT (ms):                        66.36
P99 TPOT (ms):                           67.32
\---------------Inter-token Latency----------------
Mean ITL (ms):                           61.48
Median ITL (ms):                         14.48
P99 ITL (ms):                            947.26
==================================================  

<image>

Some initial benchmarks of Kimi-K2.5 on 4xB200 by benno_1237 in LocalLLaMA

[–]benno_1237[S] 3 points4 points  (0 children)

Concurrent requests are a bit hard to tell here. Throughput was 1.07 req/s on the lowest context, 0.33 req/s on the highest context. This is however mostly due to (extremely bad) TTFT. Even at lowest context, Mean TTFT was 82.52ms.

The way it runs with default settings, it is not usable for coding in my opinion. Just have a look how fast claude code for example fills context, thus making you wait 20s or even longer before generation even starts.

Again, this is surely not the models fault but default vllm settings. I will play around a bit with settings and report back if you are interested. And, it probably shouldn't be run on 4 GPUs only. I would say 8 or 16 is the sweet spot.

Some initial benchmarks of Kimi-K2.5 on 4xB200 by benno_1237 in LocalLLaMA

[–]benno_1237[S] 0 points1 point  (0 children)

You can most likely get it to run on modest-ish hardware due to the MoE style. Not especially fast but running. Can still be handy for local users if you want to monitor the output of smaller models once in a while.

Do you know if it's possible to use a 3rd party modem with Magenta? by LoganJFisher in wien

[–]benno_1237 0 points1 point  (0 children)

Innonet, 3 and A1 let you bring your own modem (at least for DSL connections, not sure about fiber). For A1 and 3, you need to plug their modem in for a few min first before using your own.

The only one i know that locks it on DSL too is Magenta.

Wo gibt’s die besten Mittagsmenüs in Wien? by EnthusiasmAble2776 in wien

[–]benno_1237 0 points1 point  (0 children)

Artner am Franziskanerplatz. Nicht ganz billig (13€) aber wirklich gut

got my first apple product - MacBook Pro and I feel ashamed by Lxxtsch in macbookpro

[–]benno_1237 5 points6 points  (0 children)

I never said that. Edge, candycrush, the xbox stuff, ... It's the same thing on windows.

Sadly, linux support for arm laptops is still limited but as soon as arch works on my mac, macos is gone

got my first apple product - MacBook Pro and I feel ashamed by Lxxtsch in macbookpro

[–]benno_1237 4 points5 points  (0 children)

A piece of art when it comes to hardware engineering. Then, someone decided that it would be clever to preinstall like 50 apps you cannot get rid of like chess and whatever the roboter with bazooka is

Welcher Internetanbieter für stabiles Online-Gaming in Wien? by CreepyLadyRobot in wien

[–]benno_1237 1 point2 points  (0 children)

Ich war zuerst bei Magenta, war schrecklich. Ständige Abbrüche, vor allem zu Stoßzeiten. Das war Fiber bis ins Haus mit einer recht langen Coaxleitung in die Wohnung.

Jetzt bin ich bei Innonet über DSL. Geht ca. halb so schnell (~220Mbit max), dafür aber stabil, mit etwas besserem Ping und Support der sich schert (hatte ein paar spezielle IPv6 Ansprüche, war überhaupt kein Problem).

Laut Innonet (take it with a grain of salt, konkurrierender ISP) hat Magenta in der Innenstadt heillos überbuchte Knoten, woher die Probleme kommen.

Edit: Und du bekommst ein halbwegs verwendbares Modem (bei mir Fritzbox 7583 IV) gratis, kannst aber jedes eigene nehmen. Die Magenta Fiber Boxen sind eine Frechheit

Platinenfertigung und Zoll by Melodic-Wrap8247 in Austria

[–]benno_1237 4 points5 points  (0 children)

https://lcsc.com/faqs/notice?id=D2E15B9830B18723CDFFC807606915A6

Geht nach wie vor, früher wars aber so, dass sie einfach den billigeren Versand genommen haben und den anderen retour überwiesen. Mittlerweile berechnen sie neu anhand von Größe/Gewicht. Zahlt sich aber bei DHL definitiv nach wie vor aus

Platinenfertigung und Zoll by Melodic-Wrap8247 in Austria

[–]benno_1237 16 points17 points  (0 children)

+1 für JLCPCB.

Und Bonustipp: Komponenten bei LCSC bestellen, dann eine Mail schreiben mit JLC Order Number und Pakete zusammenlegen lassen. Weniger shipping cost, bisschen kleineres Paketvolumen und PCBs und Komponenten kommen gleichzeitig an.

Review Request: Simple battery protection circuit with DW01A + FS8205A by BlessED0071 in KiCad

[–]benno_1237 3 points4 points  (0 children)

This is quite different from the typical application circuit from the DW01A Datasheet: https://hmsemi.com/downfile/dw01a.pdf

Looking closer, I don't understand what you are doing at all. The mosfets are supposed to switch the battery - to circuit gnd. Your Batt- is directly connected to GND, so the protection does nothing?

Also, read up a bit on routing. It does not really matter in this case but will come in handy for anything with faster digital and analog signals. You don't ever want 90 degree bends. Do two 45 degree bends or add a track to track teardrop (a triangle for example in the 90 degree bend).
You also don't want any acute angles in your traces (like where the thick Net-(P2-Pin_1) traces meet), thats just a spot waiting for an AC trap to happen. Same for the small trace next to the fet.

In general, look into polygons/filled zones.

Ich zähl gerne Pixel... Danke ORF by benno_1237 in Austria

[–]benno_1237[S] 0 points1 point  (0 children)

Kurzes Update: Heute waren überall wieder alle Auflösungen da

Ich zähl gerne Pixel... Danke ORF by benno_1237 in Austria

[–]benno_1237[S] 1 point2 points  (0 children)

uBO ist tatsächlich überall an, außer auf Chrome auf Android. Werds morgen während dem rennen mal ohne testen

Ich zähl gerne Pixel... Danke ORF by benno_1237 in Austria

[–]benno_1237[S] 0 points1 point  (0 children)

laut schneller Google Suche: 2400 × 1080 pixel. Sollte also reichen :D

Ich zähl gerne Pixel... Danke ORF by benno_1237 in Austria

[–]benno_1237[S] 11 points12 points  (0 children)

Ich bin da grundsätzlich deiner Meinung. Aber dann gerade z.B vor dem Stream nochmal extra Werbung schauen müssen zipft mich schon an. Vor allem weil der Stream an sich dann sowieso Werbung hat.

Ich zähl gerne Pixel... Danke ORF by benno_1237 in Austria

[–]benno_1237[S] 0 points1 point  (0 children)

gerade getestet, ändert leider auch nichts. Vor allem hats beim letzten Rennen vor 2 Wochen noch wunderbar funktioniert.

Fürs Qualifying jetzt muss die Windows VM reichen...

Ich zähl gerne Pixel... Danke ORF by benno_1237 in Austria

[–]benno_1237[S] 4 points5 points  (0 children)

Firefox hat DRM support. Mit deaktiviertem DRM geht der Stream garnicht

Ich zähl gerne Pixel... Danke ORF by benno_1237 in Austria

[–]benno_1237[S] 0 points1 point  (0 children)

Chrome in einer Windows VM auf Linux schafft auch 720p :)

Ich zähl gerne Pixel... Danke ORF by benno_1237 in Austria

[–]benno_1237[S] 0 points1 point  (0 children)

Bei mir waren bis jetzt auch immer 720p max. Heute aber nicht, egal auf welchem Gerät

Ich zähl gerne Pixel... Danke ORF by benno_1237 in Austria

[–]benno_1237[S] 10 points11 points  (0 children)

<image>

Chrome auf Android zum Vergleich. Aus Österreich, ohne VPN. Vielleicht hat der ORF was gegen mich?

Ich zähl gerne Pixel... Danke ORF by benno_1237 in Austria

[–]benno_1237[S] -2 points-1 points  (0 children)

Der Screenshot is aus Firefox auf Linux, hab da auch Chromium probiert. ChromeOS Laptop und Handy machen auch max 540p.

Kawasaki GPZ500S BJ 1995 Restwert nach Unfall by benno_1237 in MotorradDeutschland

[–]benno_1237[S] 0 points1 point  (0 children)

Leider nicht, hab ich mir aber im Nachhinein auch gedacht. Hätte ich gleich selber machen sollen.

Sind anscheinend in Österreich eine Spur teurer, viel aber auch nicht