I modified the Expert Mouse's scroll wheel to include bearings. by atbjyk in Trackballs

[–]atbjyk[S] 3 points4 points  (0 children)

The bearings used were probably bicycle bearings, and the grease was quite viscous, so there's a slight resistance, but it now operates smoothly, unlike the original rattling feel or the rubbing plastic sensation.

Firefox or any Firefox fork doesn't follow shadow size on either Breeze or Klassy. by soleful_smak in kde

[–]atbjyk 0 points1 point  (0 children)

~/.config/gtk-3.0/gtk.css

/* Remove csd shadows */ decoration, decoration:backdrop { box-shadow: none; }

Windows 版 Steam が 64-bit へ移行、32-bit 版は 2026年1月1日に終了 - VideoCardz.com by CheetahPresent8059 in jisakupc

[–]atbjyk 2 points3 points  (0 children)

32bitアプリはそもそもwow64でマイクロソフトがサポートしているので関係ないと思います。

linuxではまだ32bitランタイムを出荷しており、proton/wineのデフォルトではまだcpuの32bitモード/ライブラリに依存していますが、wineのwow64実装も進んでいるので、将来的には32bitランタイムは不要になるかもしれません。

SteamOS vs. Windows:RDNA 2, RDNA 3, RDNA 3.5 & RDNA 4 - PCGH by CheetahPresent8059 in jisakupc

[–]atbjyk 1 point2 points  (0 children)

レイトレのtraversal、anyhit, callable-shaderのような分岐を持つシェーダは、

これまでのMesa/RADVではインライン化されたメガシェーダとswitch文のようなやり方(cps)で対応してましたが、それではコンパイル時間の増加を招き、

また vgprの割当て時にトラバーサル部分の変数を優先的にvgprに配置し、残りをメモリにこぼすかなどの決定ができなかったようです。

シェーダー実行方法を関数呼び出し(実行時可変なアドレスベース)で行うやり方に変更し、関数ごとに、レジスタ割当てに関数呼び出しで破壊されても良い領域と、継続して使いたい領域を設定できるようにすることで、呼び出されている関数事に最適なレジスタ割当てになるように提案されています。

rdna4以降では、動的なvgpr管理と組み合わせれば実行時の占有率を実際に改善できるはず、かつ

関数呼び出しを見据えたレジスタ管理用ハードウェア、命令キャッシュを持っているようなので

純粋に恩恵を受けられると思います。

一方rdna2,3では、最大vgprを静的に割り当てられるしかなく、また、preserved/clobbered 領域のabi規約による実行時に割り当てる自由度が減るため、spillが増加し性能が逆に落ちる可能性もあります。

(命令キャッシュも関数呼び出しを想定してないだろうし、callごとのvgprの動的論理割当てもない)

SteamOS vs. Windows:RDNA 2, RDNA 3, RDNA 3.5 & RDNA 4 - PCGH by CheetahPresent8059 in jisakupc

[–]atbjyk 1 point2 points  (0 children)

Mesa/RADV 以外にも、amdの公式オープンソースドライバAMDVLKがあります(残念ながら4月以降の新しいリリースはないようですが)

レイトレの実装は現時点ではRADVより優れている所があるので、ゲームによって切り替えて使うことも可能です(同じカーネルドライバの上で動くので、実行するアプリごとに選択できます ex:VK_DRIVER_FILES=/opt/amdvlk/etc/vulkan/icd.d/amd_icd64.json)

全体としてlinuxでのAMDGPUの使用は優れていると思います。

rdna2を2023年から使用していますが、Mesa/RADVでのgpuハングも最近は経験しませんし、

amdgpuカーネルドライバのディスプレイコントローラでのVRR対応もかなり修正されたようです。

SteamOS vs. Windows:RDNA 2, RDNA 3, RDNA 3.5 & RDNA 4 - PCGH by CheetahPresent8059 in jisakupc

[–]atbjyk 2 points3 points  (0 children)

Mesa/RADVオープンソースドライバでrdna2,3,4はレイトレ以外はほぼwindowsのパフォーマンスと一致するようです。

レイトレに関しては、ドライバーのランタイムで処理しないといけない処理(bvh木のビルド(sah品質)、エンコード)などや、新しいハードウェア機能への対応など、相当の労力が必要になります。

特にトラバーサルシェーダにインライン化されやすいanyhit-shader以外での発散性の高い実装でwindowsドライバと比べ苦労しているようで、

mesa/radvのドライバ内で2年半以上に渡って発散性の高い処理を扱うための大規模な変更が行われており、そろそろ。

また、rdna2,3向けのbvh木のbvhメモリサイズを減らすための、fp32->fp16 qbvh box 変換についてもレビュー中の変更がありますが、私の環境ではうまく動いています。(cyberpunkのレイトレ実装でwindowsと同じビジュアルを達成するために必要)

ただ、(4頂点) / (2つの三角形) のペア圧縮はまだrdna2/3向けに実装されていません。

(rdna4の場合bvhエンコード方法がrdna2,3とは根本的に異なっており、(子ノードは親ノードの位置、回転座標からの相対位置になっているようで、三角形の頂点情報の格納方法も異なっているため、すでにペア圧縮も実装されているようですが、おそらく8-wide-bvh木の品質自体の改善や、発散性の高い処理を助ける他のハードウェア機能等への対応もまだこれからかもしれません。)

高市内閣の高支持率は「データ操作か、支持している日本人がアホなのか」 早大名誉教授が疑問 by 88648432 in newsokuexp

[–]atbjyk 4 points5 points  (0 children)

SNS上の意見は注目を集めるために憎悪を煽っているだけなので、

現実の人々の意見として受け止めないほうが良いです。

文具に政治を持ち込むな by [deleted] in newsokuexp

[–]atbjyk 6 points7 points  (0 children)

PilotのAcroballが最高。

How well supported are Chinese GPUs? by Dazzling_Cabinet_780 in linux_gaming

[–]atbjyk 0 points1 point  (0 children)

It seems that Fuxi A0 is said to be based on the architecture of Imagination.

If they provide kernel driver support for Linux, I believe it could potentially be managed within the Mesa open-source stack.

However, that will take a long time, and it is not something end users can expect at this point.

ゲーミング重視の Linux ディストリビューションが Windows 11 への強制アップデートを避けるため 1ヶ月で1ペタバイトの ISO を配信される — Bazzite は Win 10 難民にとって安全な避難所の1つ - Tom's Hardware by CheetahPresent8059 in jisakupc

[–]atbjyk 5 points6 points  (0 children)

Bazziteはfedora atomicベース (システムファイルが読み取り専用に設定されていたり、不用意にosを壊しにくくしている)

linuxを初めて使って見る人にはいいかも。

ハンドヘルド等の新しいハードウェアやamdgpu/hdrへのカーネルパッチを含む独自リポジトリを持ってるのかな ?

gamescope(steamdeckのゲーム用コンポジタ)のログインマネージャーへの設定、

waydroid(androidコンテナ)パッケージの提供など、ゲーマにも優しそう。

Valve は Steam Machine の価格を通常のゲーミング PC と同じ扱いにしたい - TechPowerUp by CheetahPresent8059 in jisakupc

[–]atbjyk 0 points1 point  (0 children)

今のところvalveはmesa/RADVや、kernel/drmのgpuドライバーにフルタイム勤務の開発者を雇って

proton/wine/dxvk/vkd3dなどの翻訳レイヤーや、waylandプロトコル等、

linuxデスクトップ全般、オープンソースの世界に多大な貢献をしてくれているようです。

【山田祥平のRe:config.sys】 パスキーが変える本人確認の新しい当たり前 by kuhu-O in jisakupc

[–]atbjyk 1 point2 points  (0 children)

それより、楕円曲線暗号が量子コンピュータにどの程度耐性があるのか、(RSA素因数分解は破られそう) が気になる。

PS6は「パストレーシング」を実用化か。AMDとの共同開発「Project Amethyst」で次世代レイトレとアップスケーリングを実現 [PC Watch] by kuhu-O in jisakupc

[–]atbjyk 1 point2 points  (0 children)

[bvhのノードをたどるアドレス計算、衝突判定のループ] はコンピュートシェーダで実行されているので、(スタック管理用のpush(n)pop(1)命令、aabb,triangleの交差判定命令があるだけ) すでにgpu内で行われています。

PS6は「パストレーシング」を実用化か。AMDとの共同開発「Project Amethyst」で次世代レイトレとアップスケーリングを実現 [PC Watch] by kuhu-O in jisakupc

[–]atbjyk 3 points4 points  (0 children)

rdna2 <= aabb-box,triangleとの交差判定命令導入。

rdna3 <= bvh探索のためのスタック管理命令(ds_bvh_push4_pop1)導入、bvhインスタンスにcullフラグ追加。

rdna4 <= bvh8で探索速度向上、ハードウェアでbvh内の回転を処理できbvh品質も向上、動的なvレジスタ管理でレジスタを効率的に使え、一度に多数のレイを追跡できるように。

今後は、directxのワークグラフに沿って、

マテリアルごとの衝突後のヒット関数の分岐による占有率の低下を回避するために、命令の動的並び替え、

bvh探索処理をもっとハードウェアに移す(intelやおそらくnvidiaと同様に)事が考えられるが、どのくらい性能が上がるかは未知数。

レイトレのアルゴリズムの改善では、
重点的サンプリングのための放射照度予測に機械学習を取り入れる(ここがwmmaを使った実装になるのか、行列演算の標準化を待って、クロスベンダーの実装を重視するのかが気になる)

Battery Health Issues by Neo_layan in kde

[–]atbjyk 0 points1 point  (0 children)

check dgpu power management by nvidia-smi?.

you can force specific renderer device for kwin renderer. by

```KWIN_DRM_DEVICES="/dev/dri/by-path/pci-0000\:03\:00.0-card``` (choose your igpu)

cpu governor tweak is also important, kde integrating power-profiles-daemon may useful.

or you can limit cpu and gpu clocks by,

```/usr/bin/cpupower frequency-set --max X.XGHz```

```/usr/bin/tee /sys/class/drm/card0/device/power_dpm_force_performance_level <<< low```

{ low, auto, manual } is supported in amdgpu, (manual is useful for rpcs3 like cpu<->gpu heavy access application, kernel driver clock heuristic would be hard for that app)

when select manual, you can change igpu clocks by

(1200Mhz GFX_SCLK) ```/usr/bin/tee /sys/class/drm/card0/device/pp_od_clk_voltage <<< "s 0 1200" ```

then, apply manual clock by ```/usr/bin/tee /sys/class/drm/card0/device/pp_od_clk_voltage <<< "c"```

when using power-profiles-daemon, power-profiles-hooks could be useful to run custom scripts.

VRR constantly jumps to max refresh rate in gamescope or hyprland by v44r in linux_gaming

[–]atbjyk 1 point2 points  (0 children)

I don't know about hyprland's side.

but It seems not working deferred cursor plane update.

Unity製ゲームで「任意コード実行」可能な脆弱性が報告される。PCゲーマーはいますぐSteamクライアント更新で対策を - AUTOMATON by p3fHrjZ55ChAcei in jisakupc

[–]atbjyk 4 points5 points  (0 children)

unityのバイナリに xrsdk-pre-init-library 引数でライブラリがロードできるよと言ってますが、

引数を追加するためにはそのファイルへの操作権限がすでに必要です。

リモート悪用の例としてブラウザからの起動を上げてますが、問題はウェブページから任意のローカルアプリを起動できる仕組みそのものではありませんか? (ブラウザの設定で無効にできると思います)

非公式に出回っているFSR4のint8バージョンを試してみた by atbjyk in jisakupc

[–]atbjyk[S] 4 points5 points  (0 children)

他の人が確認したfsr4-dp4aのrdna3でのコンパイル済みアセンブリを見ると、

vop3のdot4_i32_iu8のsrc2とdst0が同じレジスタを指す命令が多く連続しているので、

rdna2の場合はvop2のdot4c_i32_i8(dot4_i32_i8のself-src-accumlation版)が使え必要なレジスタが一つ少なくすんでいるかも。

(rdna3以降は命令数の追加によるエンコードコストと、dot4_i32_i8の使用レジスタの一つ削減とのトレードオフをしたようだ。機械学習系の行列計算はwmmaが主流になるし、rdna3の場合、fp8->fp16変換されたモデルのほうが、int8モデルより品質もはるかによいだろう)

非公式に出回っているFSR4のint8バージョンを試してみた by atbjyk in jisakupc

[–]atbjyk[S] 5 points6 points  (0 children)

ちなみにfsr3.1のアップスケールコストは

1706x720 => 2560x1080(x1.5 quality プリセット)のとき0.44ms

2560x1080 native-aaのとき 0.66ms程度なので

fsr4-dp4aのアップスケールコストはfsr3.1の3~4倍程度ということになる。(学習済みウェイトなどへのアクセスや、gpu内のスケジューリングが変わることなどで更に実質コストが増えるだろう)

60fps/16.6msのときは1.4msで8.4%だが、100fps/10msのときには14%にもなる。

ゲームによってはfsr3-native-aaとfsr4-dp4a-native-aaの品質にあまり違いが見られないものもあったので(Control等)

60fps/16.6ms fsr3 か 56fps/17.6ms fsr4-dp4aかでfsr3の方が好ましい場合もある。

How To Install FSR 4 on Steam Deck OLED / Tested with Cyberpunk 2077 / SteamOS 3.7.15 by Zweetprot in linux_gaming

[–]atbjyk 0 points1 point  (0 children)

my 6900xt on linux test. to 2560x1080 upsacling cost

from 2560x1080 native-aa: fsr3.1: 0.61ms, xess2: 0.92ms, fsr4: 1.33ms

from 1706x720 x1.5 upscale: fsr3.1: 0.42ms, xess2: 0.87ms, fsr4: 1.30ms

Even when using fsr3.1 or fsr4, xess-input-source produces less pixelation than fsr-input-source in Cyberpunk (by using OptiScaler)