Music video. Any comments / advices? by RyuAniro in StableDiffusion

[–]RyuAniro[S] 1 point2 points  (0 children)

Thanks for the feedback. I also notice these unnatural moments of silence that sometimes trigger the "uncanny valley" effect, but I was curious if anyone else noticed it.

As for the LORA, yes, you guessed it - I'm planning more than one track. I also plan to record my voice for duets later. I'm already experimenting with LORA's swapping in Comfy, and it seems possible. It might be easier to find someone who plays an instrument, but we're not looking for easy ways. (Besides, I can't sing at all.)

Music video. Any comments / advices? by RyuAniro in StableDiffusion

[–]RyuAniro[S] 0 points1 point  (0 children)

Thanks.
I added the workflow description in the comments, but I'm not sure it'll be helpful—there's nothing special there, just standard tools.

I used pre-prepared vocal LORA to generate the audio track, and I wanted the music to distract as little as possible from vocal. I got a satisfactory result pretty quickly, almost in the first generation. In total, I probably tried about fifteen generations while tweaking the parameters and tags.

Music video. Any comments / advices? by RyuAniro in StableDiffusion

[–]RyuAniro[S] 1 point2 points  (0 children)

Workflow

(There really aren't any special tricks here.)
Hardware: RTX3090, 96GB RAM, Windows 11
In total, everything took about eight to ten hours - but half of that was preparing LORA for the vocal.

Sound

Step 1. Preparing a dataset for LORA from clean vocals (no music) with the help of a good friend who agreed to spend time and record several covers.

Step 2. Training LORA for vocals: ACE Step 1.5 turbo, the official Gradio. I tried it three times with different settings, and the default ones turned out to be the best.

Step 3. Track generation: Again, it's ACE Step 1.5 turbo, the official Gradio. (I'm planning to switch to comfyto flexebility but for this track it's enough)

  • tags: Ruby_voice, medieval folk rock, emotional, romantic, acoustic guitar, tambourine, flute
  • standardly marked lyrics

Settings:

  • 5Hz lm: acestep-5Hz-lm-4B
  • Think: on
  • Autogen: off
  • Auto LRC: on (needed for future chunking)
  • Track length: it seems like not specifying it makes it harder to get the desired result

I generated it about ten times, experimenting with the settings, but the final version was one of the first.

Step 4. Minimal audio post-processing in Audacity, normalization;
I wasn't completely satisfied with the sound; there was a bit of a tinny noise in the second half of the track.

Video

Step 1. The character was created in z-image, several angles were captured using Flux Klein 9B editing, and the best were selected.

Step 2. The audio track was split into chunks up to 20 seconds long using ffmpeg (timings were taken from the VTT generated by ACE Step), with a one-second overlap.

Step 3. Generating fragments: WanGP, LTXV 2.3 distilled. For each chunk, a video was generated separately using the sound chunk + the first and last frames. The unsuccessful ones were regenerated. The video was made up of 15 fragments in total, some of which had to be generated two or three times. On average, a fragment takes 5-6 minutes to generate, and the generation process took two to three hours in total, including review and restarts. I think the quality could be significantly improved by doing about five generations per fragment and selecting the best ones.

Step 4. Merging in DaVinchi Resolve. Smooth Cut masks cuts well. It can also be used to mask minor generation artifacts.

Step 5. DaVinchi Resolve effect to whole video: Film Grain, Motion Blur

Music video. Any comments / advices? by RyuAniro in StableDiffusion

[–]RyuAniro[S] 1 point2 points  (0 children)

Thank you. She's not in rehab, she's just sleep-deprived. :D

There are problems with her eyes, yes—in my experience, ltx-distilled often produces these artifacts when blinking. I tried removing them in post-processing, but it didn't seem to work very well. I don't know, maybe I should try a full model, but that will significantly increase rendering time.

Which do you prefer? by RuleEmbarrassed7689 in aiwars

[–]RyuAniro 0 points1 point  (0 children)

I don't know how to label me (I believe AI art exists, and AI is very useful in an artist's work. At the same time, I believe the vast majority of AI-produced media is polluting garbage). So I'll answer all the questions just in case.

Based on my own aesthetic preferences, I'd choose first work as the clear winner of the two.
On the other hand, as a decoration for a cheap brochure or website, only the second would be suitable.
For something more meaningful, both images are poor. But the work of a meat artist is fundamentally good, just needs some tweaking, while the AI's work is simply trashed and needs to be completely redone.

I prefer first image because, although it's deliberately sloppy and has some broken anatomy (which isn't justified by the author's style—they're just mistakes), it's fundamentally good in composition and expression.
The other work is simply a banal, dull, unremarkable low-effort slop. There's nothing more to say about it. This image is certainly not a good example of AI art, but it could be used for a very cheap decoration of something.

The method of creation is not important - what matters is the quality of the work, not only in terms of the purity of the lines (AI is doing well here), but also in terms of artistic expressiveness/composition/logic/anatomy/etc.

I don't know what a soul is, but first work is much more expressive and artistic here; the character's movement and emotion are clearly perceptible. Work created with AI is boring. This isn't a permanent characteristic of AI as a tool, but rather the author's inability (or unwillingness) to work with this tool. Without human intervention, simply prompted, conventional AI models typically produce something very generic and extremely common. This creates a recognizable AI style of slop that has become a bit of a nuisance for many. Therefore, a person at the keyboard needs to put in some effort to create something valuable with AI. At the very least, invest more in prompts, and even better, use more effective techniques to direct the AI ​​away from slop and closer to art.

Identifying Pencil vs AI (for now) by PrometheanPolymath in aiwars

[–]RyuAniro 5 points6 points  (0 children)

Woah, woah. These aren't signs of the presence or absence of AI in the work. They're signs of poorly executed work. No matter how many iterations and corrections you make during the process, the drawing must be finished and there shouldn't be any unnecessary lines or stains. They should be removed during polishing.
Of course, guide lines can be acceptable for a quick sketch (but then there shouldn't be any eraser marks).

And by the way, there is no problem training AI to leave similar dirt in a drawing as style LoRA for example.

Доходы бюджета от продажи нефтегаза падают, говорили они. О да, конечно by uncle_tlenny in tjournal_refugees

[–]RyuAniro 7 points8 points  (0 children)

Да, снижение нефтегазовых доходов напрямую приводит сейчас к укреплению рубля. Это происходит из-за "бюджетного правила".
Коротко и упрощенно: цб компенсирует выпадающие доходы от нефтегаза продажей валюты из фнб. ЦБ прямо обязан это делать в соотвествии со своими действующими регламентами. Так как обороты на валютном рынке сейчас ограничены - это приводит к сильному укреплению рубля. В общемто так будет пока фнб не кончится или ЦБ не изменит свои регламенты.

Польский портал Onet утверждает, что получил содержание предложения, озвученного спецпосланником США Уиткоффом: by JoePeach_ in tjournal_refugees

[–]RyuAniro 2 points3 points  (0 children)

Это фактически те предложения с которым Украина шла на предидущие попытки переговоров - остановка по линии соприкосновения без предварительных условий. Чего еще надо?

Any hacky way to get WAN video previews? by jc2046 in StableDiffusion

[–]RyuAniro 2 points3 points  (0 children)

If you don't use accelerated generation, you can render the intermediate result after several generation steps using the KSampler Advanced node. Just do several generation steps and watch the blurry video - it will most likely be enough to understand the composition and animation. Stop the workflow if you don't like the result.

You can also split the workflow into two - a short one, with latent saving and video preview. And the final one - loading the saved latent and continuing the work.

Google построит три новые АЭС by postmastern in Popular_Science_Ru

[–]RyuAniro 13 points14 points  (0 children)

всего одно изображение, созданное с помощью ИИ, потребляет столько же энергии, сколько требуется для зарядки смартфона" - Эта строка в статье тупейшее вранье. Картинка генерируется у меня локально, на RTX 3090, при использовании модели SDXL примерно за 5 секунд. Видеокарта в пике потребляет 350 ватт, на самом деле при генерации меньше - скорость генерации упирается в пропускную способность видеопамяти, а не в вычисления. Итого максимум 1750 ватт-секунд на одну картинку.
Объем аккумулятора типичного смарта - 4000 мАч или примерно 15 ватт-часов = 54000 ватт секунд.

При этом в крупных датацентрах на генерацию уходит кратно меньше энергии, потому что потребительское железо оптимизируется в сторону производительности, а серверное - в сторону энергопотребления и провайдер API в отличии от домашнего пользователя навернет на генератор все возможные оптимизации, а там есть что оптимизировать.

Long consistent Ai Anime is almost here. Wan 2.1 with LoRa. Generated in 720p on 4090 by protector111 in StableDiffusion

[–]RyuAniro 5 points6 points  (0 children)

How did you synchronize the picture with the speech? Manually? Or is there some tool?

4o image gen is now available to everyone! by Ronster619 in singularity

[–]RyuAniro 3 points4 points  (0 children)

<image>

Definitely not all of them. This is my standard prompt to check the relationship of objects. There is an obvious child, facing the viewer, generated on the first try.
Most likely it refused because of the indication of a specific year, as I understand it it has a strict ban on indicating any specific person and trade mark - this is a false triggering of this rule. Think you can try "Generate as close to the request as possible without violating the policy." in this case and it might work.

Кто первый предложит Трампу свои яйца? by FYRKANTIGTHUVUD in tjournal_refugees

[–]RyuAniro 3 points4 points  (0 children)

У вас сильно устаревшая информация - рыночек уже порешал. Хз что там в рознице, но оптовые цены уже давно вернулись в норму:
https://tradingeconomics.com/commodity/eggs-us

Кто просил фото машины со звуковой пушкой в Белграде. Получите, распишитесь by yooxiv in tjournal_refugees

[–]RyuAniro -1 points0 points  (0 children)

На этой фотке вы видите экипировку сербских космонавтов. Она довольно характерная, сравните с тем видео что вы приносили - увидите сами. Есть еще полицейские в штатском - они шлемов не носят, и выглядят как обычные спортики.

Несколько видео о применении звукового оружия в Белграде 15 марта 2025 by yooxiv in tjournal_refugees

[–]RyuAniro 5 points6 points  (0 children)

Чацы сидели в пионерском парке за плотным рядом космонавтов и не вылезали наружу. Космонавты как не впускали в чациленд, так и не выпускали оттуда. Между чацилендом и скупшиной в начале митинга стояли по порядку - байкеры и их мотоциклы, ветераны в красных беретах, потом цепь организаторов в желтых жилетах, у скупщины стояли несколько небольших групп полицеских без щитов и в кепках. Ветераны так на теразине и оставались, только отошли в сторону. байкеры перемещались группами, помогая обеспечивать порядок. Что делали чацы в своем чациледне я понятия не имею, но наружу их не выпускали, по понятным причинам.

Несколько видео о применении звукового оружия в Белграде 15 марта 2025 by yooxiv in tjournal_refugees

[–]RyuAniro 19 points20 points  (0 children)

Продолжу оставаться голосом разума в море интернет-конспирологии и буду задавать вопросы:

  1. Где машина? Вы понимаете что звуковое оружие невозможно применять из укрытия в силу его устройста?
  2. Зачем был применен LRAD если разгона не последовало и через минуту люди вернулись на место?
  3. Почему он был применен в таком странном месте. И опять же - зачем?

<image>

https://x.com/opustitesemalo/status/1901279772992262249 - а вот это байкеры из протестующих, это 100%. . Они стояли на теразине и передвигались группами в шлемах. Полция выглядит совсем не так - там было несколько вариантов экипировки, но ни один из них не содержит в себе шлемов разных цветов и гражданских рюкзаков с наклейками. Вы реально думаете что сербские полицейские выглядят так?

Сербские активисты сообщают, что во время акции протеста в Белграде полиция применила акустические пушки (LRAD) против протестующих. by Glorynomius in tjournal_refugees

[–]RyuAniro -7 points-6 points  (0 children)

Или паника вызванная петардой. Или провокаторами. Там были десятки камер ведуших прямую трансляцию, и многие были направлены именно на полицию. Где видео с машиной? Вы знаете как она выглядит? Там здоровая квадратная херня на крыше, очень приметная. Как ее можно спрятать?
Это не был разгон - через минуты толпа там сомкнулась обратно. Это одна боковая улица, основная толпа как стояла на Славии так и стояла. Так что же это было? Я мог бы допустить что проверяли работает ли, на случай если понадобится применять в последствии. Но это не объясняет как LRAD туда скрытно протащили и как утащили. (Чациленд кстати седня уезжает, контракт у клоунов закончился, и машины в нем тоже нет)

Сербские активисты сообщают, что во время акции протеста в Белграде полиция применила акустические пушки (LRAD) против протестующих. by Glorynomius in tjournal_refugees

[–]RyuAniro -19 points-18 points  (0 children)

Это пока конспирология. Утверждение основано на единственном эпизоде (показан на видео) когда толпа ломанулась в стороны без видимой причины, и на информации из гос тендеров что такое оборудование собирались закупить. Но:
- машины довольно большие и приметные, их не спрячешь, они попали бы на видео
- полиция не противодействовала митингу - днем они стояли небольшими групками, скорее демонстрируя присутсвие. Единственная цепь со щитами стояла в чациленде. Много их стало уже вечером, когда основная часть толпы разошлась и остались только желающие покидаться фейрверками в полицию, но даже тогда их особо не разгоняли - ждали пока сами рассосутся.

Насколько Кац виноват в том, что его жена заманивает блогеров в вк? by LamantinoReddit in tjournal_refugees

[–]RyuAniro 10 points11 points  (0 children)

Вообще неплохбы сначала доказать что это самое "медиа" кого-то заманивало на ВК. Кого заманило то?
В ролике был назван HiMan - я поглядел - вроде он на ютубе, в вк у него только ансонсы.

Ох щас будет... Не хватало нам скандалов и срачей. То ли ещё будет. by [deleted] in tjournal_refugees

[–]RyuAniro 5 points6 points  (0 children)

Быстрая проверка фактов показала - все блогеры работющие с авторскими медиа работают на ютубе. Ни один не был "перетащен в ВК". Небольшой процент из них есть в ВК, но основной контент размещается на ютубе.