@rms już teraz jesteśmy.
Zresztą właśnie to jest ciekawe, że ta losowość znika wraz z progresem w rozwoju sieci neuronowych. Z biegiem czasu myślę, że wiele branż podzieli się na artystów, którzy tworzą "prawdziwą" muzykę, tych, którzy nauczą się używać sieci, jak wirtuozi i stworzą coś, czego nie dałoby się zrobić normalnie i tych, lub samo AI, które zastąpi kolesi od muzyki taśmowej i kompilacji na YouTube.
Jak bawisz się w sample, to Suno czasem rozumie instrukcje w []. Ilość instrukcji jest ograniczona, bo interpreter to niskiej jakości LLM, ale podstawowe rzeczy ogarnie. Ja głównie wrzucam własne teksty i nie wiem jak by to wyszło bez nich, ale mniej-wiecej wygląda to tak:
[Verse 1 Instrukcja (np. Male voice)]
Text
[Verse 2 Female Voice]
Text
[Bridge Duet]
Text
Max dwie instrukcje w takim nawiasie, choć V2 często je zgubi. Jedna daje praktycznie gwarancję na wykonanie. (Wszystko w polu tekstu zaawansowanego)
W polu styl masz miejsce na dwie krótkie instrukcje (np. post-apocalyptic rock, aggressive) możesz wrzucić 4, ale są one wtedy interpretowane losowo, a nie razem, czyli algorytm wybierze dwa losowe, pasujące do tekstu.