MusicGenerator

Sleeping

App Files Files Community

Surn commited on Jun 18, 2023

Commit

d7ef5a5

1 Parent(s): 1a6de5e

First Audio Fade version

Browse files

-fades audio segments together

Files changed (2) hide show

app.py +15 -1
audiocraft/data/audio_utils.py +26 -0

app.py CHANGED Viewed

@@ -15,6 +15,7 @@ import time
 import warnings
 from audiocraft.models import MusicGen
 from audiocraft.data.audio import audio_write
 from audiocraft.utils.extend import generate_music_segments, add_settings_to_image, INTERRUPTING
 import numpy as np
 import random
@@ -162,7 +163,20 @@ def predict(model, text, melody, duration, dimension, topk, topp, temperature, c
             output = output_segments[0]
             for i in range(1, len(output_segments)):
                 overlap_samples = overlap * MODEL.sample_rate
-                output = torch.cat([output[:, :, :-overlap_samples], output_segments[i]], dim=dimension)
             output = output.detach().cpu().float()[0]
         except Exception as e:
             print(f"Error combining segments: {e}. Using the first segment only.")

 import warnings
 from audiocraft.models import MusicGen
 from audiocraft.data.audio import audio_write
+from audiocraft.data.audio_utils import apply_fade
 from audiocraft.utils.extend import generate_music_segments, add_settings_to_image, INTERRUPTING
 import numpy as np
 import random
             output = output_segments[0]
             for i in range(1, len(output_segments)):
                 overlap_samples = overlap * MODEL.sample_rate
+                #stack tracks and fade out/in
+                overlapping_output_fadeout = output[:, :, -overlap_samples:]
+                overlapping_output_fadeout = apply_fade(overlapping_output_fadeout,sample_rate=MODEL.sample_rate,duration=overlap,out=True,start=True, curve_end=0.9, current_device=MODEL.device)
+                overlapping_output_fadein = output_segments[i][:, :, :overlap_samples]
+                overlapping_output_fadein = apply_fade(overlapping_output_fadein,sample_rate=MODEL.sample_rate,duration=overlap,out=False,start=False, curve_start=0.1, current_device=MODEL.device)
+                overlapping_output = (overlapping_output_fadeout + overlapping_output_fadein) / 2
+                print(f" overlap size Fade:{overlapping_output.size()}\n output: {output.size()}\n segment: {output_segments[i].size()}")
+                ##overlapping_output = torch.cat([output[:, :, -overlap_samples:], output_segments[i][:, :, :overlap_samples]], dim=1) #stack tracks
+                ##print(f" overlap size stack:{overlapping_output.size()}\n output: {output.size()}\n segment: {output_segments[i].size()}")
+                #overlapping_output = torch.cat([output[:, :, -overlap_samples:], output_segments[i][:, :, :overlap_samples]], dim=2) #stack tracks
+                #print(f" overlap size cat:{overlapping_output.size()}\n output: {output.size()}\n segment: {output_segments[i].size()}")
+                output = torch.cat([output[:, :, :-overlap_samples], overlapping_output, output_segments[i][:, :, overlap_samples:]], dim=dimension)
             output = output.detach().cpu().float()[0]
         except Exception as e:
             print(f"Error combining segments: {e}. Using the first segment only.")

audiocraft/data/audio_utils.py CHANGED Viewed

@@ -172,3 +172,29 @@ def i16_pcm(wav: torch.Tensor) -> torch.Tensor:
     else:
         assert wav.dtype == torch.int16
         return wav

     else:
         assert wav.dtype == torch.int16
         return wav
+def apply_fade(audio: torch.Tensor, sample_rate, duration=3.0, out=True, start=True, curve_start:float=0.0, curve_end:float=1.0, current_device:str="cpu") -> torch.Tensor:
+    fade_samples = int(sample_rate * duration)  # Number of samples for the fade duration
+    fade_curve = torch.linspace(curve_start, curve_end, fade_samples, device=current_device)  # Generate linear fade curve
+    if out:
+        fade_curve = fade_curve.flip(0)  # Reverse the fade curve for fade out
+    # Select the portion of the audio to apply the fade
+    if start:
+        audio_fade_section = audio[:, :fade_samples]
+    else:
+        audio_fade_section = audio[:, -fade_samples:]
+    # Apply the fade curve to the audio section
+    audio_faded = audio.clone()
+    audio_faded[:, :fade_samples] *= fade_curve.unsqueeze(0)
+    audio_faded[:, -fade_samples:] *= fade_curve.unsqueeze(0)
+    # Replace the selected portion of the audio with the faded section
+    if start:
+        audio_faded[:, :fade_samples] = audio_fade_section
+    else:
+        audio_faded[:, -fade_samples:] = audio_fade_section
+    return audio_faded