Meta’dan Ses Dünyasını Sarsacak Hamle SAM Audio Duyuruldu İndir Demo Yap Sesleri Tek Tek Ayır

Meta Yapay Zeka Araştırmaları tarafından 2025’te tanıtılan SAM Audio modeli, sesleri yalnızca filtrelemekle kalmıyor, anlam temelli olarak ayırıyor. Açık kaynak olarak indirilebilen model ve tarayıcıdan anında denenebilen demo, müzikten videoya pek çok alanda yeni bir dönemin kapısını aralıyor.

Aralık 22, 2025 - 23:54

Meta’dan Ses Dünyasını Sarsacak Hamle SAM Audio Duyuruldu İndir Demo Yap Sesleri Tek Tek Ayır

Meta Yapay Zeka Araştırmaları, ses işleme teknolojilerinde dikkat çeken bir yenilik olarak SAM Audio modelini kamuoyuna sundu. Model, geleneksel gürültü azaltma ve frekans tabanlı araçlardan farklı olarak, sesin ne olduğunu kavramaya odaklanıyor ve hedef sesi diğerlerinden ayırabiliyor.

Açık Kaynak Model İndirilebilir Durumda
SAM Audio’nun model kodları ve çalıştırılabilir sürümü, Meta’nın resmi GitHub hesabı üzerinden açık kaynak olarak paylaşıldı. Kullanıcılar, modeli kendi bilgisayarlarında çalıştırarak farklı ses senaryolarını test edebiliyor. Modelin indirilebildiği resmi bağlantı şu şekilde paylaşıldı:
https://github.com/facebookresearch/sam-audio

Kurulum Gerektirmeyen Online Demo
Meta, SAM Audio’yu denemek isteyen kullanıcılar için çevrim içi bir demo da yayınladı. Tarayıcı üzerinden erişilebilen bu demo sayesinde, herhangi bir yazılım kurulumu yapmadan ses ayırma işlemleri gerçekleştirilebiliyor. Online test bağlantısı Meta tarafından şu adresten erişime açıldı:
https://aidemos.meta.com/segment-anything/editor/segment-audio

Sesleri Nesne Gibi Ayıran Yeni Yaklaşım
SAM Audio, sesleri tıpkı görsellerde nesne seçimi yapılır gibi ele alıyor. Model, bir ses kaydındaki hedef sesi başlangıç ve bitiş noktalarıyla tespit ederek ayırıyor. Çıktılar genellikle target ve residual olmak üzere iki parçadan oluşuyor.

Metin, Görsel ve Zaman Aralığıyla İstem
Model; “vokali al”, “arka plandaki sireni çıkar” gibi metin tabanlı istemleri, video üzerinde nesne işaretlemeye dayalı görsel istemleri ve belirli zaman aralıklarının seçildiği istemleri destekliyor. Bu yapı, müzik prodüksiyonu ve video düzenleme süreçlerinde esnek kullanım sağlıyor.

Vokal Ayrımı Neden Sözleri Otomatik Vermiyor
Uzmanlar, vokalin izole edilmesinin sözlerin otomatik olarak anlaşılması anlamına gelmediğini belirtiyor. Şarkı söyleme tarzı, efekt kullanımı, miks tercihleri ve aksan farklılıkları, transkripsiyon sürecini zorlaştıran unsurlar arasında yer alıyor. Bu nedenle SAM Audio’nun, konuşma tanıma ve metne dönüştürme modelleriyle birlikte kullanılması gerektiği vurgulanıyor.

Medya ve İçerik Üretiminde Yeni Alanlar
SAM Audio’nun; video içeriklerinde konuşma ayrımı, müzikte hızlı stem çıkarma, belirli ses olaylarının tespiti ve otomatik içerik analizi gibi alanlarda yaygınlaşması bekleniyor. Meta, modelin geliştiriciler ve içerik üreticiler tarafından farklı senaryolarda kullanılmasını hedefliyor.

Ajans Expres Gazetesi