Meta səs emalı sahəsində yeni tədqiqat modelini təqdim edib.
“Segment Anything Model Audio” (SAM Audio) adlanan bu süni intellekt modeli mürəkkəb audio fayllarından istənilən səsi ayırmağa imkan verir. Model istifadəçiyə bir neçə fərqli idarəetmə üsulu təqdim edir: konkret səsi mətnlə təsvir etmək, videoda səsin gəldiyi nöqtəyə klikləmək və ya zaman xəttində qısa bir interval seçmək kifayət edir.
SAM Audio-nun əsas yeniliyi ondadır ki, o, ayrı-ayrı alətlərə ehtiyac olmadan nitqi, musiqini və gündəlik ətraf səslərini eyni model daxilində emal edə bilir. Ənənəvi audio redaktə sistemlərində bu cür tapşırıqlar üçün adətən fərqli modellər və ya xüsusi alətlərdən istifadə olunurdu. Meta-nın təqdim etdiyi yanaşma isə vahid model üzərindən daha çevik və dəqiq səs ayrılması imkanı yaradır.
Model vizual mənbələrlə də işləyə bilir. Məsələn, video üzərində müəyyən obyektə klikləməklə həmin obyektə aid səs avtomatik seçilir və ayrılır. Bu xüsusiyyət səs montajı, post-prodakşn, media arxivlərinin təmizlənməsi və kontent analizi kimi sahələrdə praktiki istifadəyə yönəlib. Zaman aralığı əsasında seçim imkanı isə uzun audio fayllarda konkret epizodların sürətlə ayrılmasını asanlaşdırır.
Meta SAM Audio-nu tədqiqat yönümlü layihə kimi açıq şəkildə təqdim edib. Şirkət modeli, onun performansını ölçən benchmark nəticələrini və açıq qiymətləndirmə üçün nəzərdə tutulmuş məlumat dəstini də paylaşıb. Bu addım tədqiqatçıların və tərtibatçıların modeli inkişaf etdirməsinə, yeni tətbiqlər qurmasına və mövcud səs texnologiyaları ilə müqayisə aparmasına şərait yaradır.
Meta-nın açıqlamasına görə, SAM Audio gələcəkdə avtomatik video montajı, səs-küyün azaldılması, media axtarışı və yaradıcı alətlər kimi müxtəlif istiqamətlərdə istifadə oluna bilər. Şirkət bu model vasitəsilə audio sahəsində “segmentasiya” anlayışını daha universal və əlçatan etməyi hədəflədiyini bildirir.



