Transformatie van audiobewerking met ons nieuwe SAM-audiomodel

Vandaag introduceren we SAM Audio, een geavanceerd AI-model waarmee geluid kan worden gesegmenteerd. Stel je voor dat je een video van je favoriete band opneemt en met slechts één klik de gitaar of zang isoleert, tekstuele instructies gebruikt om verkeersgeluiden uit een buitenopname te filteren, of het geluid van een blaffende hond uit je volledige podcast verwijdert. SAM Audio, de nieuwste toevoeging aan onze Segment Anything-collectie, verandert de manier waarop audioverwerking wordt gedaan door het gemakkelijk te maken om elk geluid uit complexe audiomixen te isoleren met behulp van tekstuele, visuele en time-lapse-instructies.

Deze intuïtieve benadering weerspiegelt hoe mensen natuurlijk met geluid omgaan, waardoor professionele audio-isolatie toegankelijker en eenvoudiger wordt dan ooit tevoren. SAM Audio heeft het potentieel om de audio- en videobewerkingsindustrie te transformeren en innovatie te stimuleren op gebieden zoals muziek, podcasting, televisie, film, wetenschappelijk onderzoek, toegankelijkheid en meer.

Tot nu toe was audiosegmentatie en -bewerking een gefragmenteerde ruimte, met verschillende tools ontworpen voor specifieke gebruiksscenario’s. Als uniform model is SAM Audio de eerste die gebruiksscenario’s ondersteunt die in lijn zijn met hoe mensen van nature over audio denken, en baanbrekende prestaties levert in diverse praktijkscenario’s. SAM Audio ondersteunt drie soorten aanwijzingen:

  • Tekst suggestie: Typ ‘blaffende hond’ of ‘stem zingen’ om specifieke geluiden te extraheren.

  • Visuele aanwijzingen: Klik op de persoon of het object in de video dat geluid maakt om de audio te isoleren.

  • Intervalverzoek: Met deze methode, een primeur in de sector, kunt u tijdsegmenten markeren waar de doelaudio voorkomt.

Deze aanwijzingen kunnen individueel of in combinatie worden gebruikt, waardoor u nauwkeurige en intuïtieve controle heeft over hoe audio wordt gescheiden. We zien talloze potentiële gebruiksscenario’s, waaronder geluidsisolatie, geluidsfiltering en meer, om mensen te helpen hun creatieve visies tot leven te brengen, en we gebruiken SAM Audio al om te helpen bij het ontwikkelen van de volgende generatie creatieve multimediatools.

Je kunt SAM Audio uitproberen in de Segment Anything Playground, ons nieuwe platform waarmee iedereen onze nieuwste modellen kan testen. Vanaf vandaag kunnen gebruikers kiezen uit onze verzameling audio- en video-items of hun eigen bestanden uploaden om de functies van SAM Audio te verkennen. Het sjabloon is ook beschikbaar om te downloaden.

We zijn verheugd om audio toe te voegen aan de Segment Anything-modelcollectie en zijn ervan overtuigd dat SAM Audio het beste allround audioscheidingsmodel is dat beschikbaar is. Lees meer over SAM Audio en probeer vandaag nog Segment Anything.



BRON

Paul Arends

Paul Arends

“Ik ben Paul Arends, afgestudeerd in Bedrijfskunde aan de Universidad Complutense en met een master in Personeelsmanagement en Organisatieontwikkeling aan ESIC. Ik ben geïnteresseerd in netwerken en social media en richt mijn professionele ontwikkeling op talentmanagement en organisatieverandering.”

Verwante vermeldingen

Hoe Meta-datacenters bijdragen aan energie, werkgelegenheid, milieu en gemeenschappen in de VS

Meta’s AI-geoptimaliseerde datacenters en infrastructuur vertegenwoordigen een investering in de toekomst van de Amerikaanse economie. De Amerikaanse AI creëert banen voor geschoolde werknemers, verhoogt de productiviteit, helpt bedrijven groeien en…

Metasubsidies bevorderen innovatie in lokale datacenter communities

We streven ernaar een positieve impact te hebben en te investeren in de vitaliteit op de lange termijn van de gemeenschappen waarin we datacenters exploiteren. Eén manier waarop we dit…

Geef een reactie

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *

Ben je verdwaald?

Niets Phone 4a Pro: vlaggenschipfuncties en helderder scherm voor $ 499

Niets Phone 4a Pro: vlaggenschipfuncties en helderder scherm voor $ 499

Over-ear-koptelefoon van Nothing’s New lost storingen vijf dagen op

Over-ear-koptelefoon van Nothing’s New lost storingen vijf dagen op

Apple Music kan AI-inhoud taggen bij keuze van distributeurs

Apple Music kan AI-inhoud taggen bij keuze van distributeurs

Anthropic in gesprek met ministerie van Defensie

Anthropic in gesprek met ministerie van Defensie

Oura neemt DoublePoint, gebarennavigatie-startup, over.

Oura neemt DoublePoint, gebarennavigatie-startup, over.

Lancering ‘volwassen modus’ OpenAI verder uitgesteld

Lancering ‘volwassen modus’ OpenAI verder uitgesteld